Azureの障害情報を即確認する方法は?Twitter、Azureの状態、Service Health!

オンプレからクラウドへのシステム移行が続く昨今、

Azure環境の利用も増えているのではないでしょうか。

けれど最近はAzure関連の障害が影響していると思われるシステム影響が頻発しているようにも思えます。

AD認証がうまくいかなかったり、IaaSサーバへアクセスできなかったり、遅かったり…

タカヒロ
タカヒロ
2021年2月26日に東日本リージョンで起きた大規模障害は復旧まで時間がかりましたね。
システム担当者は本当に大変だったと思います…

そんなAzureが利用できないときに困ることは、

・Azureの稼働状態を確認する方法は?
・障害によりMicrosoft365に影響がある場合、対応状況をリアルタイムに確認する方法は?

ではないでしょうか。

今回はそんなお悩みを解決する、
Azureの障害情報を即確認する方法
をご紹介します。



Azureの過去の障害は?

MicrosoftAzureの障害は月に2~3回ペースでしょうか。

ネットワーク、認証系の障害が多いように見受けられます。

どれも大規模障害につながりそうなインシデントですので、
しっかりキャッチアップしておきたいですね。
■2021年の障害発生日
2021/2/26
障害概要:2021年2月26日の03:29UTCから10:02UTCの間に、東日本リージョンAzureStorageのサービスの低下と遅延あり。ダウンストリームの影響が発生している可能性あり。
原因:使用率の増加が観察され、運用上のしきい値を超えてしまいパフォーマンスが低下した。
緩和策:サービスに影響を及ぼしているリソースを解放。
対応:根本原因調査中。対応策検討中。

タカヒロ
タカヒロ
ストレージリソースに遅延ありということですが、
こちらではサーバが起動できず、のっているシステムが根こそぎダウンです…
サーバ再起動してもだめでしたが、ストレージ アカウントを変更するとなんとか起動できたので、
ワークアラウンドの一つとして覚えておいた方がよいかもしれません。

2021/2/16
2021/2/12
2021/1/15

■2020年の障害発生日
2020/12/14
2020/10/7  東日本リージョン影響あり ネットワーク制御関連のコードの欠陥で遅延。
2020/10/6  東日本リージョン影響あり バックエンドへのトラフィックのルーティング構成不備で遅延。たぶん人為的ミス。
2020/9/28
2020/9/18
2020/9/14
2020/9/3
2020/8/21
2020/8/14
2020/7/18  東日本リージョン影響あり AzureDNSの問題で一部名前解決できず。サーバぶっ飛んだと思って茫然とした。AD認証効かず。
2020/7/7  東日本リージョン影響あり サーバ勝手に再起動。バグ修正プログラムにバグが混入していた模様。パッチ当てで手当。

タカヒロ
タカヒロ
忘れたころに障害が発生する印象を受けますので注意したいですよね・・・

重要なのは、サービスに影響する障害が発生したら、しっかり検知して、

対応状況を把握するということでしょう。

特に、情報システム部門は頑張らなければいけないところですね。

タカヒロ
タカヒロ
情シス向けに障害報告をワンクリックで作成できるツールを用意しました。
よろしければこちらもご覧ください。

【VBA】Excelテンプレートから障害・復旧メールをワンクリックで送る方法



Azure障害情報のキャッチアップの方法は?

Microsoftの公式Twitterをフォローする

「‎@AzureSupport」というMicrosoftの公式Twitterに一番早く障害情報が公開されるので、

このTwitterをしっかりフォローしましょう。

フォロイーは個人のアカウントではなく、会社のメーリングリストを使い

複数人で障害情報をキャッチアップできるようにした方がよいかもしれません。

監視席を設けているようであれば設定しても良いと思います。



「Azureの状態」を確認する

「Azure の状態」からリージョンごとの稼働状態を確認することができます。

Microsoft Azure の状態
https://status.azure.com/ja-jp/status

画面右上にある「状態の履歴および根本原因分析 (RCA)」から

過去に発生した障害履歴を閲覧することができます。

ただし直近90日分しか載っていませんし、小規模の障害は省略されている模様です。

リアルタイムに取得したい場合は画面右上の

「RSS」から情報を取得した方がよいでしょう。



「Service Health」を確認する

Azureポータルの「Service Health」から障害発生状況を確認することができます。

Service Health は、ユーザーが使用しているリージョン内のAzure サービスの正常性を追跡するダッシュボードです。

障害などサービスの問題以外に、

将来的に影響を及ぼす可能性がある、定期的なメンテナンスの情報や、

セキュリティに関する勧告も公開されていますので、

Azureの運用の運用担当者は必ず把握しておきたいところですね。



downdetector.comを確認する

外部サービスですが、各社のサービス稼働状況と障害発生状況をまとめているサイトがありますので、
こちらを確認しても良いでしょう。

トップ:
https://downdetector.com/

Microsoft Azure:
https://downdetector.jp/shougai/windows-azure/

タカヒロ
タカヒロ
通知サービスもあるようですので、導入を検討されてみてはいかがでしょうか。



さいごに

いかがでしょうか。

今回は、
Azureの障害情報を即確認する方法
をご紹介しました。

サービスを利用する側としてはなす術がない状況ですが、

しっかりとキャッチアップして、いざという時に備えておきたいですね。

最後までお読みいただきありがとうございました。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です