最近のオーストラリアのデータセンターの障害がビジネスに及ぼす影響

最近のオーストラリアのデータセンターの障害がビジネスに及ぼす影響

最近シドニーで発生したデータセンターの障害は、バンク・オブ・クイーンズランドやジェットスターを含む複数のクラウドサービスプロバイダーや企業に影響を与えました。今回の事故やその他のインシデントを受けて、クラウド利用者は、自分たちにも同じことが起こる可能性があるのか​​、そして実際に起こる前にどのように被害を軽減できるのか、疑問に思うかもしれません。

物理データセンターのリスクは管理できますか?

TechRepublic は、オーストラリアおよびニュージーランドの AWS のソリューション アーキテクチャ担当ディレクターの Nam Je Cho 氏と、データ センター プロバイダーの Equinix Australia のマネージング ディレクターである Guy Danskine 氏に話を聞いた。両氏は、この地域におけるクラウド導入を目の当たりにする立場にある。

Cho 氏と Danskine 氏は、地理的多様性の受け入れ、組み込み冗長性の確保、データセンター管理のベストプラクティスの追求、ハイブリッド マルチクラウド インフラストラクチャのリスクとメリットの考慮など、さまざまな戦略を推奨しています。

ジャンプ先:

  • オーストラリアのデータセンターの停止は、依然としてリスクが残っていることを示している
  • クラウドへの信頼は依然としてクラウドインフラの拡大を推進している
  • プロバイダーはデータセンターのリスクを軽減するためにクラウドを設計している
  • クラウドの復元力を最大限に高めるために顧客は何ができるでしょうか?
  • 顧客の俊敏性と回復力を維持するためのクラウドの未来

オーストラリアのデータセンターの停止は、依然としてリスクが残っていることを示している

2023年8月、オーストラリアの組織はクラウドコンピューティングのリスクが存在することを改めて認識しました。シドニーのデータセンターから18マイル離れた電気インフラへの落雷により公共電圧が低下し、施設の冷却システムチラーユニットの一部がオフラインになりました。

シドニーのデータセンターの障害によりAzure、Oracle、NetSuiteが被害を受ける

影響を受けたクラウドサービスプロバイダーであるMicrosoft Azureが事後報告書で報告しているように、技術者が問題の解決に取り組んでいる間に、データセンター内の温度が運用閾値を超えるレベルまで上昇しました。その後、温度を下げてハードウェアの損傷を防ぐため、コンピューティングおよびストレージスケールユニットの一部の電源を切る必要がありました。

このインシデントはクラウド顧客に影響を及ぼし、UTC(協定世界時)10時30分頃から始まり、UTC(協定世界時)22時40分まで続きました。この間、バンク・オブ・クイーンズランドの顧客は銀行アプリに不具合を経験し、銀行取引が顧客口座に正しく反映されませんでした。一方、ジェットスターの顧客はログイン、予約管理、フライトのチェックインに支障をきたしました。

参照: オーストラリアとニュージーランドの企業もクラウド戦略の最適化を迫られています

影響を受けたのはAzureだけではありませんでした。Azureは共有データセンターであったため、Oracle CloudとNetSuiteのサービスも障害の影響を受けました。

2021年にメルボルンで発生したGoogleのような障害により、レジリエンスへの注目が高まる

地元のクラウド顧客は、他にもデータセンターの障害を懸念しています。2021年にメルボルンに新しいリージョンが開設されてからわずか1か月ほど後、オーストラリア南東部2のGoogle Cloudサービスは、一時的な電圧の問題により1時間30分にわたって停止しました。

Googleは当時のインシデントに関する声明で、「問題の根本原因は、ネットワーク機器への給電線における過渡的な電圧変動であり、機器の再起動を引き起こしました。この問題を軽減するため、オーストラリア南東部2リージョン内のトラフィックは一時的にリダイレクトされました」と述べています。

Forrester 社の最近のオーストラリアとニュージーランドのクラウドの現状レポートでは、今回の障害のようなインシデントや環境の不確実性により、組織はリスク軽減戦略の見直しを検討するようになっていると示唆されています。

「世界的なパンデミック、メルボルンでのGoogleの障害などの2021年のクラウド障害、オーストラリアの火災や洪水、ニュージーランドの地震により、企業はレジリエンスを優先している」とフォレスターは報告している。

フォレスターは、リスク軽減策には「リスク認識の向上、優先度の高いワークロードに対する複数のAZ(アベイラビリティゾーン)の活用、マルチクラウドのスキルセットによるサプライヤーリスクの軽減、潜在的リスクに対するシナリオ構築」が含まれる可能性があると述べています。

クラウドへの信頼は依然としてデータセンターの拡大を推進している

AWSは、オーストラリアとニュージーランドの数十万の企業にサービスを提供しています。その中には、Atlassian、NAB、オーストラリア統計局や西オーストラリア州教育省などの公共機関が含まれます。Equinixも同様に、医療、金融サービス、政府機関など、重要な業界のお客様から信頼を得ています。

このレベルの顧客には、中断なく 24 時間体制でクラウド サービスが提供される必要があります。

エクイニクス・オーストラリアのダンスキン氏は、企業はデータセンターとクラウドがビジネスを支える上で基盤的な役割を果たしていることを理解していると述べた。さらに、クラウド技術とインフラの拡張性、信頼性、そしてコスト効率こそが、ますますデジタル化が進む経済において企業が効果的に事業を運営する上で不可欠だと付け加えた。

エクイニクス・オーストラリアのマネージング・ディレクター、ガイ・ダンスキン氏。
エクイニクス・オーストラリアのマネージング・ディレクター、ガイ・ダンスキン氏。

「堅牢なデジタルインフラは不可欠です」とダンスキン氏は述べた。「組織はユーザー、顧客、従業員を繋ぎ、データセキュリティを強化し、変化する市場の需要に適応できるようになります。」

この需要がエクイニクスの成長を牽引しています。同社はアジア太平洋地域に51のデータセンターを保有しており、そのうち18はオーストラリアのシドニー、メルボルン、ブリスベン、キャンベラ、パース、アデレードにあります。

同社はまた、オーストラリア、インド、日本、韓国に新しいデータセンターを建設し、インドネシアとマレーシアの施設を拡張する13のプロジェクトに10億オーストラリアドル(6億4500万米ドル)以上を投資している。

「当社は、現在および将来の要件に最大限対応できるよう、顧客と市場の需要に合わせて拡大する適切な機会を常に模索しています」とダンスキン氏は述べた。

一方、AWSは2023年から2027年にかけてオーストラリア全土のインフラに132億オーストラリアドル(84億4000万米ドル)を投資し、オークランドに3つのアベイラビリティゾーンを持つ新しいリージョンを構築している。

AWSやEquinixのような投資は、オーストラレーシアにおけるパブリッククラウド利用の新たなスケールを支えています。Forresterはこれを「パブリッククラウド利用の新たな規模」と呼んでいます。現在クラウドへの移行を進めている組織は、今後2年以内にワークロードの平均46%がクラウドに移行すると予想しています。

デジタル変革が引き続き最優先事項となっているため、企業はイノベーションを促進し、高いレベルの可用性をサポートし、「データ主導の世界における成長を促進する」ために必要なインフラストラクチャの提供をデータセンターとクラウドに信頼している、とダンスキン氏は述べた。

プロバイダーはデータセンターのリスクを軽減するためにクラウドを設計している

ダンスキン氏は、高い信頼度にもかかわらず、市場にリスクがないわけではないと述べた。

「パンデミック後、多くの組織は現場のスタッフを減らして運営しているため、自動化されたリモート監視と予防保守を行っていても、システム障害が発生する可能性が高まっています」とダンスキン氏は述べた。

このリスクに対抗する 1 つの方法は、組織が電源の冗長性を確保して、システム障害の影響を軽減することです。

参照: このリスク管理ポリシーは、組織の回復力をサポートするのに役立ちます。

「エクイニクスでは、世界中のデータセンターのお客様に、完全に冗長化された電気・機械インフラを標準で提供しています」とダンスキン氏は述べた。

AWSはダウンタイムのリスクを軽減するためにアベイラビリティゾーンに重点を置いています

リスク軽減は、クラウドおよびデータセンタープロバイダーにとって中心的な設計機能です。例えば、AWSは他のクラウドプロバイダーと同様に、すべてのリージョン内で複数のアベイラビリティゾーンを提供しています。つまり、アプリケーションを複数の地域に分割することが可能です。

AWS オーストラリアおよびニュージーランドのソリューションアーキテクチャディレクター、Nam Je Cho 氏。
AWS オーストラリアおよびニュージーランドのソリューション アーキテクチャ担当ディレクター、ナム ジェ チョ氏

AWSのチョー氏は、「AZは物理的に数キロメートルという重要な距離で隔てられていますが、すべてが100キロメートル(60マイル)以内の距離にあります」と述べた。「各AZは独立した電源、冷却装置、物理的なセキュリティを備え、冗長化された超低遅延ネットワークで接続されています。」

「アプリケーションが AZ に分割されている場合、企業は停電や自然災害などの問題からより適切に分離され、保護されます。」

Amazon Relational Database Service や Amazon Elastic Kubernetes Service などのマルチ AZ マネージドサービスでは、顧客がどの AZ にデプロイするかを選択できます。

「単一のAZでインフラに障害が発生した場合、2つ目のAZへの自動フェイルオーバーと、必要に応じてフェイルバックが管理され、サービス中断はほとんど、あるいは全く発生しません」とチョー氏は述べています。「お客様は、高可用性を実現するために、マルチAZやマルチリージョンアーキテクチャでワークロードを展開し、ミッションクリティカルなワークロードを実行しています。」

エクイニクスはデータセンター管理の継続的な改善を目指している

エクイニクスは、データセンターの運用の整合性と安全性を向上させる方法を継続的に模索しています(図A)。例えば、重要なメンテナンスは、常に少なくとも2名の資格を持つエンジニアが立ち会い、互いの作業を二重チェックしながら実施しています。

図A

シドニーにあるエクイニクスのSY5データセンター。
シドニーにあるエクイニクスのSY5データセンター。画像:エクイニクス

顧客が同社のソフトウェア定義相互接続プラットフォームであるEquinix Fabricを使用してクラウド、SaaS、ネットワークプロバイダーに接続する場合、同社は常に2つの物理ポートを構成することを推奨しているとDanskine氏は述べた。

「企業は、Platform Equinix上の数千ものグローバルエンドポイントや自社ITインフラに接続する際に、これらのソリューションを活用することで、さらなる耐障害性を確保できます」とダンスキン氏は述べています。「企業は、ニーズに合った相互接続された事業継続性と災害復旧シナリオを構築できます。」

クラウドの復元力を最大限に高めるために企業は何ができるでしょうか?

クラウドとデータセンターの稼働率はほぼ100%です。Equinixは世界250カ所のデータセンターで99.9999%以上の稼働率を誇り、AWSは99.999%の可用性を実現しています。しかし、プロバイダーの稼働率に頼る以外にも、データセンターの停止リスクを軽減する方法はあります。

地理的多様性を活用する

地理的多様性は、現代のクラウドサービスの基本的な設計機能であり、すべての重要なインフラストラクチャにおいて重要視されるべきです。AWSリージョン内で提供される複数のアベイラビリティゾーンと同様に、地理的リスクの分散は、複数のデータセンター、複数のクラウドリージョンへのアプリケーションのマッピング、あるいはコンテナを介したワークロードのデプロイなどによって実現されます。

ネットワークの冗長性を求める

冗長化されたネットワークは、サービス中断時でも完全な運用をサポートし、運用中のメンテナンスを可能にします。Equinix社は、企業は個々のネットワークコンポーネントの冗長性が相互に補完し、全体的な設計を補完することを確実にする必要があると述べています。そうすることで、万が一サービス停止が発生した場合でも、復旧作業が進行中に最小限の影響しか及ぼさないようになります。

定期的な計画とテストを確実に実施する

エクイニクスは定期的なテストが不可欠だと主張しています。同社は2週間ごとに重要なシステムを最大負荷でテストし、年に1回は「ダークサイトテスト」を実施しています。ダークサイトテストでは、バックアップシステムが確実に稼働し、期待通りに動作することを確認するために、サイトの主電源を意図的に切断します。フォレスターはまた、クラウド戦略におけるリスクと継続性の要素を再検討することを推奨しています。

ハイブリッドマルチクラウド戦略を採用する

イノベーション、コスト効率、レジリエンスといったメリットを実現するため、クラウドに依存しないデジタルインフラストラクチャを導入する組織が増えています。複数のクラウドとクラウドに隣接するオンプレミス環境を組み合わせることで、セキュリティと事業継続性に関する重要なメリットが得られ、組織のレジリエンス(回復力)を高めることができます。

参照:マルチクラウドハイブリッド クラウドについて知っておくべきすべてのことをご確認ください

マネージドサービスを活用する

AWSは、組織がマルチAZの特性を自ら設計する必要なく、リージョン内およびリージョンをまたいで運用できるマネージドサービスを多数提供しています。AWSがデフォルトでこの処理を行っているため、特定のAZ内で問題が発生した場合でも、共有責任モデルの一環としてお客様に代わって対応いたします。

顧客の俊敏性と回復力を維持するためのクラウドの未来

最近のデータセンターの障害は、クラウド戦略の進展を遅らせるものではありません。ダンスキン氏は、ハイブリッド・マルチクラウドは汎用性の高いインフラ戦略であるため、多くの企業にとって最適なアーキテクチャになりつつあると主張しています。また、第5回Nutanix Enterprise Cloud Indexによると、オーストラリアの回答者は、このモデルの利用率が2026年までに5倍以上増加し、43%に達すると予想しています。

「このアプローチにより、パブリッククラウドとプライベートクラウドを柔軟に選択できるようになり、パフォーマンスとコスト効率が最適化されます」とダンスキン氏は述べた。「また、冗長性と災害復旧機能によってレジリエンス(回復力)が向上し、ホスト国の規制要件への準拠が可能になり、データのセキュリティと主権が確保されます。」

AWSのナム・ジェ・チョ氏は、この地域が「クラウドへの地殻変動の真っ只中にあることは間違いありません。お客様がクラウドに移行し、イノベーションを進めている最大の理由は、顧客体験を変革できる俊敏性とスピードにあります」と述べています。

Tagged: