Splunkのレポートによると、ダウンタイムによる大企業の損失は年間4000億ドルに上る

Splunkのレポートによると、ダウンタイムによる大企業の損失は年間4000億ドルに上る

新たな報告書によると、計画外のダウンタイムによって世界有数の企業は年間4,000億ドル、つまり利益の約9%の損失を被っている。これは、システム障害やサービス低下の1分あたり約9,000ドルの損失に相当します。

データ管理プラットフォームSplunkが発表した報告書では、フォーブス・グローバル2000企業の収益が事件前の財務状況に回復するまでに75日かかることも明らかにした。

ダウンタイムは、収益の損失、規制当局への罰金、問題解決にあたるスタッフへの残業代など、直接的な経済的損失につながります。また、この報告書では、株主価値の低下、開発者の生産性の停滞、評判の低下など、影響が出るまでに時間のかかる隠れたコストも明らかにされています。

「ダウンタイムの隠れたコスト」レポートは、53カ国、様々な業種のグローバル2000企業のCFO、CMO、エンジニア、IT・セキュリティ専門家を含む2,000人の経営幹部を対象に調査を実施しました。調査結果は、ダウンタイムの発生源、それがビジネスに及ぼす影響、そしてそれを軽減する方法について洞察を与えています。

ダウンタイムの原因にはサイバーセキュリティ関連の人為的ミスが含まれる

大企業が経験するダウンタイムインシデントは、セキュリティインシデント(例:フィッシング攻撃)とアプリケーションまたはインフラの問題(例:ソフトウェア障害)の2つのカテゴリーに分類できます。レポートによると、Global 2000企業の平均ダウンタイムは、サイバーセキュリティ関連のダウンタイムが466時間、アプリケーションまたはインフラ関連のダウンタイムが456時間です。

「ほとんどのシステムの可用性は9の複数レベルであるが、数百、あるいは数千のシステムのダウンタイムは蓄積されていく」と著者らは書いている。

回答者が挙げたダウンタイムインシデントの最大の原因は、フィッシングリンクのクリックなど、サイバーセキュリティ関連の人為的ミスでした。これに続き、ITOps関連の人為的ミス(インフラの設定ミス、キャパシティの問題、アプリケーションコードエラーなど)が続きました。レイテンシなどの人為的ミスによるダウンタイムやサービス低下が検出されるまでには平均18時間かかり、復旧にはさらに67~76時間かかります。

参照: 多要素認証でフィッシング攻撃を防ぐ方法

ソフトウェア障害はダウンタイムの3番目に多い原因であり、組織がより複雑な開発・導入手法を採用するにつれて、そのリスクは増大します。4番目はマルウェア攻撃です。

本レポートによると、経営幹部の半数以上が自社のダウンタイムの根本原因を認識しているものの、解決を見送っていることが明らかになりました。これは、レガシーシステムの技術的負債を増やしたくない、あるいは問題のあるアプリケーションの廃止計画があるなど、理由が考えられます。さらに、ダウンタイムインシデント発生後に事後検証を行い、原因の特定と緩和を図ることを選択するテクノロジー経営幹部はわずか42%にとどまりました。事後検証は困難で時間のかかる作業となる可能性があるためです。

Global 2000 企業が挙げるダウンタイムの一般的な原因。
グローバル2000企業が挙げたダウンタイムの一般的な原因。画像:Splunk

ダウンタイムの直接コスト

ダウンタイムによる損失は、Global 2000企業1社あたり年間平均4,900万ドルと、圧倒的に大きい。次に大きいのは規制当局による罰金で、2,200万ドルとなっている。これは、EUの金融セクターを対象としたデジタル運用レジリエンス法など、多くの地域でダウンタイムに関する厳しい規制が課されているためである。

その他の大きなコスト負担としては、ブランドの評判の修復が挙げられます。CMOによると、必要なブランド信頼キャンペーンの実施には平均1,400万ドル、さらに広報、投資家、政府との関係修復には1,300万ドルの費用がかかります。ブランドの健全性を完全に回復させるには約60日かかります。

サイバー専門家の助言にもかかわらず、CFOの67%は、ランサムウェア攻撃から逃れるために、取締役会に対し、犯人に直接、保険、第三者を通して、あるいはこれら3つすべてを通じて身代金を支払うことを推奨しています。身代金の支払いは、Global 2000企業の年間総額1,900万ドルに上ります。

ダウンタイムの直接的なコストと、Global 2000 企業が毎年被るコストを示すインフォグラフィック。
ダウンタイムの直接的なコストと、Global 2000企業における年間コスト。画像: Splunk

ダウンタイムの隠れたコスト

ダウンタイムによる直接的な経済的コストに加え、回答者は他にも多くのコストのかかる波及効果を挙げました。例えば、回答者の28%は、ダウンタイムによって株主価値が低下し、株価が平均2.5%下落したと回答しています。大企業の株価が以前の水準に戻るまでには平均79日かかりました。

ダウンタイムに伴うその他の隠れたコストとしては、市場投入までの時間の遅延と開発者のイノベーションの停滞が挙げられ、それぞれ回答者の74%と64%が挙げています。後者は、技術チームが高価値業務からパッチ適用や事後検証への参加へとシフトした結果です。同様に、マーケティング部門では、ダウンタイムによってチームと予算が危機管理に振り向けられ、他の分野での生産性が失われます。

回答者の40%によると、顧客生涯価値はダウンタイムによっても影響を受ける可能性があるとのことです。サービス停止は顧客体験に悪影響を及ぼし、ひいては組織への忠誠心も低下させるからです。実際、調査対象企業の29%は、インシデントによって顧客を失ったことを認識していると回答しています。

参照: AT&T の障害が組織に顧客コミュニケーションと IT のベストプラクティスについて教えてくれること

企業がダウンタイムを回避する方法

レジリエンスリーダーからのヒント

Splunk のレポートでは、回答者が役立つと判断したか、停止に対する回復力を示した上位 10% の企業によって実証されたため、企業がダウンタイムを回避できるさまざまな方法が明らかになりました。

後者のカテゴリーに属する企業、いわゆる「レジリエンス・リーダー」は、収益を1,700万ドル多く維持し、罰金を1,000万ドル削減し、ランサムウェア被害への賠償金を700万ドル節約しています。また、サイバーセキュリティ関連のダウンタイム、アプリケーションまたはインフラ関連のダウンタイムからの回復も、それぞれ平均より23%、28%速くなっています。その結果、顧客体験の低下といった隠れたコストの影響も軽減されています。

レジリエンスのリーダーは、調査対象の他の組織よりも特定の領域に多くの投資を行っています。その領域とは、以下のとおりです。

  • セキュリティツール: 1,200 万ドル増。
  • 観測可能性ツール: 240 万ドル増加。
  • 追加のインフラ容量: 800 万ドル増。
  • サイバー保険料: 1,100万ドル増加。
  • バックアップ:さらに 1,000 万ドル。

生成型AIは、チームがオンラインに迅速に復帰するために必要な情報を提供できるため、ダウンタイムの削減にも活用できます。レポートによると、レジリエンス・リーダーは他の回答者よりもAI機能の利用拡大が4倍速いことがわかりました。さらに、ダウンタイム対策として個別のAIツールを使用している企業の74%、既存のツールにAIを組み込んでいる企業の64%が、AIは有益であると考えています。

Splunkからのヒント

レポートの著者らは、専門知識に基づいて、ダウンタイムを回避するためのヒントも提供しました。

  • ダウンタイム計画を立てましょう。すべてのアプリをインストルメント化し、停止時のランブックに従い、担当エンジニアを特定しましょう。机上演習や訓練を実施しましょう。
  • 事後検証を実施します。可観測性ツールを使用すると、根本原因の特定と修正の実施が容易になります。
  • 明確なデータガバナンスポリシーを確立します。知的財産に関するルール、特に大規模言語モデルへの入力に関するルールを定めることで、組織はデータ漏洩から保護されます。
  • チームとツールを連携させましょう。ツール、データ、コンテキストを共有するチームは、連携、問題の解決、ダウンタイムの根本原因の特定が容易になります。
  • 予測分析を活用します。AIと ML を活用したソリューションはパターンを認識し、ダウンタイムが発生する可能性がある場合にチームに警告を発します。

「ビジネスの混乱は避けられません。デジタルシステムに予期せぬ障害が発生すると、企業は多額の収益を失い、規制当局から罰金を科されるリスクを負うだけでなく、顧客の信頼と評判も失うことになります」と、シスコの市場開拓担当プレジデントであり、Splunkのゼネラルマネージャーでもあるゲイリー・スティール氏はプレスリリースで述べています。

組織が混乱にどのように対応し、適応し、進化していくかが、リーダーとしての差別化を左右します。レジリエントな企業にとっての基盤となるのは、セキュリティと可観測性に対する統一的なアプローチであり、デジタルフットプリント全体にわたる問題を迅速に検知し、解決することです。

Tagged: