
企業は膨大な量のデータによって動かされており、それらは多くのビジネス上の意思決定に影響を与えています。製品の改善、マーケティング、広告のトレンド、ビジネスリスク、製品のパフォーマンスなど、これらは質の高い意思決定を行う上で正確なデータに依存するビジネス要素です。
企業にとってデータは極めて重要ですが、不正確な情報によって企業データが損なわれ、結果として「ダーティデータ」につながる可能性も否定できません。最近の調査によると、米国の企業では「ダーティデータ」に起因するインシデントによって年間平均1,500万ドルの損害が発生しています。2018年の衝撃的な報告書では、サムスンが不良データによって約3億ドルの損失を被ったことが明らかになりました。
参照:パスワード侵害:ポップカルチャーとパスワードが混ざらない理由(無料PDF)(TechRepublic)
その結果、データの品質と、組織内でデータの完全性を確保し、ビジネス上の重大な意思決定につながるミスを回避する方法への懸念が高まっています。また、ダーティデータがデータセキュリティの脆弱性につながる可能性も懸念されており、これは企業にとってサイバーセキュリティ上の最大の懸念事項となっています。
ダーティデータとは何ですか?
ダーティデータとは、顧客情報やビジネス情報に誤り、重複、または欠落がある状態を指します。マネージャーが顧客レコードを誤って重複入力した場合、重要なデータレコードにスペルミスがあった場合、データ入力ツールが誤った情報を自動入力したりスパムメールを混入したりした場合、あるいは日付形式が一貫していない場合などにダーティデータが発生する可能性があります。
組織のデータと人間のやり取りにより、データの整合性と正確性を常に維持することはほぼ不可能であり、データは攻撃者が標的にして悪用できる武器となります。
ダーティデータの種類
以下は、ほとんどのエンタープライズ データベースの整合性を損なう可能性のあるダーティ データの種類です。
重複データ
重複データとは、データベースに意図せず入力された、他のデータと全く同じデータを持つデータエントリを指します。連絡先、リード、アカウントは、最も頻繁に重複するオブジェクトです。
古いデータ
古くなったデータとは、もはや関連性のない情報です。例えば、古いサーバーセッションCookie、もはや正確ではないWeb情報、あるいは組織がリブランディング段階を経た際に古くなったデータなどが挙げられます。
不完全なデータ
不完全なデータとは、マスターデータレコードの重要なフィールドが欠落しているレコードのことです。重要なフィールドとしては、名、姓、業種、電話番号などが挙げられます。
不正確または不正確なデータ
フィールド値が許容範囲外で生成されると、不正確なデータにつながる可能性があります。例えば、月フィールドは1から12までの値のみを受け入れるべきであり、住所は実在する家屋またはオフィスの所在地でなければなりません。これらの許容値が満たされていない場合、それは不正確なデータと言えるでしょう。
矛盾したデータ
データが不整合であるとは、あるエントリが他のシステムで複数の表記を持つ場合を指します。例えば、「生年月日」フィールドが「dob」、「DOB」、「Date of B」など、異なるバージョンで入力されている場合などです。
一貫性のないデータに関する大きな問題の 1 つは、同じタイトルと業界のすべての変数を考慮する必要がある場合に、分析に影響を及ぼし、データのセグメンテーションが妨げられることです。
企業にとってのダーティデータによるサイバーセキュリティの懸念
様々な業界でデータ侵害が増加する中、ダーティデータによるサイバーセキュリティ上の懸念が新たに浮上しています。これらの懸念事項を以下にまとめます。
サイバー融合センターを標的とした誤解を招く信号
サイバーフュージョンセンターは、サイバーセキュリティの責務を担い、様々なチーム間のコミュニケーションを強化するために設立された共同プロジェクトです。フュージョンセンターは、自動化技術と様々なソースから収集されたデータを組み合わせ、ビジネスおよびセキュリティに関する意思決定に役立つ洞察を導き出します。
残念ながら、サイバーフュージョンセンターが商業活動に対して持つ力を攻撃者が悪用して、データを操作したり、偽の情報を拡散したりする可能性があります。
より多くの攻撃者がデータの汚染に注力するだろう
攻撃者は、成功率を高め、法執行機関の目を逃れるために、新たな戦略を試行錯誤し続け、よりステルス性が高く、より的を絞った攻撃を展開しています。組織の評判を傷つけ、消費者を欺き、あるいは事態の行方を左右するために、彼らは虚偽の情報を積極的に探し求めています。
脅威の主体が、情報の完全性と正当性を損なうために違法なデータ操作に目を向け、組織がビジネスを進めるために依存しているデータの完全性を損なう可能性があります。
デジタルツインは攻撃対象領域を倍増させる
実際の行動に基づくデータを収集するために、シミュレーションと機械学習を用いて物理的なオブジェクトのデジタルツインを作成します。製品開発の効率化、追跡機能の向上、そして業績予測を目的として、製造業におけるデジタルツインの活用が加速しています。
デジタルツインは現実世界のデータを使用するため、デジタルツインにアクセスできる人は誰でも、物理的な対応物に関する重要な詳細情報を見ることができます。攻撃者はデジタルツインの脆弱性を悪用し、製造業やサプライチェーンのダウンタイムを引き起こす可能性があります。
組織が自らを守る方法
重要な資産を示す
重要な情報資産を列挙することが最初のステップです。次に、これらの重要な資産におけるデータポイズニング発生時の対応に関する組織的計画の策定、実装、維持に重点を置きます。
データ ガバナンス機能が組み込まれたプラットフォームの導入を検討してください。これらの機能により、データの整合性を含むデータ管理のあらゆる側面を監視およびトラブルシューティングするための制御が提供されます。
自動化を使用する
サイバーフュージョンセンターの進化に伴い、データとインテリジェンス入力の精度に細心の注意を払ってください。自動化システム、特に混乱を引き起こす可能性について、定期的にレビューする必要があります。また、信頼性と安全性の要件に反しない自動化の閾値を設定する必要があります。サイバーフュージョンセンターで突発的なデータ整合性の問題が発生した場合に備えて、対応戦略を策定、演習、分類する必要があります。
データサニタイズを採用する
サイバー フュージョン センターに送られるデータの整合性をさらに確保するために、データ クリーンアップ手順を採用し、ビジネス チームと IT チームが協力してサイバー フュージョン センターの精度と有効性を向上させるためのポリシーを確立します。
デジタルツインについて知る
セキュリティチームは、デジタルツインとその企業全体との関連性を深く理解することで、より適切な監視と管理を行うことができます。デジタルツインプロバイダーと連携し、セキュリティ能力を評価しましょう。デジタルツインと物理ツイン間のソフトウェア接続に脆弱性がないか調査しましょう。