
新しいストレージシステム、データベース、アプリケーション、あるいは全く新しいサーバーへの移行など、データ移行はビジネスアジェンダに頻繁に登場するプロジェクトです。しかし、これはやや困難で、時に不安を抱かせるプロセスでもあります。ビジネスリーダーは、予算、リソース、セキュリティ、スケジュールなど、成功のための様々な要素を考慮する必要があります。
参照: チェックリスト: PC と Mac の移行 (TechRepublic Premium)
移行プロジェクトがより一般的かつ複雑になるにつれて、今日のデータ移行市場と個々のプロジェクトを推進しているトレンドについて学びます。
データ移行のトレンドトップ5
1. データレイクハウスへの移行
データ移行における最大のイノベーションの一つは、Databricksが初めて導入したデータレイクハウスと言えるでしょう。これにより、データ移行の必要性が大幅に軽減されます。高価で時間のかかる抽出、変換、ロードといったツールを使ってデータレイクからデータウェアハウスにデータを移行するのではなく、データレイクハウスはデータレイクをデータウェアハウスへと変換するのです。
Databricksの幹部であるDavid Meyer氏はインタビューで次のように説明しています。「データレイクは多くの点で優れていますが、大規模なデータとAI処理に必要な特性はあまり備えていませんでした。」さらに、ガバナンス、ACIDコンプライアンス、トランザクション機能の欠如など、データレイクの弱点についても説明しました。
参照: 組織のデータガバナンスチェックリスト (TechRepublic Premium)
Databricks が使用するオープンソースの Delta Lake のようなレイヤーを追加することで、企業はデータを移動または移行することなく、機械学習アプリケーションなどに大量のデータを活用できるようになります。
2. クラウド移行によるデータ損失の回避と容量の拡張
この2つ目のトレンドは、文字通りほぼ全員が実践しているため、はるかに明白です。つまり、クラウドへのデータ移行です。クラウドへの支出はIT市場全体と比較すると依然として比較的小規模(IDCとGartnerのデータによると10%未満)ですが、他の分野よりもはるかに速いペースで成長しています。
これにはいくつかの理由があります。まず、オンプレミス環境にデータを保存すると、データ損失につながる可能性があります。バックアップポリシーが整備されていたとしても、オンプレミスのデータストレージは、バックアップが自動化されたフルマネージドクラウド環境よりも、障害発生率がはるかに高くなります。
参照: クラウドデータストレージポリシー (TechRepublic Premium)
データをクラウドに移行することで、企業はより幅広いデータタイプを処理できるだけでなく、より多くのデータをより高速に取り込むことができます。また、オンプレミス環境ではデータの急増により企業の保存能力が限界に達してしまうため、クラウド環境は無限とも言える容量のメリットを享受できません。
幸いなことに、主要なクラウドプロバイダーはそれぞれ、よりシームレスなデータ移行を可能にする様々なサービスを提供しています。また、企業のデータを異なるクラウドプロバイダーのストレージ、データベース、関連システムに移行する支援に精通したシステムインテグレーターも多数存在します。クラウドへのデータ移行はかつてないほど容易になりました。
3. オンプレミスのレガシーデータとクラウド顧客データを統合
クラウドへのデータ移行を推進する理由の一つは、既に膨大な量の新しいデータがクラウド上に存在し、実際にはクラウドでデータが生まれているという事実です。これはデータ移行のトレンドというよりも、データ移行の理由そのものと言えるでしょう。
参照: 非構造化データレイクからビッグデータを除去する4つのステップ (TechRepublic)
実際、企業にとって最も価値のあるデータの多くは、少なくとも顧客に関連する限り、クラウドデータです。そのため、これまでオンプレミスで保存されていたデータをクラウド環境に移行するデータ移行プロジェクトが活発化しています。これには、データレイクやデータレイクハウスのクラウドへの移行も含まれます。このプロセスを通じて、組織は顧客データに関するより豊かで包括的な視点を構築できます。
4. データ移行リソースを活用して非構造化データを最大限に活用する
トレンド3で言及した顧客関連データのうち、半構造化データまたは非構造化データの割合が増加しています。こうしたデータの例としては、地理空間データ、センサーデータ、ソーシャルメディアデータなどが挙げられます。
参照: 非構造化データのデータ品質を向上させる 5 つのヒント (TechRepublic)
これらのデータはリレーショナルデータベースに容易に収まりきらず、いわゆるNoSQLデータベースへの保存場所がますます増えています。非構造化データがNoSQLデータベース、データレイク、あるいはその他の場所に保存されているかどうかに関わらず、企業はこれらのデータを移動、クレンジング、変換して分析を容易にするためのデータ移行戦略とツールを求めています。
5. 移住は近代化を生む
企業がデータ移行を検討し始めると、アプリケーションのモダナイゼーションもすぐに検討されることがよくあります。企業がクラウドへのデータ移行を検討している場合、基本的なリフト&シフト方式ではなく、多くの企業が自社管理型のオンプレミスデータベースからフルマネージドデータベースサービスへの移行からプロセスを開始しています。例えば、これらの組織は、自社ホスティングのMySQLからAmazon RDS for MySQLへの移行を検討しています。
参照: データ モダナイゼーションとは何ですか? (TechRepublic)
移行前の段階では、企業がアプリケーションを再構築し、全く異なるデータベースを利用することを選択するケースが増えています。リレーショナルデータベースからドキュメントストアやキーバリューストアに移行する場合もあれば、特定のアプリケーション用にワイドカラムデータベースから始めて、リレーショナルアプローチの方が適していると判断して移行する場合もあります。
データ移行を検討し始めたら、データのストレージ、管理、インフラストラクチャに他の大きな変更を加える時期かどうかを検討する価値があります。また、このようなデータのモダナイゼーションと移行作業を専門とするデータプロフェッショナルの採用も検討する価値があります。
開示: 私は MongoDB で働いていますが、ここで表明されている意見は私自身のものです。
次に読む: クラウドとアプリケーションの移行ツールのトップ 10 (TechRepublic)