MongoDBが教えてくれるデータベースのトレンド - TechRepublic

MongoDBが教えてくれるデータベースのトレンド - TechRepublic
2019年7月30日 パロアルト/カリフォルニア州/米国 - シリコンバレーのMongoDB本社。MongoDB Inc.は、オープンソースのMongoDBを開発し、商用サポートを提供するアメリカのソフトウェア会社です。
画像: Sundry Photography/Adobe Stock

今週は MongoDB World 2022 が開催されますが、MongoDB 2014 に参加していた人 (私のように) にとっては、この 8 年間で会社と業界は大きく変わったと言っても過言ではありません。

2014年にMongoDBで働き、その後AWSとAdobeで数年間勤務した後、2021年半ばに再びMongoDBに復帰したため、明らかに偏りがあるのは否めませんが、データベース市場が10年足らずでどのように進化してきたかを見るのは興味深いものです。しかし、変わらないものもあるのを見るのも同様に興味深いかもしれません。

参照: 採用キット: データベース エンジニア (TechRepublic Premium)

リレーショナルデータだけではない:データベース市場における重要な変化

2014 年 6 月時点で最も人気のあるデータベースのトップ 5 は、2022 年 6 月とまったく同じで、Oracle、MySQL、Microsoft SQL Server、PostgreSQL、MongoDB でした。

違いは、相対的な人気度です。PostgreSQLとMongoDBは、既存のリレーショナルデータベースと比較して人気が高まっています。例えば、PostgreSQLはOracleの台頭によって人気が高まっており、現在ではOracleの約半分(求人情報やLinkedInプロフィールへの言及数などから測定)となっています。これは、2014年にはOracleの約16%に相当したのに対し、現在ではその差は歴然としています。

市場におけるこの変化にはいくつかの理由があります。PostgreSQLの台頭については以前にも記事を書きました。今回はMongoDBに焦点を当て、それが何を意味するのかを考えたいと思います。

MongoDB の CEO である Dev Ittycheria 氏は、オープニングの基調講演で、MongoDB が Fortune 500 企業からガレージで活動するスタートアップ企業に至るまで、35,000 社を超える顧客にとって主流のデータ インフラストラクチャとなっていることを示す統計情報を共有しました。

顧客数は普及率を測る一つの指標ですが、MongoDBの影響力はさらに広範囲に及んでいます。クラウドに主力を置くこの企業(収益の60%はクラウドサービス「Atlas」から得られています)にとって、ダウンロード数はもはや主要な指標ではありませんが、2014年には数万件のダウンロード数を記録しました。現在、その数は2億6500万件に達し、2022年にはMongoDBのコミュニティ製品をダウンロードした人の数は、MongoDB設立後11年間の合計ダウンロード数を上回っています。

2014年にはWebスケールではまだ呆れ返る製品だったにもかかわらず、これほどの採用はなかなかのものです。動画は面白かったですが、MongoDBはスケールアップに苦労したことは一度もありません。むしろ、この動画はリレーショナルデータベースでほとんどのアプリケーション要件に対応できるという印象を捉えていました。そのため、2014年のMongoDBの課題は、開発者にリレーショナルデータや表形式のデータ構造を超えた世界を検討してもらうことでした。

MongoDBはこれまでデータリレーションをリレーショナルデータベースとは異なる方法で適切に処理してきました。そのため、当時、MongoDBはNoSQLという名称を受け入れました。NoSQLには様々な問題点がありましたが(NoSQLではないものによって定義されたいと思う人はいないでしょう)、開発者が表形式のデータ構造を超えて考えるのに役立つと考えたからです。

それ以来、非リレーショナルデータベース、つまりマルチモデルデータベースが爆発的に増加しました。現在、DB-Enginesには約400のデータベースが含まれていますが、そのうちリレーショナルデータベースは半分にも満たないのです。ドキュメントデータベースから時系列データベース、グラフデータベース、列指向データベース、キーバリューデータベース、そして[新しいデータベースタイプを挿入]に至るまで、業界では多種多様な新しいデータベースが誕生する一方で、リレーショナルデータベースも引き続き利用されてきました。

RedMonk のアナリスト Steve O'Grady 氏は、次のように書いています。「汎用データベースが単一カテゴリだった時代は、ワークロードとニーズに基づいてデータベースの種類が選択される特化の時代へと変わりました。」

2018年に、Amazon CTOのWerner Vogels氏はブログ記事でこの動きを次のように紹介しました。

「何十年もの間、データベースの選択肢はリレーショナルデータベースしかなかったため、アプリケーション内のデータの形式や機能に関わらず、データはリレーショナルデータベースとしてモデル化されていました」とVogels氏は述べた。「ユースケースがデータベースの要件を左右するのではなく、その逆でした。データベースがアプリケーションのユースケースのデータモデルを左右していたのです。リレーショナルデータベースは、非正規化スキーマとデータベースの参照整合性の確保を目的として構築されているのでしょうか?確かにその通りです。しかし、ここで重要なのは、すべてのアプリケーションデータモデルやユースケースがリレーショナルモデルと一致するわけではないということです。」

ヴォーゲルス氏は 2014 年に開催された第 1 回 MongoDB World で基調講演を行いました。その後 8 年間にわたり、顧客の関心を最大限引き出すために、AWS が 12 を超える新しい「専用」データベース サービスを立ち上げるのを支援しました。

汎用データベースの台頭

近年、データベース市場はいわば「平均回帰」し、開発者はMongoDBやPostgreSQLといった汎用データベースへと回帰しています。オグレイディ氏によると、その理由は単純、あるいはむしろシンプルさにあります。「今日では、複数のデータベースを学習し、操作しなければならないというオーバーヘッドが、メリットよりも負担になってきています。」

同氏はさらに、企業がデータベースベンダーに機能強化を迫っている理由として、「異なるデータストア間でコンテキストを切り替えたくないから、既存のデータセットを移行せずに分析などを実行したいから、取引している膨大な数のベンダーを統合したいから、あるいはこれらすべてを組み合わせたから」と説明した。

参照: 採用キット: データベース管理者 (TechRepublic Premium)

2014年、MongoDBは業界の特化へのトレンドを牽引しました。そして2022年には、特化からの脱却という流れの一翼を担っています。皮肉なことに、MongoDBは特化を謳ったことは一度もなく、むしろ当初から汎用データベースとして売り出してきました。なぜでしょうか?O'Grady氏が説明したように、「汎用」は開発者の負担を軽減し、MongoDBは常に開発者の利便性を重視してきたからです。

そのため、MongoDB World 2022 の最大のニュースのいくつかは、まったくニュースではないはずです。同社は MongoDB をデータベースではなく、開発者データ プラットフォームとして位置付けています。

データベースはデータプラットフォームになる

ここで改めて、業界の背景を踏まえて考えてみましょう。多くの企業がデータサイエンティスト、ビジネスアナリスト、その他のグループ向けにワンストップショップを提供しようとしており、データクラウドやデータプラットフォームをマーケティングしています。これとは対照的に、MongoDBのユニークな点は、開発者に焦点を当てていることです。

MongoDBは、そのドキュメントモデルによって開発者の生産性が大幅に向上したと自信を持って主張できますが、アプリケーションの要件により、開発者は検索、リアルタイム分析などを含む、広大なバックエンドデータシステム群を接続するという、厄介な責任を負わされ続けています。これらのサービスには、ログ記録やアラートといった管理機能も必要です。一体誰がこれらすべてをまとめなければならないのでしょうか?開発者です。MongoDBのCTO、マーク・ポーター氏が皮肉を込めて言ったように、開発者は「モデルよりも接着剤」のような役割を担うことになります。

実際、MongoDBの幹部はオープニング基調講演全体を通して、同社の開発者重視の姿勢を繰り返し強調していました。しかし今回、同社は柔軟なスキーマや水平スケールではなく、データライフサイクル全体をサポートするためにますます幅広いサービス群を網羅する、洗練された開発者エクスペリエンスを謳い文句にしました。これにより、トランザクションから運用、分析に至るまで、より幅広いユースケースをサポートできるようになります。

MongoDB の開発者データ プラットフォームは、サービス間または製品間のデータの移動を大幅に抽象化することで、人材とソフトウェア/システムの観点から、企業がミドルウェアへの投資を大幅に削減できるようにするとともに、システム間でデータを調整する必要性を軽減し、組織が単一の真実のソースを確保できるようにすることを目指しています。

データプラットフォーム、あるいはデータクラウドという概念は新しいものではなく、MongoDBに限ったものではありません。前述の通り、これは開発者(データウェアハウスベンダーの場合はデータアナリスト)の負担を軽減するための垂直統合に向けた業界のトレンドです。しかし、MongoDBと異なるのは、開発者データプラットフォームという概念です。開発者がデータを活用して生産性を大幅に向上させるもの、それがMongoDBです。

MongoDBにとって重要なのは明らかに分析機能ですが、その分析機能自体ではありません。たとえ私がMongoDBで働いていなかったとしても、MongoDB Worldのイベントに参加したからといって、MongoDBがデータウェアハウスのワークロードをめぐる競争に参入しようとしていると考えるのは難しいでしょう。

基調講演では、魅力的なアプリ内体験を促進する分析ワークロードに関する多くの考察が明らかにされました。例えば、最近表示された内容に基づいてチェックアウト時に表示するプロモーションを決定するパーソナライゼーションアプリケーションや、ネットワークアクティビティを分析して安全なドメインと危険なドメインを区別するセキュリティアプリケーションなどが挙げられます。

従来、これらのワークロードに適した分析システムは、運用システムとは分離されていました。分離は良いように聞こえますが、実際にはそうではありません。ETLなどの処理によってコストと複雑さが生じ、アプリケーションと、それらにデータを提供するバックオフィスデータとの距離が離れてしまうからです。

バッチ指向の世界は現状かもしれませんが、顧客にとってアプリケーションエクスペリエンスを悪化させています。MongoDBも明らかにこれに同意しており、イベントでも様々な発表を通して繰り返しその旨を表明しました。

ここで、私たちの業界が2014年と比べてどれほど変化し、どれほど変わらないのかという問題に戻ります。2016年に書いたように、私たちは依然としてリレーショナルデータベースに依存しており、今後もしばらくはそうあり続けるでしょう。しかし同時に、企業がMongoDBのような非リレーショナルデータベースへの依存度を高めているのも事実です。

どちらの陣営でも、開発者が特殊用途データベースに手を出す一方で、汎用データベース、そして最近では汎用データプラットフォームへの投資を増やしているのを目にしてきました。トーキング・ヘッズが歌うように、「相変わらずだ」

開示事項:私はMongoDBで働いていますが、ここに記された意見は私自身のものであり、雇用主のものではありません。ただし、雇用主が私の意見に同意しないことが多い場合は、お気軽にお問い合わせください。 

Tagged: