Microsoft Officeクライアントはここ数年でますます賢くなってきています。2016年には、Bingの機械学習をベースにしたエディターの最初のバージョンがWordに導入され、現在では、約束されていたアイデア機能と追加機能が拡張されています。Microsoft 365の各種サブスクリプションで提供されるOfficeの新機能の多くは、機械学習を基盤としています。
Word のどのバージョンでも、基本的なスペルチェックと文法チェックは利用できます。さらに、サブスクリプションにご加入いただくと、Word、Outlook、そして新しい Microsoft Editor ブラウザ拡張機能が、不適切な表現、性別を表す慣用句をあまりにも多く使用しているため誰を除外しているのか気づかない、研究資料の表現にあまりにも忠実すぎて自分の言葉で書き直すか引用文献を入力しなければならない、あるいは句読点のルールを守らないといった場合に警告を発します。
参照: Windows 7 からの移行戦略の選択: 4 つのオプション(TechRepublic Premium)
Word は、Bing が長年搭載してきた実世界の数値比較機能を活用して、大きな数字をより分かりやすく表示します。また、組織内で使用されている頭字語を翻訳し、他の業界の人が使用するものと区別することもできます。さらに、太字で表示されている単語が見出しであることを認識し、目次に表示するために見出しスタイルに切り替えるかどうかを尋ねます。
iOS版Outlookでは、機械学習を活用して、メールのタイムスタンプを「30分前」など、より分かりやすい形式で読み上げます。モバイル版とWeb版のOutlookでは、機械学習と自然言語処理を活用して、一部のメッセージに対して3つの簡単な返信(会議のスケジュール設定など)を提案します。
Excel には Power BI と同じ自然言語クエリがスプレッドシートに搭載されており、データに関する質問が可能です。PowerPoint デザイナーは、画像を自動的に切り抜き、スライド上の適切な位置に配置し、レイアウトとデザインを提案します。機械学習を用いて、テキストとスライドの構造分析、画像の分類、含めるべきコンテンツの推奨、そしてレイアウト提案のランク付けを行います。プレゼンターコーチは、機械学習を用いてウェブカメラからあなたの声と姿勢を分析し、猫背、単調な話し方、あるいは話している最中にずっと画面を見下ろしているなどの異常を指摘します。
誰でも使える機械学習
AIプラットフォーム管理のパートナーグループプログラムマネージャーであるエレズ・バラク氏はTechRepublicに対し、これらの機能の多くはAzure Machine Learningサービスを使用して構築されていると語った。その一方で、プレゼンテーションコーチの音声認識、PowerPointプレゼンテーションのリアルタイム字幕作成、60以上の言語へのライブ翻訳といった機能に、Azure Cognitive ServicesのAPIを利用する人もいる(これらのAPI自体もAMLを使用して構築されている)。
その他の機能は、Turing Neural Language Generation などの事前トレーニング済みモデルのカスタマイズに基づいています。これは、質問に答え、文章を完成させ、テキストを要約することができる 170 億のパラメータを持つディープラーニング言語モデルであり、エディターで代替フレーズを提案したり、Outlook で電子メールの返信を表示したりするのに役立ちます。「私たちは、これらのモデルをカスタマイズするために転移学習を適用してから Office で使用しています」と Barak 氏は説明しました。「私たちは大量のデータを直接ではなく、ビッグデータに基づく転移学習によって活用しており、強力な自然言語理解ベースを提供しています。Office で行うすべての処理にはそのコンテキストが必要です。特定の Office の問題を解決するために、私たちはビッグモデル、特にその規模と市場でのリーダー的立場を考えると、Turing モデルから取得したデータを活用するように努めています。」
AMLは、Microsoft製品チームと顧客の両方がビジネスプロセスにプラグインできるインテリジェントな機能を構築するための機械学習プラットフォームです。Azure Data Lakeに保存された大量のデータを取得し、生データをマージして前処理し、複数のVMとGPUで並列実行される分散トレーニングにフィードする自動化パイプラインを提供します。DevOpsで一般的な自動デプロイメントの機械学習版はMLOpsと呼ばれています。Officeの機械学習モデルは、PyTorchやTensorFlowなどのフレームワークを使用して構築されることが多く、PowerPointチームはPythonとJupiterノートブックを多用しています。
Officeのデータサイエンティストは、複数の異なるモデルとバリエーションを試用します。最適なモデルはAzure Data Lakeに再保存され、ONNXランタイム(Microsoftがオープンソース化)を使用してAMLにダウンロードされ、再構築することなく運用環境で実行されます。「特にPowerPoint Designer用のモデルをONNXランタイムにパッケージ化することで、モデルの正規化が容易になり、MLOpsにとって非常に効果的です。これらのモデルをパイプラインに結び付けると、正規化されたアセットが増えるほど、プロセスはより簡単、シンプル、そして生産的になります」とBarak氏は述べています。
ONNXは、Office、特にDesignerでモデルを実行する際のパフォーマンス向上にも役立ちます。「推論呼び出しやスコアリング呼び出しの回数を考えると、パフォーマンスが鍵となります。わずかなパーセンテージ、あるいはパーセンテージ以下のポイントも重要です」とBarak氏は指摘します。
コンテンツとして使用する背景画像や動画を提案するデザイナーのようなツールは、十分な速度を実現するために大量のコンピューティング能力とGPUを必要とします。一部のTuringモデルは非常に大規模であるため、Azure内のFPGA搭載のBrainwaveハードウェアで実行されます。そうでなければ、Bing検索で質問に答えるといったワークロードには遅すぎるからです。Officeはトレーニングと本番運用にAMLコンピューティングレイヤーを使用しており、Barak氏によると「さまざまな種類のコンピューティング、さまざまな種類のマシンへの標準化されたアクセスを提供し、それらのマシンのパフォーマンスに関する標準化されたビューも提供します」とのことです。
「Officeのトレーニングニーズはまさに最先端です。長時間実行、GPU駆動、高帯域幅のトレーニングジョブは、複数のコアにまたがり、数日、時には数週間にわたって実行され、最終プロセスに対する高度な可視性と高い信頼性が求められます」とバラク氏は説明した。「ベースモデルのトレーニングと転移学習の両方に、高性能GPUを大量に活用しています。」トレーニングデータの規模はシナリオによって異なりますが、バラク氏は、チューリングベースモデルを6か月分のデータで微調整するには、(元のモデルのトレーニングに使用したデータに加えて)30~50TBのデータが必要になると見積もっています。
繰り返し可能なコンプライアンス準拠のデータアクセス

画像:Mary Branscombe/TechRepublic
エディターの書き直し提案の学習に使用されるデータには、失読症の人が書いた文書が含まれており、多くのOffice AI機能はOffice 365の使用状況から匿名化された使用状況データを使用しています。頭字語機能は、組織内で使用されている頭字語を特定する必要があるものの、その情報は他のOfficeユーザーと共有されないため、ユーザー自身のOffice 365データを特に使用する数少ない機能の一つです。また、Microsoftは多くの機能で、非公開のOffice文書からデータをマイニングするのではなく、公開データを使用しています。類似性チェッカーはBingデータを使用し、エディターの文章書き直し機能はWikipediaなどの公開データと公開ニュースデータを学習に使用しています。
Office 365は膨大な量のドキュメントを保管する場所として、豊富なデータを抱えています。しかし同時に、Microsoftのデータサイエンティストが遵守しなければならない厳格なコンプライアンスポリシーとプロセスも存在します。これらのポリシーは、法律の変更やOfficeが新しい基準の認定を受けるなど、時間とともに変化します。「Officeが過去に策定し、今後も策定し続けるポリシーとコミットメントの、常に変化する目標と考えてください」とBarak氏は提言します。「Officeデータのサブセットを機械学習に活用するためには、当然のことながら、私たちはこれらのコンプライアンスに関する約束をすべて遵守しなければなりません。」
詳細はこちら: Office 365 コンシューマー向け価格と機能
しかし、プレゼンテーションデザイナーで使用されるようなモデルは、新しいデータ(例えば、提案された何百万ものスライドデザインのうちどれが採用され、プレゼンテーションで保持されるかなど)に対応するために、頻繁な(少なくとも毎月)再トレーニングが必要です。これらのデータはトレーニングに使用される前に匿名化され、トレーニングはAMLパイプラインによって自動化されます。しかし、改善が見られた場合や実験がうまくいかなかった場合を判断するために、再トレーニングされたモデルを既存のモデルと一貫して評価することが重要であり、そのためデータサイエンティストはデータに繰り返しアクセスする必要があります。
「人々はそれを継続的に使用するので、人々の好みや選択に関する新しいデータが継続的に得られ、継続的に再トレーニングしたいと考えています。特にコンプライアンスの世界では、何度も調整が必要なシステムはあり得ません。自動化可能なシステム、つまり再現可能で、率直に言って、ユーザーが簡単に使えるシステムが必要です」とバラク氏は述べた。
「AMLデータセットは、適切なポリシーとガードレールを遵守しながらデータにアクセスできるため、データのコピーを作成しません。これは、お客様へのコンプライアンスと信頼の約束を守る上で重要な要素です。データサイエンティストが機械学習に使用したいデータのサブセットへのポインターとビューとして考えてください。」
「アクセスの問題だけではありません。データサイエンティストが『もっと大きなモデルを導入して、そのデータを使って転移学習をしましょう』と言ったときに、繰り返しアクセスできるようになることが重要です。これは非常に動的です。アクティビティが増えたり、使用する人が増えたりすると、新しいデータが追加されます。そして、大きなモデルは定期的に更新されます。チューリングモデルは1つのバージョンだけで終わりではありません。エンドツーエンドのライフサイクルを持つ継続的なバージョンをデータサイエンティストに提供したいと考えています。」
これらのデータセットは、データの追跡を失うリスクなしに共有できるため、他のデータサイエンティストが同じデータセットで実験を行うことができます。これにより、新しい機械学習モデルの開発をより容易に開始できます。
Microsoft製品チームにAMLを適切に導入することは、自社システムにAMLを導入したい企業にとってもメリットとなります。「Officeの持つ複雑な機能をうまく活用できれば、企業は複数のビジネスプロセスで機械学習を活用できるようになります」とBarak氏は述べています。「同時に、自動化やコンプライアンスに関する要件についても多くのことを学ぶことができ、これは多くのサードパーティのお客様にも当てはまります。」