トピック — 人工知能
OpenAIがエージェントに音声機能を提供 ― 中世の騎士が仕事のメールを読める
出版

テキスト読み上げおよび音声テキスト変換ツールはすべてGPT-4oに基づいています。OpenAIは、ビデオでも同様のアプローチを取る可能性を示唆しています。

OpenAIは、物議を醸しているAI音声のラインナップを拡張し、エージェントモデルも追加しました。エージェントモデルは生成AIのホットなトレンドであり、AIに航空券の購入や顧客の注文の変更を依頼するといった2段階のプロセスを可能にします。具体的には、新しいモデルには以下のものが含まれます。
- Gpt-4o-transcribe と gpt-4o-mini-transcribe はどちらも音声テキスト変換モデルです。
- Gpt-4o-mini-tts は、テキスト読み上げモデルです。
開発者はOpenAI APIからこれらの機能にアクセスし、Agents SDKに統合できます。APIにテキスト読み上げ機能と音声テキスト変換機能を追加することで、エージェントツールを含む様々なAIアプリケーションで利用できるようになります。
高度な合成音声は詐欺をより説得力のあるものにする
同社は「単なるテキストを超えた、エージェントとのより深く、より直感的なインタラクション」を実現したいと考えているが、音声モデルに柔軟性と自律性を加えることで、より説得力のある詐欺ボットが生まれる可能性が高まる。
ニュースリリースによると、「私たちは、合成音声がもたらす課題と機会について、政策立案者、研究者、開発者、クリエイターとの対話を継続しています。」
参照: 余裕資金をお持ちですか?OpenAIの新APIに必要になります
モデルは精度、信頼性、リアリズムを考慮して調整されています
OpenAIは3月21日、APIで音声テキスト変換およびテキスト音声変換のための新しい音声ツールをリリースしました。これらのモデルは、特に「アクセント、騒がしい環境、そして様々な発話速度」を含む会話において、精度と信頼性を高めるよう調整されています。これらのモデルは、顧客向けコールセンターや会議の書き起こしに利用されることを目的としています。
また、意図的に特定の話し方をするように指示したり、ドラマチックな話し方や明るい話し方など、特定の話し方をするように指示することもできます。OpenAIは、これらのAIモデルの一部を「創造的なストーリーテリング体験のための表現力豊かなナレーション」に活用することを想定しており、テーマパークや演劇イベントなどで活用されることが想像できます。こうしたユースケースは、AIがクリエイティブな職業に取って代わる可能性を示唆しています。OpenAIが提案する音声の例には、「就寝時のお話」「サーファー」「犯罪ドキュメンタリーマニア」「中世の騎士」などがあります。
Gpt-4o-transcribe と gpt-4o-mini-transcribe は、特にアクセント、背景ノイズ、またはさまざまな音声速度のある会話で、音声をより正確に書き起こすように設計されています。
Gpt-4o-mini-ttsは指示に従って声色を合わせたり、人物の人格を演じたりすることができます。OpenAIは、API上の音声合成音声はすべて「人工のプリセット音声」であることを慎重に指摘しています。スカーレット・ヨハンソンは、OpenAIが許可なく自分の声を模倣したと非難しており、彼女の音声ではないことは明らかです。
エージェント型ビデオAIが登場するかもしれない
OpenAIは次に、開発者が「当社の安全基準に準拠した方法でパーソナライズされた体験」のために「カスタム音声」を導入できるようになると述べた。同社はまた、エージェント型AI体験にビデオを活用する方法も模索している。
こちらもご覧ください
- OpenAIは2025年に超知能に注目を移す
- OpenAI、複雑なコーディングと数学に最適化された「ストロベリー」モデルを発表
- DeepSeekチャットボットがApp StoreのリーダーボードでOpenAIに勝利
- ChatGPTチートシート:2025年完全ガイド
- 人工知能:さらに読むべき記事

ミーガン・クラウス
メーガン・クラウスは、B2Bニュースおよび特集記事の執筆で10年の経験を有し、Manufacturing.netのライター、そして後に編集者として活躍しました。彼女のニュース記事や特集記事は、Military & Aerospace Electronics、Fierce Wireless、TechRepublic、eWeekに掲載されています。また、Security Intelligenceではサイバーセキュリティに関するニュースや特集記事の編集も担当しました。フェアリー・ディキンソン大学で英文学の学位を取得し、クリエイティブライティングを副専攻しました。