
GoogleのAIアプリ「Gemini」に、ユーザーから最も要望が多かった新機能が追加されました。最新アップデートにより、Android、iOS、Web版で音声ファイルを含むあらゆるファイル形式のアップロードが可能になっています。
目次
無料ユーザーは10分、有料版なら最大3時間に対応
Google LabsおよびGemini担当のVPであるJosh Woodward氏は、X(旧Twitter)で新機能の提供開始を発表しました。これにより、アプリ上の「+」ボタンから「ファイルをアップロード」(Web)や「ファイル」(モバイル)を選択すると、MP3やWAVといった音声ファイルをGeminiに直接渡すことができます。
サポートページによると、一度に最大10ファイルまでアップロード可能で、無料ユーザーは合計で10分以内の音声に対応。有料プランの「Google AI Pro」や「Google AI Ultra」に加入している場合は、この上限が最大3時間まで拡張されるとのことです。
なお、動画のアップロードは従来どおり無料で最大5分、有料ユーザーでは最大1時間となっています。音声は動画よりも長時間に対応している点が特徴です。
使い方と今後の広がり
音声対応により、ユーザーはインタビュー録音、会議メモ、ポッドキャストの一部などを直接Geminiに渡して解析や要約を依頼できるようになりました。これまではテキスト入力や画像・動画が中心でしたが、今回の対応で利用シーンが一気に広がると考えられます。
現時点では日本向けに特別な仕様や制限は報じられていませんが、日本国内のユーザーも同様に利用可能です。
音声対応で広がるAI活用の可能性
Geminiの最新アップデートにより、音声ファイルを直接アップロードできるようになりました。無料ユーザーでも最大10分、有料プランでは最大3時間と、幅広い利用ニーズに応えられる仕様となっています。これにより、AIを活用した音声解析や要約のハードルは大きく下がったといえるでしょう。