グーグルの新AIモデル「Gemini Omni Flash」が画像や動画からAI動画生成に対応

modelmultimodal2026/06/03 公開

何が起きたか

グーグルは新しいマルチモーダルAIモデル「Gemini Omni Flash」を発表した。このモデルは実際の画像や動画クリップを入力としてAI動画を生成できる機能を持つ。あらゆるメディアをあらゆるメディアに変換できる「anything-to-anything」モデルとして位置づけられている。たとえばフランス行きの飛行機に乗っているように見せる動画を手軽に作成できるとされる。

なぜ重要か

実在する画像や動画を素材にAI動画を生成できることで、コンテンツ制作の敷居が大幅に下がる。一方で、本物と見分けがつきにくいフェイク動画（ディープフェイク）の作成も容易になるという懸念が生まれる。マルチモーダルAIの進化が映像コンテンツの信頼性に与える影響は社会的に大きい。

編集者の見立て

GoogleのGemini Omni Flashは実画像・動画からのAI動画生成に対応し、コンテンツ生成の利便性を高める一方、悪用リスクへの対応が問われる段階に入った。

問うべき問い

Gemini Omni Flashが生成したAI動画の悪用を防ぐために、グーグルはどのような安全策を講じているのか？

今後の読み筋

今後はディープフェイク検出技術との競争がさらに激化する可能性がある。また各国の規制当局がAI生成動画の表示義務やプラットフォーム責任についてどのような方針を打ち出すかが注目点となる。

注意点

記事の見出しや要約から得られる情報のみに基づいており、モデルの詳細な仕様や安全機能については確認できていない点に留意が必要。

参照ソース

The Verge
https://www.theverge.com/tech/936507/gemini-omni-hands-on-deepfake-ai-video

本文は掲載元サイトでお読みください。ブラウザの翻訳機能をご利用いただけます。

← 記事一覧に戻る