Google 、高速画像モデル「Nano Banana 2 Lite」とビデオ生成・編集モデル「Gemini Omni Flash」を発表

社内チャット・掲示板で共有

Google は現地時間6月30日、生成メディアモデルの刷新を発表し、「Nano Banana 2 Lite」および「Gemini Omni Flash」の提供を開始した。本アップデートは、画像生成における速度とコスト効率の最適化、ならびに高画質なビデオ生成と会話型編集の実現を目的としており、開発者向けには Google AI Studio および Gemini API を通じて利用可能となっている。また、これら技術は Google 検索のAIモードや Gemini アプリ、Google Photos、NotebookLM、Stitch、Google Flow、Google Ads といった消費者向けサービスにも順次展開され、広範なユーザー体験の向上を図る方針である。

新たに投入された「Nano Banana 2 Lite」は、同社の画像生成モデル系列において最も高速かつ低コストなモデルである。テキストから画像を出力するまでの所要時間はわずか4秒であり、従来モデルと比較して大幅な効率化を実現した。コスト面においても、1000画像あたり0.034ドルという価格設定により、高頻度な反復処理を必要とする開発パイプラインに適している。一方、「Gemini Omni Flash」は、ビデオ生成および会話型編集における高度な能力を備えたモデルであり、静止画を引用したビデオ生成や、マルチモーダルな入力を活用したシームレスな編集が可能である。両モデルともに Google のセキュリティインフラストラクチャ上で構築され、コンテンツの真実性を検証するための SynthID ウォーターマークがデフォルトで適用される。

これらのモデルの統合により、従来は個別に分断されていた開発プロセスに変革がもたらされる。具体例として、高速な画像生成を行う「Nano Banana 2 Lite」で作成された画像を、即座に「Gemini Omni Flash」へ参照として渡し、高品質なビデオアニメーションへ変換する一連のワークフローが挙げられる。このような連携は、インテリアデザインやEコマースといった領域において強力なソリューションとなる。例えば、Space Lift のようなデモアプリでは、室内写真をアップロードしてデザインコンセプトを生成した後、それを動画として視覚化することで、制作効率の大幅な向上とクリエイティブな表現の拡張を支援する。

現時点において、これらのモデルは開発者プラットフォームへの導入が完了しており、企業向けにはプロビジョニングされたスループットも利用可能である。ただし、今回のリリースはパブリックプレビュー段階であり、いくつかの制限事項も存在する。現時点ではビデオ生成が10秒に限定されているほか、 API経由での音声参照やシーン拡張の未対応、3秒以下のビデオ参照が正しく処理されないなどの課題があり、今後のアップデートで順次改善していく方針である。

Start building with Nano Banana 2 Lite and Gemini Omni Flash|Google

blog.google

参考リンク

社内チャット・掲示板で共有

会社で働くみなさん、本当にAI活用できていますか?

グループ内のAI活用を推し進める傍ら、お客様にもAIソリューションを提供しているUSEN&U-NEXT GROUPの知見と、
各業界のAIリードカンパニーへのインタビューなどを通じて、
企業におけるAI活用の実態やノウハウ、問題点などを記事で公開しています。

記事一覧へ

自社の・自分のAI活用状況が分かる!カンタンAI診断を公開中

診断する