グーグルの「Gemini」がさらに進化、押さえておきたい8つのポイント
Googleの「Gemini」は、すでに多くの便利な機能を提供している。テキスト生成や画像作成から、ライブ会話、詳細な調査、ファイル分析に至るまで、GoogleのAIはAI分野で強力なプレーヤーであることを証明している。
Googleは米国時間5月20日、年次開発者会議「Google I/O 2025」でAIアシスタントに関する多くの新機能と機能強化を発表した。
1. Google AI ProとGoogle AI Ultra
まず、2つの新しいAIプランについて説明する。これらはより多くの機能を提供するが、当然ながら相応の料金設定となっている。
最初のプランは「Google AI Pro」と呼ばれているが、これは既存のAI Premiumプランから名前が変更になっただけである。AI Proの月額料金は20ドルで据え置きであり、Geminiの無料版で利用できるAI機能に加え、レート制限の緩和と特別な機能が追加されている。
AI Proには、これまで「Gemini Advanced」として知られていたGeminiアプリに加え、「NotebookLM」や新たなAI動画エディター「Flow」などの製品が含まれる。これらの2機能は、まず米国のAI Proユーザーに提供され、その後他国にも拡大される予定である。
米国、英国、ブラジル、インドネシア、日本の大学生は、AI Proを1年間無料で利用できる。
さらに多くのパワーと機能が必要で、費用を惜しまない場合は、「Google AI Ultra」プランもある。このプランは、もっとも強力なモデルと高いレート制限に加え、実験的なAI機能への早期アクセスを提供する。
一例として、Ultraプランでは、デスクトップベースの新たなエージェントツール「Agent Mode」への早期アクセスが認められる。これはユーザーに代わってタスクを実行する機能だ。ユーザーはリクエストや質問を説明するだけでよく、エージェントがウェブを閲覧し、独自に調査し、Googleアプリと統合することで、複雑な多段階のタスクを最初から最後まで処理する。
Ultraプランは月額250ドルという高額だが、初回契約者は最初の3カ月間が50%オフになる。
2. Gemini Live
次に「Gemini Live」について説明する。これはAIと音声で対話できる便利なチャットモードである。以前は「Android」ユーザーのみが画面やカメラの映像を共有し、それについてGeminiに質問できたが、今回Googleはこの機能を拡張し、Androidと「iOS」の両方のユーザーがカメラと画面共有を利用できるようになった。
これを試すには、「iPhone」またはAndroidデバイスでGeminiアプリを開き、プロンプトの右にあるGemini Liveアイコンをタップする。下部のカメラアイコンを使えば、スマートフォンを任意の物体や風景に向け、Geminiに説明させたり、質問に答えさせたりできる。また、デバイス上の任意の画面を共有し、Geminiに分析させることも可能である。
さらに、今後数週間のうちに、Gemini Liveはマップ、カレンダー、タスク、Keepといった他のGoogleアプリやサービスと連携する。これにより、Gemini Liveにカレンダーの予定を作成させたり、次の目的地への道順を教えてもらったりといったタスクを実行可能になるだろう。
3. Imagen 4
以前、Googleは「Imagen 3」モデルを用いてユーザーの記述に基づいた画像を生成していた。今回、同社はImagen 4へのアップグレードを発表し、これによりパフォーマンスの向上、よりリアルなディテール、そして優れたテキスト出力が提供されると主張している。Imagen 4は、誰でもGeminiアプリを通じて試せるようになる。
4. Veo 3
Geminiの動画生成ツールであるVeoもアップグレードされ、「Veo 2」からVeo 3へと進化する。これにより、キャラクター間の対話、背景音、効果音をサポートするネイティブオーディオ生成機能が提供される。Googleの説明によれば、テキストによる記述だけで、にぎやかな街の音から葉のささやき、キャラクターの対話に至るまで、あらゆるサウンドを追加できるようになったという。ただし、Veo 3は現時点では米国のAI Ultraプランのみで利用可能となっており、これが主な障壁となっている。
5. Canvas
Googleの「Canvas」ツールは、コード作成、ウェブページ設計、その他の視覚コンテンツの考案を可能にする、インタラクティブかつ協業的なワークスペースを提供する。その結果はリアルタイムに並べて表示される。Googleによると、最新の「Gemini 2.5」モデルを用いることで、Canvasはより直感的で強力になるという。
ユーザーは、インタラクティブなインフォグラフィック、クイズ、ポッドキャスト形式の「Audio Overviews」を45言語で作成できる。「Gemini 2.5 Pro」のコーディングスキルにより、Canvasはユーザーのアイデアを実際のコードへ変換する能力が向上し、アプリ開発を支援できるようになった。
6. インタラクティブなクイズ
新しいことについて学びたい場合、Geminiが役立つだろう。AIに、興味のあるテーマでクイズを作成するように依頼すると、Geminiは知識を広げるための質問を次々と出題する。それぞれの質問に答えるたびに、AIはユーザーの学習状況を教えてくれ、特に注意が必要な部分を指摘してくれる。この機能は現在、デスクトップとスマートフォンの両方で、全てのGeminiユーザーが利用できるようになっている。
7. Gemini-in-Chrome
米国時間5月21日現在、Geminiが「Windows」および「macOS」のデスクトップ版「Chrome」で利用可能になり始めている。これにより、表示中のウェブページについてGeminiに分析を依頼したり、質問に答えさせたりできる。将来的には、AIは複数のタブを横断して機能し、異なるウェブサイトを起動することも可能になる。
この機能は便利に思えるが、利用には制限がある。Gemini-in-Chromeは、AI Pro/Ultraの米国ユーザーで、かつブラウザーの言語設定を英語にしている必要がある。
8. Deep Research
Geminiの「Deep Research」モードは、オンラインで調査を行い、その結果を詳細なレポートとして提示するエージェントツールである。従来、Deep Researchは必要な情報のためにウェブサイトの参照しかできなかったが、今ではユーザー自身のPDFや画像も確認できるようになった。これは、ユーザーがGeminiに対し、個人のファイルや仕事のファイルにすでに記録されている情報を含めるよう指示できることを意味する。
Googleが挙げた例の1つとして、市場調査員がPDF形式で保存された社内売上データをアップロードし、公開されている市場トレンドと相互参照するケースがある。別の例では、学術研究者がGeminiに対し、ダウンロード済みの学術論文を参照してオンライン文献レビューに追加するよう指示できる。さらにGoogleは、利用可能な情報源を拡大するため、Deep Researchを「Google Drive」やGmailと統合する計画であると述べている。
AIが個人と組織双方に与える影響が拡大する中で、Googleが競争力を維持しようとしていることを示唆している。高価なUltraサブスクリプションが導入されたとはいえ、無料のGeminiユーザーやAI Proサブスクライバーでも、最新の進歩を試用し、その有用性を確認できる十分な機能が提供されている。
これらの取り組みは、AIが個人と組織双方に与える影響が拡大する中で、Googleが競争力を維持しようとしていることを示唆している。そして、高価な新しいAI Ultraサブスクリプションが導入されたとしても、無料のGeminiユーザーやAI Proサブスクライバーは、最新の機能を試用し、その有用性を十分に確認できるだろう。