2025/11/19 Gemini 3 がロールアウトした!

早速、そのGEMINIに違いを聞いてみました。

主にエージェント機能!

もうCopilotなんか目じゃない。
マジに昨日、CopilotにJPYCのことを聞いていたら、情報が古すぎて、
間違った回答ばかりしてきていた。
あと、日本の法律についてもきちんと理解していなさすぎだった。

改めて、夜中にGEMINIに聞いて理解しなおしていたところ、

本日、GEMINIがバージョンアップ

  1. Deep Think
  2. Agent
  3. インターフェース生成
  4. 処理性能アップ

すでにGoogleの Discord で紹介されている映像があって、
動画を簡単に解析する能力がありました!

https://discord.gg/gemini

Gemini に回答させました:

Gemini 2.5 と、2025年11月19日(現地時間)に発表されたばかりの最新モデル Gemini 3 の違いについて解説します。

一言で言うと、Gemini 2.5が「論理的思考力を強化した高性能モデル」であったのに対し、Gemini 3は「自律的に考え、行動し、インターフェースまで生成するAIエージェント」へと進化しています。

主な違いは以下の4点です。

1. 推論能力の深化(Deep Think)

  • Gemini 2.5: 「Thinking(思考)」プロセスを導入し、数学やコーディングなどの論理的タスクにおいて高い性能を発揮しました。
  • Gemini 3: 新機能「Gemini 3 Deep Think」を搭載。推論能力がさらに強化され、複雑な問題を解く際に、AIが自ら「検証」や「振り返り」をより深く行います。これにより、博士号レベルの問題解決能力や、より高度な科学的・数学的推論が可能になりました。

2. 「エージェント」としての実行能力

  • Gemini 2.5: 情報の検索や分析、コード生成が得意でしたが、あくまで「対話パートナー」としての性格が強いものでした。
  • Gemini 3:AIエージェント」としての機能が本格化しました。GoogleカレンダーやGmail、マップなどのアプリを横断して、ユーザーの代わりに複雑なタスク(例:「来週の旅行プランを立てて、フライトとホテルを予約し、カレンダーに登録して」など)を自律的に実行する能力が飛躍的に向上しています。

3. ダイナミックなインターフェース生成

  • Gemini 2.5: 出力はテキスト、コード、画像が基本でした。
  • Gemini 3: ユーザーの意図に合わせて、回答の表示形式を動的に生成します。例えば、データ分析を頼めばインタラクティブなグラフを表示したり、手順を頼めばチェックリスト形式のUIをその場で構築したりするなど、単なるテキストチャットを超えた「アプリのような体験」を提供します。

4. 処理性能とマルチモーダル

  • Gemini 2.5: 100万トークンのコンテキストウィンドウを持ち、動画や音声の理解も得意でした。
  • Gemini 3: 基本スペックは2.5を継承しつつ、ベンチマーク(LMArenaなど)で世界1位を記録するなど、総合的な応答品質と処理速度が向上しています。特に「空気を読む」と言われるような、文脈の深い理解力が改善されています。

まとめ:比較表

特徴Gemini 2.5Gemini 3 (最新)
役割高度な対話・思考パートナー自律的に行動するAIエージェント
推論機能Thinking (思考)Deep Think (深層思考) ※より複雑な課題に対応
実行能力ツール利用が可能アプリ横断的な自律操作 (Agent機能)
表示形式テキスト・画像・コードダイナミックUI (グラフや対話的要素を自動生成)
主な用途分析、学習、コーディング支援複雑なタスクの代行、意思決定支援