2026.05.18 2026.05.18

Gemini 3.1 Pro 完全ガイド 2026年5月版 — モデル系譜とプラン選び

ゲンキ

Gemini 3.1 Pro 完全ガイド 2026年5月版 — モデル系譜とプラン選び

「最新の Gemini を使いたい」と AI Studio を開いたら、Gemini 3 Pro が選べない。2.0 Flash は「6 月で廃止」と注意書きが出る。Pro モデルの無料枠を期待していたのに、いつの間にか Flash / Flash-Lite だけが無料になっている。Gemini 3.1 Pro が登場してからの 3 ヶ月で、Google AI の地図は静かに、しかし徹底的に塗り替わった。

メイカーや個人開発者にとって、AI ペアプログラマーは「契約して終わり」の道具ではない。月額課金とトークン課金、無料枠の境界線、廃止予定モデルの移行期限が同時に動くなかで、自分のワークフローに最適な構成を見極める必要がある。本記事は、2026 年 5 月時点の Gemini プラットフォーム全体を、モデル系譜・プラン・料金・ベンチマーク・移行スケジュールの 5 軸で整理する完全ガイドだ。Claude Opus 4.7、ChatGPT GPT-5.5 と並ぶ、AI コーディング御三家の最終ピースを今日決着させる。

モデル系譜と廃止履歴 — なぜ Gemini 3.1 Pro が「複雑タスクの正解」になったのか
モデル系譜マップ — Pro / Flash / Flash-Lite / Nano の使い分け
ベンチマークで読む Gemini 3.1 Pro の実力
3 段階 Thinking と Deep Think Mini の使いこなし
プラン徹底比較 — Free / AI Plus / AI Pro / AI Ultra
API 料金 — Gemini Developer API と Vertex AI（現 Gemini Enterprise Agent Platform）
3D プリント業務に組み込む現実的な活用シナリオ
移行ガイド — 2.0 Flash 廃止と Pro 無料枠終了への対応
まとめ — メイカー視点でのプラン選定
参照

忍者AdMax

モデル系譜と廃止履歴 — なぜ Gemini 3.1 Pro が「複雑タスクの正解」になったのか

2026 年 2 月 19 日、Google DeepMind は Gemini 3.1 Pro を Preview として公開した。前世代の Gemini 3 Pro は 2026 年 3 月 26 日に廃止され、Vertex AI（現 Gemini Enterprise Agent Platform）のドキュメントには「gemini-3-pro-preview は提供終了。新規および既存プロジェクトは gemini-3.1-pro-preview を使用すること」と明記されている。

廃止が早かった理由は単純で、3.1 Pro が 3 Pro の能力を全方位で塗り替えたからだ。とくに抽象推論ベンチマーク ARC-AGI-2 では 77.1% を記録し、前世代の 2 倍以上、GPT-5.5 の 52.9% を 24 ポイント上回った。複雑な多段エージェントワークフローのために最適化されたモデルとして、Google 自身が「最も高度な推論モデル」と位置づけている。

ここで重要なのは、3.1 Pro は「次のメジャーバージョン」ではなく、3 系列の正統後継だという点だ。アーキテクチャは 3 Pro から発展しており、Deep Think という第 2 システム的な深い熟考プロセスを内蔵し、出力前に内部で複数の推論経路を展開する。プロンプトの組み立て方は 3 Pro と同じで良いが、思考レベルの制御が新しく加わった（後述）。

過去 1 年で消えたモデルを並べると、移行コストの大きさが見える。

モデル	公開	廃止 / 廃止予定
Gemini 1.5 Pro / Flash	2024-05	順次廃止済
Gemini 2.0 Flash	2024-12	2026-06-01 廃止予定
Gemini 3 Pro	2025-11 系	2026-03-26 廃止済
Gemini 2.5 Flash / Flash-Lite	2025 系	現行
Gemini 3.1 Pro	2026-02-19	現行（Preview）

「Gemini を使う」と言ったときに、3 ヶ月前と今では指すモデルが違うことがありうる。本記事のキャプチャ日（2026-05-15）時点では、Gemini 3.1 Pro Preview が事実上の最上位モデルであり、3 Pro 表記が残る記事やライブラリは即座に陳腐化する。

世代交代の速さは、Gemini の弱点でも強みでもある。Anthropic が Opus 4.5 から 4.7 まで 9 ヶ月かけているのに対し、Google は 3 Pro から 3.1 Pro まで実質 4 ヶ月で押し切った。同時に、廃止予告から実際の停止までの猶予期間も短く、3 Pro Preview は告知から廃止まで一ヶ月程度しか猶予がなかった。これはエンドユーザーにとっては「常に最新を使える」というメリットでもあるが、CI/CD パイプラインや業務システムにモデル ID を埋め込む開発者にとっては、四半期ごとのメンテナンスを前提とした運用設計が必要になる、というシビアな現実を示している。とくに Gemini 3.1 Pro を本番ワークロードに採用する場合、自動フォールバックの実装は強く推奨される。

モデル系譜マップ — Pro / Flash / Flash-Lite / Nano の使い分け

Gemini ファミリーは「重い思考向け Pro」「日常タスク向け Flash」「軽量・低コスト向け Flash-Lite」「オンデバイス Nano」の 4 階層で構成される。2026 年 5 月時点で API 経由で選べるのは次の構成だ。

モデル	現行バージョン	コンテキスト窓（入力）	用途
Gemini 3.1 Pro	Preview	1,000,000 token（出力 64K）	複雑推論、長大コード解析、エージェント
Gemini 2.5 Flash	GA	1,000,000 token	高速応答、定型タスク
Gemini 2.5 Flash-Lite	GA	1,000,000 token	大量バッチ、超低コスト
Gemini 2.0 Flash	2026-06-01 廃止予定	1,000,000 token	移行必須
Gemini Nano	デバイス	デバイス依存	Android / Pixel オンデバイス推論

「Gemini Ultra」という名称を見かけたら要注意で、これは旧 1.x 系列の最上位モデルを指す古い文脈だ。3.x 系列に Ultra は存在しない。同様に、Bard・Gemini Advanced・Duet AI といった旧称も現行 UI からは消えている（Bard と Gemini Advanced は Gemini App、Duet AI は Gemini for Workspace に統合済）。

メイカー視点での選び方は単純化できる。「設計レビューに 50 ファイルのプロジェクトを丸ごと投げたい」「Klipper config の論理矛盾を炙り出したい」など、深い推論が必要な場面では Gemini 3.1 Pro。一方、Etsy 商品の説明文を 200 件まとめて生成、メール返信のドラフトを高速で量産、というような場面では 2.5 Flash が圧倒的にコストパフォーマンスが良い。Flash-Lite はさらに 1 桁安く、API コスト最適化の最終手段になる。

Pro と Flash の使い分けで失敗しがちなのが「とりあえず Pro」という選択だ。Flash と Pro では入力単価で約 20 倍、出力単価で約 30 倍の差がある（モデル世代と階層による）。たとえば商品説明 1,000 件を Pro で生成すると数千円規模、Flash-Lite なら数百円規模で済む。月次バッチ処理を 3.1 Pro 一本で回すのは、贅沢を通り越して「本来必要のないコスト」を発生させているケースが多い。逆に、複雑な構造解析や CAD 仕様書のレビューを Flash に投げると、見落としが頻発して結局やり直しになる。「思考の質が必要なところに Pro、量と速度が必要なところに Flash」という分業を徹底するだけで、API コストは半分以下になる。

オンデバイスの Gemini Nano は、Pixel スマートフォンや一部の Chromebook に組み込まれており、API 経由では呼べない代わりに通信なしで動作する。3D プリント現場のような Wi-Fi が不安定な環境でのスマホアシスタント用途に向いている。ただし能力は限定的で、複雑な推論を要求しないこと。

ベンチマークで読む Gemini 3.1 Pro の実力

Google DeepMind のモデルカードと第三者ベンチマークから、現行モデルの相対位置を整理する。

ベンチマーク	Gemini 3.1 Pro	Claude Opus 4.7	GPT-5.5
ARC-AGI-2	77.1%	公開なし	52.9%
SWE-bench Verified	80.6%	64.3%	58.6%（Pro 換算）
GPQA Diamond	94.3%	約 87%（前世代）	約 89%
Terminal-Bench 2.0	68.5%	82.7%	69.4%
Humanity’s Last Exam	44.4%	公開なし	公開なし
LMArena Elo	1493	1503	1484

ここで読み取るべきは「抽象推論と理科系試験で Gemini 3.1 Pro が圧倒、ターミナル操作の自律タスクで Claude Opus 4.7 が依然優勢、人間嗜好の総合点では拮抗」という三つ巴の構図だ。LMArena Elo は人間ペア比較投票の指標で、わずか 19 ポイント差に 3 モデルがひしめき、もはや「最強」を断定できる単一モデルは存在しない。

メイカー業務に近い指標として、ARC-AGI-2 と SWE-bench は重要だ。ARC-AGI-2 は ARC Prize Foundation が運営する抽象推論テストで、初見のパズルに対する汎化能力を測る。Gemini 3.1 Pro の 77.1% は、人間の平均成績に近い水準まで到達しており、ジェネレーティブデザインや構造最適化のような「未見の問題に推論で対処する」タスクで差が出る。一方 Terminal-Bench は対話的なシェル操作の正答率で、Claude Opus 4.7 が 82.7% で抜きん出ている。Claude Code が CLI 環境で強い理由はここにある。

つまり、ベンチで判断するなら 3D モデルの応力解析や構造提案のような推論勝負には 3.1 Pro、Klipper config の編集や Linux サーバー操作には Claude Opus 4.7、という棲み分けが現実的だ。

GPQA Diamond の 94.3% という数字も注目に値する。これは博士課程相当の物理・化学・生物の難問セットで、人間の専門家でも 65% 程度が上限とされる。94.3% という水準は事実上「ほとんどの問題に正答できる」レベルで、材料工学に踏み込む 3D プリント研究や、レジン化学の議論を AI に相談する場面で実用に耐える精度が出る。Polymaker や BASF の技術データシートを読み込ませて配合の解釈を求める、といった使い方が現実的になった。

ベンチマークの読み方として注意すべきは、全ての指標が同じ意味の「強さ」を測っているわけではない点だ。Terminal-Bench は対話型シェル操作の正答率、SWE-bench は GitHub issue 解決率、ARC-AGI-2 は抽象推論パズル、GPQA は学術知識テストで、それぞれ要求される能力の質が違う。「LMArena が最高」と「SWE-bench で最高」は両立しないこともある。自分の業務がどのベンチに最も近いかを見極めることが、モデル選定の核心だ。

3 段階 Thinking と Deep Think Mini の使いこなし

Gemini 3 Pro 時代は思考モードが 2 段階（LOW / HIGH）だったが、Gemini 3.1 Pro では LOW / MEDIUM / HIGH の 3 段階になった。さらに HIGH モードでは「Deep Think Mini」と呼ばれる深層熟考が有効化される。

Thinking レベル	想定用途	出力レイテンシ	コスト傾向
LOW	短文要約、簡易 Q&A	速い	出力トークン少
MEDIUM	コードレビュー、議事録	中	中庸
HIGH（+ Deep Think Mini）	多段推論、設計検討	遅い	thinking token 課金で増加

Thinking token は出力トークンと同じ単価で課金される。コンテキスト 200K 未満であれば 1M token あたり 12 USD（約 1,890 円）。つまり HIGH モードで長い熟考をさせるほどコストが嵩む。Anthropic Opus 4.7 の xhigh effort モードと同じく、「常に最高」は持続不能で、用途別に切り替える運用設計が必須だ。

実用上の指針は次のとおり。

3D モデルの物理整合性チェック: HIGH（Deep Think Mini）— 重力方向、応力集中、印刷可能性を多段で検討
Etsy 商品ページ大量生成: LOW — テンプレートに埋めるだけの定型タスク
Klipper config レビュー: MEDIUM — 構文と論理整合の確認、深層推論まで不要
ジェネレーティブデザインのプロンプト練り直し: HIGH — 制約条件の重み付けが鍵

API での指定は thinking_config パラメータで行う。AI Studio の UI からはチャット内の「Thinking」ボタンで切り替えられる。

Deep Think Mini は Gemini 3.1 Pro の HIGH モード内で活性化される機能で、Google AI Ultra プランで提供される「Deep Think」（フル版）の軽量バリアントに位置づけられる。フル版 Deep Think はさらに長い熟考時間を要求し、ARC-AGI-2 で 77.1% を叩き出した実験設定もこちらに近い。日常業務ではフル Deep Think は重すぎるため、Deep Think Mini が「最高品質と現実的レイテンシの妥協点」として用意されている、と理解すると役割が見えやすい。

実運用で見落としがちなのが Thinking レベルとレスポンス時間のトレードオフだ。HIGH モードは 1 リクエストで数十秒、Deep Think Mini が深く動くと 1 分以上かかることもある。チャット UI で人間が待つ場合はまだしも、API でループ処理を回す場合はタイムアウト設計を見直す必要が出てくる。逆に、ストリーミング応答を使えば思考過程の途中段階を表示できるため、UI 上の体感速度を補える。

プラン徹底比較 — Free / AI Plus / AI Pro / AI Ultra

ユーザー向けの Gemini 利用プランは 4 階層だ。Gemini 3.1 Pro に高い制限でアクセスしたい場合、AI Pro 以上が現実的な選択肢になる。

プラン	月額（USD）	月額（円換算 ¥157.5/USD）	Gemini App コンテキスト	主な特典
Free	$0	¥0	制限あり（Flash / Flash-Lite 中心）	基本利用のみ
Google AI Plus	$7.99	約 ¥1,258	128K	200 AI credits（Flow / Whisk）、200GB ストレージ、NotebookLM 拡張
Google AI Pro	$19.99	約 ¥3,148	1M	Deep Research 20回/日、Gemini Code Assist、Veo 3.1、2TB Google One、スライド無制限
Google AI Ultra	$249.99	約 ¥39,373	1M	Deep Think、Gemini Agent、Project Mariner、Veo 3.1 + 音声、30TB ストレージ

為替レートは 2026-05-13 H.10 ベース 1 USD = 157.5 JPY を採用。Google の日本価格表示は別途公式サイトを参照してください。

メイカーの実用に直結するラインは AI Pro だ。Gemini 3.1 Pro へのアクセス（高い日次制限）、Code Assist 無料枠の拡張、NotebookLM Pro 解放、Veo 3.1 動画生成がこの 1 本に集約される。月 3,000 円台で Claude Pro（$20）と同価格帯であり、御三家比較の同条件レンジに収まる。

AI Ultra は「Gemini Agent（自律エージェント）」と「Deep Think（さらに深い熟考モード）」を含むが、月 4 万円弱はメイカー個人としては過剰投資になりがちだ。むしろ法人 / 研究機関向けの位置づけで、個人レベルでは Pro + API 従量課金の組み合わせの方が柔軟性が高い。

Plus と Pro の差はストレージ容量と機能制限の幅で説明できる。Plus の 200GB は写真と書類のバックアップには十分だが、4K 動画素材や 3D スキャンの点群ファイルを抱え込むには厳しい。Pro の 2TB なら数年分のプロジェクトファイルを一元管理でき、Google ドライブ上での共有も含めて運用が楽になる。一方で、Pro の真価は「Gemini App のコンテキスト窓が 1M token に開放される」点にある。Plus の 128K では大型コードベースや長大なドキュメントを一括投入できないため、業務用途では Pro 以上が事実上の最低ラインだ。

NotebookLM の利用権についても、無料プランでは Sources 数が制限される一方、AI Pro / Ultra では最大 300 Sources まで投入できる。設計マニュアル PDF、過去のフォーラムスレッド、YouTube 動画のトランスクリプトを 1 つのノートブックに集約して横断検索する、というワークフローを実現するには、この拡張が不可欠だ。NotebookLM だけで月 $20 の元を取れるユーザーは少なくない。

API 料金 — Gemini Developer API と Vertex AI（現 Gemini Enterprise Agent Platform）

ユーザー向けプランとは別に、API 経由で Gemini 3.1 Pro を呼ぶ場合の料金体系がある。2026 年 4 月 1 日以降、Pro モデルは無料枠が完全に廃止され、Flash / Flash-Lite だけが減量無料枠を維持している。

モデル	入力（USD/1M token、<200K context）	出力（USD/1M token）
Gemini 3.1 Pro	2.00	12.00
Gemini 2.5 Flash	公式ページで確認推奨	公式ページで確認推奨
Gemini 2.5 Flash-Lite	0.10	0.40

200K token を超える長大コンテキストでは入出力単価が上がる階層課金が適用されます。

Gemini Developer API（ai.google.dev）と Vertex AI（現 Gemini Enterprise Agent Platform）の単価は同一だが、Vertex 側は最初のトークンから課金される。新規 Google Cloud アカウントは $300（約 ¥47,250）の 90 日有効クレジットが付与され、Gemini API 呼び出し、ファインチューニング、評価ジョブに充当できる。

商用やチーム利用なら Vertex 側で IAM・ロギング・SLA を一括管理できるメリットがある一方、個人開発や試作段階では Gemini Developer API のシンプルさが勝る。Cursor や Antigravity から呼ぶ場合は前者、Cloud Run や GKE に組み込むなら後者、という大まかな住み分けで間違えにくい。

3D プリント業務に組み込む現実的な活用シナリオ

ベンチマークだけで道具は決まらない。メイカー視点で Gemini 3.1 Pro が刺さるユースケースを具体化する。

ジェネレーティブデザインのプロンプト生成と評価: 設計要件（荷重・取り付け点・素材）を渡して Fusion 360 / nTop / Backflip AI に投入する仕様書を Gemini 3.1 Pro に書かせる。1M token の窓に過去設計 30 件をまとめて投入し、類似案件を引いて出力させる、という運用が現実的になった。
3D スキャン後のメッシュ修復方針策定: Revopoint MIRACO や iPhone Pro Max で取得した点群について、欠損部位の優先度判定や、AI メッシュ修復（Hyper3D Rodin / Meshy Remesh）に渡す指示を組み立てる。ARC-AGI-2 で示された抽象推論力が、3D 構造の補完判断と相性が良い。
Klipper config の総点検: 1M token のコンテキストに printer.cfg と関連 macro を全部投入し、矛盾と推奨改善を抽出させる。複雑系の場合は HIGH モードで Deep Think Mini を有効化。
Etsy / Booth の商品説明バッチ生成: ここはコスト最適化が支配的なので、3.1 Pro ではなく 2.5 Flash-Lite に流す。同じファミリーのモデルで切り替えが透過的なのが Gemini の利点だ。
NotebookLM への素材投入: 設計マニュアル PDF・YouTube 動画・関連論文を NotebookLM ノートブックに投入し、Gemini App から横断検索する（Notebooks in Gemini × NotebookLMで詳細解説予定）。

「Gemini 3.1 Pro で深く考えさせ、Flash-Lite で量産する」というハイブリッド運用が、API コストとモデル品質のバランス点になる。

実際にこのハイブリッド運用を組むときは、プロンプトテンプレートを 2 種類用意するのが定石だ。Pro 向けには「文脈・前提・制約・推論ステップの明示」を含めた長尺のテンプレート、Flash 向けには「テンプレート埋め込み型の短文指示」に分ける。Gemini のモデル間で API インターフェースが統一されているため、コードレベルではモデル名を切り替えるだけで動く。Claude のように Sonnet と Opus でプロンプト設計の流儀が変わる、という現象がほとんど起きないのは Gemini の地味だが大きな利点だ。

移行ガイド — 2.0 Flash 廃止と Pro 無料枠終了への対応

2026 年後半に向けて、現役モデルの構成は再び動く。3 つの期限を必ず押さえておくこと。

期限	内容	対応
2026-04-01（完了）	Pro モデルの無料枠廃止	Flash / Flash-Lite で済む箇所を選別、有償枠を確保
2026-06-01	Gemini 2.0 Flash 廃止	2.5 Flash / Flash-Lite に移行
2026-07-01	非グローバルエンドポイントで Gemini 3 系列の GA 価格適用	地域別エンドポイント利用時は新料金を再見積もり

過去 1 年で 3 回のモデル世代交代が起きた事実から、コードに具体的モデル ID をハードコードしない設計原則を改めて推す。gemini-3-pro-preview を書いていたコードは 2026-03-26 に黙って動かなくなったはずだ。環境変数化、フィーチャーフラグ、API リクエスト失敗時の自動フォールバック（3.1 Pro 不可 → 2.5 Flash）を組み込んでおくと、半年後の世代交代に耐える。

NotebookLM や Antigravity といったクライアント側アプリも Gemini 3.1 Pro に切り替わる順序が違うので、デスクトップ版と Web 版の差分にも注意したい。Gemini App は Plus / Pro / Ultra で順次拡大配信され、NotebookLM は Pro / Ultra 限定で 3.1 Pro が解放されている。

まとめ — メイカー視点でのプラン選定

本連載で Claude Opus 4.7、本連載で ChatGPT GPT-5.5 を扱った視点から、Gemini 3.1 Pro は次の 3 点で独自の役割を持つ。

抽象推論で頭一つ抜けている: ARC-AGI-2 77.1% は他陣営を上回り、ジェネレーティブデザインや構造最適化など「未見の問題への汎化」が必要な業務で強い。
1M token コンテキストの取り回し: 大規模リポジトリ、設計資料群、過去案件 30 件一括投入を「素のチャット」で済ませられる手軽さは突出している。Antigravity や AI Studio の UI もここに最適化されている。
モデル系譜の世代交代速度: 4 ヶ月で 2 世代進む速度感は他陣営より明確に速い。逆に言えば、ハードコードや古い記事の情報を信じる運用は破綻する。

予算別の推奨構成は次のとおり。

個人実験〜試作（月 3,000 円）: Google AI Pro $19.99 単体。Gemini 3.1 Pro を制限付きで存分に使い、API は無料枠（Flash / Flash-Lite）でまかなう。
準業務利用（月 1 万円台）: Google AI Pro + Gemini Developer API 従量。バッチ処理は Flash-Lite、推論は 3.1 Pro に流す。Cursor などのエディタ連携で生産性を底上げ。
法人 / 研究（月 4 万円超）: Google AI Ultra または Vertex AI（Gemini Enterprise Agent Platform）契約。IAM / ロギング / SLA を含む統合管理。

本連載序盤の関連回とClaude / ChatGPT と組み合わせる戦略は、シリーズ最終日（Claude vs ChatGPT vs Gemini 比較、2026-05-24 公開予定）の「三国志比較」で総決算する。明日は Gemini 3.1 Pro の真価を引き出すプロンプト設計の話に入る。1M token の窓を活かすには、命令の組み立て方そのものが Claude や ChatGPT とは異なる流儀を要求する。