MENU
知識がなくても始められる、AIと共にある豊かな毎日。

AIモデル ベンチマーク表 2026/5 – AI Model Benchmark | swiftwand.ai

swiftwand

📊 AIモデル ベンチマーク表 (2026年5月時点)

主要LLM (GPT-5.5/Claude Opus 4.7/Gemini 3.1 Pro/DeepSeek V4) のベンチマーク・価格・特徴を一覧。用途別のおすすめも掲載。

モデルリリースMMLUSWE-benchGPQA DiamondHumanEvalMATHコンテキスト
Claude Opus 4.7Anthropic 2026/390.580.874.592.087.0200K
Claude Sonnet 4.6Anthropic 2026/287.273.769.589.583.4200K
Claude Haiku 4.5Anthropic 2026/178.542.055.078.272.5200K
GPT-5.5OpenAI 2026/491.477.376.894.191.2256K
GPT-5OpenAI 2025/1288.068.571.291.087.5256K
Gemini 3.1 ProGoogle 2026/488.565.072.188.089.02M
Gemini 3.1 FlashGoogle 2026/480.050.062.082.578.01M
DeepSeek V4DeepSeek 2026/487.580.673.591.588.5128K
📌 MMLU=知識/推論 / SWE-bench=コード修正 / GPQA=科学・数学 / HumanEval=コード生成 / MATH=数学問題。黄色は最高値。各モデル公式発表値ベース。
モデルInput (per 1M)Output (per 1M)Batch割引Cache割引
Claude Opus 4.7$5.00$25.0050%90%
Claude Sonnet 4.6$3.00$15.0050%90%
Claude Haiku 4.5$1.00$5.0050%90%
GPT-5.5$5.00$30.0050%
GPT-5$1.25$10.0050%
Gemini 3.1 Pro$2.00$12.0050%
Gemini 3.1 Flash-Lite$0.25$1.5050%
DeepSeek V4$0.27$1.10
📌 価格は2026年5月時点 (USD)。Anthropicの Prompt Cache は対応モデルで実質9割引。Batch APIは50%割引で全Anthropic/OpenAI/Google対応。
用途1位2位コスパ重視
コード生成・修正Claude Opus 4.7DeepSeek V4DeepSeek V4
論文・長文分析Gemini 3.1 Pro (2M)Claude Opus 4.7Gemini 3.1 Flash
数学・科学GPT-5.5Gemini 3.1 ProDeepSeek V4
マルチモーダル (画像入力)GPT-5.5Gemini 3.1 ProClaude Sonnet 4.6
日本語の自然さClaude Opus 4.7GPT-5.5Claude Sonnet 4.6
汎用チャットClaude Sonnet 4.6GPT-5Claude Haiku 4.5
大量バッチ処理DeepSeek V4Gemini 3.1 Flash-LiteDeepSeek V4
リアルタイム応答Claude Haiku 4.5Gemini 3.1 FlashGemini 3.1 Flash-Lite

このツールは 無料ツール集 の一つです。実際のコスト試算は AI API料金計算機 へ。

記事URLをコピーしました