Qwen3.7-Max 完全レビュー:アリババ最強の AI モデル、世界ランク第 5 位

Qwen3.7-Max 完全レビュー:アリババ最強の AI モデル、世界ランク第 5 位

Qwen3.7-Max とは?

Qwen3.7-Max は、アリババグループが 2026 年 6 月に最新リリースしたフラッグシップ級の大規模言語モデルであり、通義千問(Qwen)シリーズの中でこれまでにない最高性能を誇るクローズドソースモデルです。Artificial Analysis Intelligence Index v4.0 の権威ある評価において、Qwen3.7-Max は推論モードで 56.6 ポイントを記録し、世界第 5〜7 位にランクイン。中国の大規模言語モデルとしては最高の順位を獲得し、国際的な AI 分析メディア The Batch からも「Google 第 3 位に挑む有力な競争者」と称されています。

FreeAITool が以前紹介した Qwen3 Coder(#035) とは異なり、こちらはコード生成に特化したオープンソースモデルでした。一方、Qwen3.7-Max は汎用フラッグシップモデルとして位置づけられており、パラメータ規模やトレーニング方法は公開されていません。この変化は、アリババが業界のトレンドに沿って、オープンソース戦略からクローズドソースの商用運営へと移行しつつあることを示しています。

アリババの最新フラッグシップモデル

Qwen3.7-Max の主な仕様は以下の通りです:

仕様パラメータ
入力上限100 万トークン
出力上限64,000 トークン
生成速度208.3 トークン/秒(世界第 3 位)
幻覚率23%(最先端モデルの中で最低)
推論モード対応(数学・論理推論能力を強化)
ツール呼び出し対応
プロンプトキャッシュ対応
API 互換OpenAI API、Anthropic API

なぜオープンソースからクローズドソースへ?

アリババの Qwen シリーズは、これまでオープンソースコミュニティにおいて重要な貢献者であり続けてきました。Qwen、Qwen1.5、Qwen2、Qwen2.5 から Qwen3 Coder まで、オープンソース路線はアリババの強力な開発者エコシステムとブランド認知の構築に貢献してきました。しかし、Qwen3.7-Max および同時期の Qwen3.6-Max-Preview、Qwen3.6-Plus はいずれもクローズドソースモデルとなっています。

この転換の背景にある理由はそれほど難しくありません:

  • モデル能力がオープンソースモデルの「スイートスポット」に近づいた、あるいは超えた:モデルのパラメータ数が数百億から数千億レベルに達すると、オープンソースのコスト(計算リソース、帯域幅、コンプライアンスリスク)が大幅に上昇します。一方、クローズドソースなら API の従量課金でより良い商用リターンを得られます
  • API 価格が非常に競争力がある:Qwen3.7-Max の入力価格は 100 万トークンあたり $2.50 で、GPT-4o の $2.50〜5.00 や Claude Sonnet の $3.00 を大きく下回ります。これにより、クローズドソースモデルも市場で十分に魅力的です
  • コア技術の秘密を守る:トレーニング方法で採用されている「デカップルド強化学習」などのイノベーション技術はアリババのコアコンペティティであり、パラメータを公開しないことで競争優位を維持できます

オープンソースモデルに関心がある方には、以前の AI リーダーボードランキング記事(#033) で、より包括的なオープンソースモデルの比較を提供しています。

性能評価:世界ランク第 5 位

Artificial Analysis Intelligence Index ランキング

Artificial Analysis は、世界で最も権威のある AI モデル評価プラットフォームの一つです。Intelligence Index v4.0 は、推論、コーディング、指示追従、多言語など複数の次元を総合的に評価しています。Qwen3.7-Max はこの評価で以下の成績を収めました:

  • 推論モード総合スコア:56.6 ポイント
  • 世界ランク:第 5〜7 位(他のモデルが推論モードを有効にしているかによって変動)
  • 中国語モデルランク:第 1 位

このランキングは、Qwen3.7-Max が Google の一部のフラッグシップモデル(Gemini 3.5 Flash など)を上回り、Claude Sonnet 4.6 や GPT-4.1 などのトップレベルモデルに迫っていることを意味します。中国企業が開発したモデルとして、この成績は画期的なものです。

📌 出典:The Batch #357 詳細記事 および Artificial Analysis Qwen3.7 Max 分析ページ

速度:世界第 3 位(208 トークン/秒)

生成速度の面では、Qwen3.7-Max は 208.3 トークン/秒の成績で世界第 3 位にランクイン。GPT-OSS 120B(313 トークン/秒)と GPT-OSS 20B(238 トークン/秒)に次ぐ位置です。

速度は実際のアプリケーションにおいて極めて重要です:

  • リアルタイム対話のスムーズさ:208 トークン/秒は、1 秒あたり約 150〜160 文字を生成できることを意味し、ユーザーは遅延をほとんど感じません
  • バッチ処理の効率化:大量のコンテンツ生成が必要なシーン(一括翻訳、ドキュメント要約など)では、速度の優位性がそのまま時間コストの節約につながります
  • API 呼び出しコストの低減:生成速度が速ければ、同じ API タイムアウト時間内により多くのタスクを完了できます

幻覚率:最先端モデルの中で最低(23%)

幻覚(Hallucination)とは、大規模言語モデルが不実な情報を生成する現象であり、現在の AI アプリケーションが直面する最大の課題の一つです。Qwen3.7-Max の幻覚率はわずか 23% で、すべての最先端モデルの中で最低を記録しました。

これは何を意味するのでしょうか。モデルに専門的な質問をさせた場合を例に考えてみましょう:

  • 他の最先端モデルの幻覚率が約 30〜40% だとすると、10 回の回答のうち 3〜4 回に不正確な情報が含まれる可能性があります
  • 一方、Qwen3.7-Max は 10 回の回答のうち約 2〜3 回しか不正確でない可能性がありません

医療相談、法務支援、金融分析など、高い信頼性が求められるシーンでは、低幻覚率はモデル選択における重要な考慮事項です。

Gemini 3.5 Flash、Claude Sonnet 4.6 との比較

次元Qwen3.7-MaxGemini 3.5 FlashClaude Sonnet 4.6
Intelligence Index56.6〜55〜58
速度(トークン/秒)208〜180〜150
幻覚率23%〜30%〜28%
入力上限100 万トークン100 万トークン20 万トークン
API 入力価格$2.50/M トークン$1.25/M トークン$3.00/M トークン
コンテキスト保持ラウンド間で推論テキストを保持部分的に対応対応

総合的に見ると、Qwen3.7-Max は速度と幻覚率の面で明確な優位性を持ち、総合知能ランキングでは Claude Sonnet 4.6 に近いもののわずかに下回っています。生成速度と正確性の高いアプリケーションをお探しなら、Qwen3.7-Max は非常に検討に値するオプションです。

コア機能

100 万トークンのコンテキストウィンドウ

Qwen3.7-Max は最大 100 万トークンのコンテキスト入力に対応しています。つまり、以下のようなことが可能です:

  • 本を一冊丸ごとアップロードして分析:20 万文字の中国語小説は約 40〜50 万トークンが必要ですが、Qwen3.7-Max なら一度に処理できます
  • 大規模コードベースの分析:数百ファイルを含むコードプロジェクトを完全に入力でき、モデルは全体構造を理解できます
  • 超長会議記録の処理:数時間に及ぶ会議の逐語稿をそのままモデルに渡し、要約や ToDo を生成できます

実際の使用では、コンテキストを 50 万トークン以内に抑えることを推奨します。これにより、最適な応答速度と正確率が得られます。この閾値を超えると、モデルがコンテキストの前半部分の情報に対する注意度が低下する可能性があります。

推論モードとツール呼び出し

Qwen3.7-Max の推論モード(Reasoning Mode)は、数学計算、論理推論、複雑な問題分析におけるモデルの能力を大幅に強化しています。推論モードを有効にすると、モデルは回答前に複数のステップで考えるプロセスを行い、人間の「考えてから答える」動作に似ています。

さらに、モデルはツール呼び出し(Tool Calling)機能にも対応しており、会話の中で外部 API、検索エンジン、データベースなどのツールを自動的に呼び出し、リアルタイムの情報を取得した上で回答を提示できます。以下のシーンで特に役立ちます:

  • リアルタイム情報検索:現在の天気、株価など最新データが必要な質問に対して、モデルは自動的に検索ツールを呼び出せます
  • コード実行:コード実行環境と組み合わせることで、モデルはコードを書いて実行し、答えを検証できます
  • マルチステップタスクの分解:複雑なタスクを複数のサブタスクに分解し、異なるツールを順番に呼び出して完了できます

プロンプトキャッシュの高速化

Qwen3.7-Max はプロンプトキャッシュ機能をサポートしており、繰り返し使用されるシステムプロンプトや長いコンテキストについて、キャッシュメカニズムを通じてコストと遅延を大幅に削減できます:

  • キャッシュヒット価格:わずか $0.25 / 100 万トークン(通常価格の 1/10)
  • 適用シーン:固定のシステムプロンプト、繰り返し使用するナレッジベースドキュメント、同じテンプレートでバッチ処理するデータ
  • 高速化効果:キャッシュヒットしたリクエストの応答速度は、通常のリクエストより 2〜3 倍高速です

カスタマーサービスボットやバッチドキュメント処理など、大量の繰り返しリクエストが含まれるアプリケーションシナリオでは、プロンプトキャッシュを上手に活用することで API コストを大幅に削減できます。

ラウンド間で推論テキストを保持

推論モードを有効にしたマルチラウンド会話において、Qwen3.7-Max は各ラウンドの推論プロセステキストを保持し、最終回答のみを残すわけではありません。これにより、モデルは後の会話で以下が可能になります:

  • 以前の思考パスを継続:ユーザーが後の会話で「なぜ?」と追问した場合、モデルは以前の推論プロセスを参照してより深い解説を提供できます
  • 以前の誤りを修正:ユーザーが回答の問題点を指摘した場合、モデルは既存の推論をベースに修正でき、最初からやり直す必要がありません
  • コンテキストの一貫性を維持:ラウンドを超えた推論テキストにより、モデルは会話の論理的な一貫性を維持できます

OpenAI/Anthropic API にネイティブ対応

Qwen3.7-Max の API インターフェースは、OpenAI API と Anthropic API の仕様にネイティブ対応しています。つまり:

  • コードを変更せずにモデルを切り替え可能:既存のアプリケーションが OpenAI または Anthropic SDK を使用している場合、base_urlapi_key を変更するだけで Qwen3.7-Max を利用できます
  • 主流の開発フレームワークに対応:LangChain、LlamaIndex、AutoGen などのフレームワークが直接接続できます
  • 移行コストを最小化:すでに他のモデル API を使用しているチームにとって、Qwen3.7-Max への移行作業は最小限に抑えられます
# OpenAI SDK 互換呼び出し例
from openai import OpenAI

client = OpenAI(
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
    api_key="あなたのアリババクラウドAPI Key",
)

response = client.chat.completions.create(
    model="qwen3.7-max",
    messages=[
        {"role": "system", "content": "あなたはプロフェッショナルなAIアシスタントです。"},
        {"role": "user", "content": "量子コンピューティングの基本原理を説明してください。"},
    ],
    max_tokens=4096,
)

print(response.choices[0].message.content)

利用方法

方法 1:Qwen Chat で無料利用(初心者におすすめ)

コードを書かずに Qwen3.7-Max を体験したいユーザーにとって、最も直接的な方法は Qwen Chat をオンラインで利用することです。

利用手順:

  1. qwen.ai にアクセス
  2. 携帯電話番号またはメールアドレスでアカウント登録
  3. ログイン後、チャット画面で Qwen3.7-Max モデルを選択
  4. 入力欄に質問を入力するか、ファイルをアップロード

無料利用の制限:

  • 1 日あたりの無料枠があります(具体的な額はアカウントレベルに応じて変動)
  • カスタムシステムプロンプトの詳細設定はサポートされていません
  • 大量の API 呼び出しが必要な自動化シーンには適していません

個人ユーザーが情報検索、ドキュメント翻訳、クリエイティブコンテンツ生成などの用途で使う場合、Qwen Chat の無料枠で十分なことがほとんどです。

方法 2:アリババクラウド百錬 API 呼び出し

開発者や企業ユーザーにとって、アリババクラウド百錬プラットフォーム経由で API を呼び出すのが、より柔軟で強力な選択肢です。

有効化手順:

  1. アリババクラウドアカウントを登録(アリババクラウド公式サイト
  2. 百錬プラットフォームコンソール にアクセス
  3. 「通義千問」サービスを有効化し、実名認証を完了
  4. API Key を作成
  5. SDK または REST API 経由で呼び出し

Python SDK 呼び出し例:

# SDK をインストール
# pip install dashscope

import dashscope
from dashscope import Generation

dashscope.api_key = "あなたのAPI Key"

response = Generation.call(
    model="qwen3.7-max",
    prompt="人工知能の未来について短い文章を書いてください。約200文字で。",
    max_tokens=2048,
)

if response.status_code == 200:
    print(response.output.text)
else:
    print(f"エラー: {response.code} - {response.message}")

方法 3:OpenAI API 互換のサードパーティツール連携

LangChain、LlamaIndex、AutoGen などの開発フレームワークを使用している場合、OpenAI 互換モードで直接 Qwen3.7-Max に接続できます:

# LangChain 統合例
from langchain_openai import ChatOpenAI

llm = ChatOpenAI(
    model="qwen3.7-max",
    openai_api_key="あなたのAPI Key",
    openai_api_base="https://dashscope.aliyuncs.com/compatible-mode/v1",
    temperature=0.7,
)

response = llm.invoke("2026年に注目すべき5つのAIトレンドを挙げてください。")
print(response.content)

この方法は、OpenAI エコシステムの経験があり、新モデルを素早く導入したい開発者に特に適しています。

価格詳細

API 価格比較

Qwen3.7-Max のアリババクラウド百錬プラットフォームでの価格は以下の通りです:

項目価格($ / 100 万トークン)
入力$2.50
キャッシュヒット入力$0.25
出力$7.50
混合コスト(7:2:1 比率)〜$2.125

他の主流モデルとの比較:

モデル入力価格出力価格混合コスト(約)
Qwen3.7-Max$2.50$7.50〜$2.125
GPT-4o$2.50-5.00$10.00-15.00〜$4.50
Claude Sonnet 4.6$3.00$15.00〜$4.80
Gemini 3.5 Flash$1.25$5.00〜$1.75

価格から見ると、Qwen3.7-Max の入力価格は GPT-4o と同等ですが、出力価格は GPT-4o の半分です。総合的なコストパフォーマンスでは、Qwen3.7-Max が GPT-4o や Claude Sonnet 4.6 を明らかに上回り、Gemini 3.5 Flash よりわずかに高くなっています。

キャッシュヒットのコストメリット

Qwen3.7-Max のキャッシュヒット入力価格はわずか $0.25 / 100 万トークンで、通常入力価格の 1/10 です。以下の状況に該当する場合、キャッシュを上手に活用することで大幅なコスト削減が可能です:

  • 固定システムプロンプト:毎回のリクエストで同じ system prompt を送信する場合、初回は通常課金ですが、以降はキャッシュヒットで割引
  • ナレッジベースドキュメント:参照ドキュメントをコンテキストとして入力し、繰り返し使用する際にキャッシュ特典を享受
  • バッチデータ処理:大量の類似データに同じ処理テンプレートを使用すると、キャッシュヒット率が非常に高くなります

混合コスト比率を 70% 入力、20% キャッシュヒット、10% 出力と仮定すると:

実際のコスト = 70% × $2.50 + 20% × $0.25 + 10% × $7.50
          = $1.75 + $0.05 + $0.75
          = $2.55 / 100 万トークン

キャッシュヒット率を最適化することで、コストをさらに抑えられます。

無料利用の制限

Qwen Chat は Qwen3.7-Max の無料利用機会を提供していますが、以下の制限があります:

  • 1 日の無料枠:具体的な額はアリババクラウドがアカウントタイプに応じて動的に調整します。通常、個人の日常利用には十分です
  • 同時実行数の制限:無料ユーザーの同時リクエスト数に制限があり、高同時実行シーンには適していません
  • 機能の制限:一部の高機能(カスタム system prompt、ツール呼び出し設定など)は API でのみ利用可能です

安定した大量呼び出しが必要な企業ユーザーには、百錬プラットフォーム API の直接利用をおすすめします。

トレーニング方法の裏側

デカップルド強化学習

Qwen3.7-Max のトレーニング方法における最大のイノベーションは、「デカップルド強化学習」アーキテクチャの採用です。従来の強化学習方法では、タスク定義、ツール呼び出しフレームワーク、結果バリデーターを一緒にトレーニングするのが一般的でした。これにより、モデルは特定の設定の「近道」を学習しやすく、新しいシーンに直面した際の汎化能力が不足していました。

アリババのデカップルドアプローチは、3 つのコアコンポーネントを分離してトレーニングします:

  1. タスクコンポーネント:モデルが完了すべきタスク目標と制約条件を定義
  2. ツール呼び出しフレームワーク:モデルが使用可能なツールの種類と呼び出し方法を定義
  3. バリデーター:モデルの出力が期待通りかを評価

複数のタスク、フレームワーク、バリデーターの組み合わせでトレーニングすることで、モデルは特定のトレーニング環境の記憶ではなく、より汎用的な推論能力を習得しました。この方法により、未知のシーンにおけるモデルのパフォーマンスが大幅に向上しています。

内部 Agent テスト:attention カーネルの自律最適化

内部テストにおいて、Qwen3.7-Max は印象的な自律 Agent 能力を発揮しました。attention カーネル(注意核心)最適化タスクでは、モデルが以下を達成しました:

  • 35 時間以内に自律的に 1,158 回のツール呼び出しを完了
  • 432 回のコード評価と反復を実施
  • 最終的にコード実行速度を 10 倍に向上

このプロセス全体で、モデルは「既存コードの分析 → 最適化案の提案 → 新コードの作成 → テスト検証 → 反復最適化」という完全なフローを自律的に計画し、ほとんど人間の介入を必要としませんでした。これは、Qwen3.7-Max が複雑なエンジニアリングタスクにおける自律的な意思決定と実行能力を十分に示しています。

FreeAITool の他の Qwen 記事との比較

#035 Qwen3 Coder との比較(オープンソース vs クローズドソース)

FreeAITool は以前、Qwen3 Coder(#035) を詳しく紹介しました。こちらはコード生成に特化したオープンソースモデルです。両者の主な違いは以下の通りです:

次元Qwen3 Coder (#035)Qwen3.7-Max (#102)
モデルタイプオープンソースクローズドソース
主なポジショニングコード生成と補完汎用フラッグシップモデル
パラメータ公開一部公開未公開
利用方法ローカルデプロイ可能API/Qwen Chat のみ
ベストシーンIDE コード補完、コード生成対話、分析、マルチモーダルタスク
コスト無料(自デプロイの計算リソースコスト)API 課金 / Qwen Chat 無料枠

簡単に言えば、Qwen3 Coder はローカルデプロイが必要でコードシーンに特化したニーズを持つ開発者に適しています。一方、Qwen3.7-Max は強力な汎用機能が必要で、インフラ管理をしたくないユーザーに適しています。

#033 AI リーダーボードランキング更新との比較

以前の AI リーダーボード記事(#033) では、大規模言語モデルの総合ランキングシステムを構築しました。Qwen3.7-Max の登場により、このランキングの中国語モデル最高得点が更新されます。読者の皆様は、本記事と以前のリーダーボード記事を対照して読むことで、現在の AI モデルの競争状況を把握することをおすすめします。

まとめとおすすめ

Qwen3.7-Max は、アリババが 2026 年に送り出した重要な作品です。中国の大規模言語モデルの最高水準を代表するだけでなく、グローバルな AI 競争でも上位を占めています。

以下のユーザー層に Qwen3.7-Max をおすすめします:

  • 🟢 中国語コンテンツクリエイター:中国語の理解と生成において、Qwen3.7-Max は自然な言語優位性を持ち、幻覚率が低く、コンテンツ品質が高い
  • 🟢 API コストに敏感な開発者:GPT-4o や Claude Sonnet と比較して、Qwen3.7-Max のコストパフォーマンスは際立っており、API 完全互換
  • 🟢 長コンテキスト分析が必要な研究者:100 万トークンのコンテキストウィンドウは、ほとんどのモデルの 2〜5 倍
  • 🟢 エンタープライズアプリケーション:低幻覚率とツール呼び出し能力により、信頼性の高いビジネスアプリケーションの構築に適しています

以下の場合は他のソリューションを検討してください:

  • 🔴 完全なローカルデプロイが必要で、データを外部に出したくないシーン:Qwen3 Coder などのオープンソースモデルや、Ollama でデプロイ可能なオープンソースモデルを検討
  • 🔴 予算が極めて限られている個人プロジェクト:Gemini 3.5 Flash の API 価格はより低く、より generous な無料枠があります
  • 🔴 極限の推論能力を追求:Claude Sonnet 4.6 は総合知能ランキングで依然としてリードしています

クイックスタートリンク:

v261