2026年LLM API价格对比：OpenAI/Claude/Gemini/DeepSeek/Qwen注册与套餐推...

一、2026 年价格战趋势：降价风暴继续

1. 旗舰模型”平民化”

OpenAI GPT-4.1 定价仅为 GPT-4o 的 1/7（输入 $2 vs $14/百万tokens），性能却全面超越
Claude 4 Sonnet 在性能接近 GPT-4o 的前提下，价格仅为前代 Claude 3.5 Opus 的 1/5
Google Gemini 2.5 Pro 支持超长上下文（1M tokens），但输入定价仅 $3.5/百万

2. 国产模型”免费额度”持续扩大

火山引擎豆包 Lite 持续免费，Pro 版降价 40%
通义千问 Qwen3 系列：Qwen3-Turbo 完全免费，Qwen3-Plus 仅 0.002 元/千 tokens
百度文心 4.5：每月 100 万 tokens 免费额度

3. 免费额度变化

厂商	2025年免费额度	2026年免费额度	变化
OpenAI	$18 新用户	$18 新用户	→ 持平
Google	15 RPM 免费	Gemini 2.5 Flash 免费额度大幅提升	⬆️
Anthropic	$5 新用户	$5 新用户	→ 持平
字节火山	新用户送 500 万 tokens	新用户送 1000 万 tokens	⬆️
阿里云	3 个月免费试用	Qwen3-Turbo 永久免费	⬆️
百度	有限免费	文心 4.5 每月 100 万 tokens	⬆️

二、性价比PK:谁是真香?谁是智商税?

模型类型	代表模型	适用场景	性价比公式
国产轻量级	Qwen3-Turbo / 豆包 Lite	简单对话、高频问答	免费 × 高并发 = 最优解
国产高端	Qwen3-Max / DeepSeek-R1	复杂逻辑、代码生成	GPT-4 级性能 × 价格仅 1/10
国际性价比款	GPT-4.1-mini / Gemini 2.5 Flash	多语言翻译、短文本生成	低价 × 谷歌/微软生态兼容性
国际旗舰款	Claude 4 Opus / GPT-4.1	学术研究、长文本创作	最高精度 × 成本仍可控（对比旧旗舰）

隐藏成本提示:

并发限制: 例如 TPM（每分钟 token 数）和 RPM（每分钟请求数），低价模型可能限制吞吐量，需额外购买配额。
长文本成本: 处理 38 万字符的超长文本（如法律合同解析），需选择支持 256K+ 上下文的模型（如 Gemini 2.5 Pro 支持 1M tokens），否则可能因分片处理导致费用翻倍。
缓存命中: OpenAI 的 Prompt Caching 可节省 50% 的输入成本，Claude 也有类似机制——善用缓存比选便宜模型更有效。

三、选型决策树：按场景快速匹配

你的主要场景是？
├── 📝 简单对话/客服问答
│   └── 选: 豆包 Lite（免费） 或 Qwen3-Turbo（免费）
│
├── 💻 代码生成/辅助开发
│   ├── 预算充足 → Claude 4 Sonnet（代码能力最强）
│   └── 追求性价比 → Qwen3-Coder / GPT-4.1-mini
│
├── 📊 数据分析/长文档处理
│   ├── 文档 < 128K → GPT-4.1（精度高）
│   └── 文档 > 128K → Gemini 2.5 Pro（1M 上下文，唯一选择）
│
├── 🌍 多语言翻译
│   └── 选: Gemini 2.5 Flash（多语言最强 + 低价）
│
└── 🔬 科研/复杂推理
    ├── 首选: Claude 4 Opus（推理能力最强）
    └── 平替: DeepSeek-R1（价格 1/7，推理接近）

四、完整的大型语言模型(LLM)API价格表

数据更新于 2026年5月24日，具体以厂商最新公告为准。 以下价格为每百万 token 的输入和输出成本（单位: ¥），汇率按 1 USD ≈ 7.2 CNY 计算。

4.1 国际厂商

模型	平台	输入 ¥/百万 token	输出 ¥/百万 token	链接
GPT-4.1	OpenAI	14.4	57.6	OpenAI GPT-4.1
GPT-4.1-mini	OpenAI	2.88	11.52	OpenAI GPT-4.1-mini
o3	OpenAI	72	288	OpenAI o3
o3-mini	OpenAI	7.92	31.68	OpenAI o3-mini
Claude 4 Sonnet	Anthropic	21.6	108	Anthropic Claude 4
Claude 4 Opus	Anthropic	108	540	Anthropic Claude 4
Claude 3.5 Haiku	Anthropic	5.76	28.8	Anthropic Claude 3.5 Haiku
Gemini 2.5 Pro	Google	25.2	90	Google Gemini
Gemini 2.5 Flash	Google	2.16	8.64	Google Gemini
Gemini 2.0 Flash	Google	0.72	2.88	Google Gemini
grok-3	xAI	21.6	108	xAI Grok

🚀 立即注册获取免费额度

平台	注册链接	免费额度	推荐场景
OpenAI API	注册获取 $18 免费额度 →	$18 新用户	GPT-4.1 / o3-mini
Anthropic API	注册获取 $5 免费额度 →	$5 新用户	Claude 4 Sonnet
Google AI Studio	免费注册 →	Gemini 2.5 Flash 免费	多语言翻译 / 长文本
xAI Grok	注册 →	试用额度	grok-3

4.2 国产厂商

模型	平台	输入 ¥/百万 token	输出 ¥/百万 token	链接
DeepSeek-R1	字节火山	2	8	字节火山 DeepSeek-R1
deepseek-v3	字节火山	1	4	字节火山 deepseek-v3
DeepSeek-R1	DeepSeek	4	16	DeepSeek-R1
deepseek-v3	DeepSeek	2	8	deepseek-v3
DeepSeek-R1	硅基流动	4	16	硅基流动
deepseek-v3	硅基流动	2	8	硅基流动
DeepSeek-R1	百度云千帆	2	8	百度千帆
deepseek-v3	百度千帆	0.8	1.6	百度千帆
Qwen3-Max	阿里云	8	32	阿里云 Qwen3
Qwen3-Plus	阿里云	2	8	阿里云 Qwen3
Qwen3-Turbo	阿里云	免费	免费	阿里云 Qwen3
Qwen3-Coder	阿里云	4	16	阿里云 Qwen3
文心 4.5	百度千帆	6	24	百度千帆
Kimi k2	月之暗面	10	40	Moonshot AI

🚀 立即注册获取免费额度

平台	注册链接	免费额度	推荐场景
阿里云百炼	注册 Qwen3-Turbo 永久免费 →	Qwen3-Turbo 永久免费	日常对话 / 简单任务
字节火山引擎	注册送 1000 万 tokens →	新用户 1000 万 tokens	DeepSeek-R1 / v3
百度千帆	注册送 100 万 tokens/月 →	文心 4.5 每月 100 万	中文内容生成
DeepSeek 官方	注册送 ¥14 额度 →	新用户 ¥14	deepseek-v3 / R1
月之暗面 Kimi	注册 →	试用额度	Kimi k2
硅基流动	注册送 ¥14 额度 →	新用户 ¥14	deepseek-v3

关键说明

价格差异: 价格可能因地区、使用量和提供商的具体服务层级而有所不同。
隐藏成本: 需注意并发限制（如 TPM/RPM）、长文本处理费用和 API 调用配额等额外成本。
性能权衡: 低成本模型可能在处理复杂任务或长上下文场景时存在局限性。
缓存优化: OpenAI 和 Anthropic 均支持 Prompt Caching，缓存命中时输入成本可降低 50%。

五、2026年6月各平台免费额度速查

平台	免费政策	适用模型
阿里云	Qwen3-Turbo 永久免费	Qwen3-Turbo
字节火山	新用户 1000 万 tokens	deepseek-v3 / R1
百度千帆	文心 4.5 每月 100 万 tokens	文心 4.5
DeepSeek	新用户 ¥14 充值额度	deepseek-v3 / R1
OpenAI	新用户 $18 额度	GPT-4.1-mini / o3-mini
Google	Gemini 2.5 Flash 免费额度	Gemini 2.5 Flash
Anthropic	新用户 $5 额度	Claude 3.5 Haiku
硅基流动	新用户 ¥14 额度	deepseek-v3