大模型"价格战",谁是真香?谁是智商税?
引言:大模型"价格战"背后的真相
2024 年起,国内云厂商掀起大模型降价风暴,火山引擎、百度云、阿里云等纷纷将轻量级模型价格降至"免费"或"厘级",而国际厂商如 OpenAI、Google 则通过多版本策略覆盖不同需求。进入 2026 年,价格战愈演愈烈——GPT-4.1 以 1/7 的定价取代 GPT-4o,Claude 4 系列以"同性能半价"策略入场,Qwen3 系列则将旗舰模型拉入十元以内。
但价格低是否等于性价比高?隐藏的"并发限制"和"性能差异"如何影响实际成本?本文带你一图看懂 LLM API price comparison,助你成为"云上精算师"!
一、2026 年价格战趋势:降价风暴继续
1. 旗舰模型"平民化"
- OpenAI GPT-4.1 定价仅为 GPT-4o 的 1/7(输入 $2 vs $14/百万tokens),性能却全面超越
- Claude 4 Sonnet 在性能接近 GPT-4o 的前提下,价格仅为前代 Claude 3.5 Opus 的 1/5
- Google Gemini 2.5 Pro 支持超长上下文(1M tokens),但输入定价仅 $3.5/百万
2. 国产模型"免费额度"持续扩大
- 火山引擎豆包 Lite 持续免费,Pro 版降价 40%
- 通义千问 Qwen3 系列:Qwen3-Turbo 完全免费,Qwen3-Plus 仅 0.002 元/千 tokens
- 百度文心 4.5:每月 100 万 tokens 免费额度
3. 免费额度变化
| 厂商 | 2025年免费额度 | 2026年免费额度 | 变化 |
|---|---|---|---|
| OpenAI | $18 新用户 | $18 新用户 | → 持平 |
| 15 RPM 免费 | Gemini 2.5 Flash 免费额度大幅提升 | ⬆️ | |
| Anthropic | $5 新用户 | $5 新用户 | → 持平 |
| 字节火山 | 新用户送 500 万 tokens | 新用户送 1000 万 tokens | ⬆️ |
| 阿里云 | 3 个月免费试用 | Qwen3-Turbo 永久免费 | ⬆️ |
| 百度 | 有限免费 | 文心 4.5 每月 100 万 tokens | ⬆️ |
二、性价比PK:谁是真香?谁是智商税?
| 模型类型 | 代表模型 | 适用场景 | 性价比公式 |
|---|---|---|---|
| 国产轻量级 | Qwen3-Turbo / 豆包 Lite | 简单对话、高频问答 | 免费 × 高并发 = 最优解 |
| 国产高端 | Qwen3-Max / DeepSeek-R1 | 复杂逻辑、代码生成 | GPT-4 级性能 × 价格仅 1/10 |
| 国际性价比款 | GPT-4.1-mini / Gemini 2.5 Flash | 多语言翻译、短文本生成 | 低价 × 谷歌/微软生态兼容性 |
| 国际旗舰款 | Claude 4 Opus / GPT-4.1 | 学术研究、长文本创作 | 最高精度 × 成本仍可控(对比旧旗舰) |
隐藏成本提示:
- 并发限制: 例如 TPM(每分钟 token 数)和 RPM(每分钟请求数),低价模型可能限制吞吐量,需额外购买配额。
- 长文本成本: 处理 38 万字符的超长文本(如法律合同解析),需选择支持 256K+ 上下文的模型(如 Gemini 2.5 Pro 支持 1M tokens),否则可能因分片处理导致费用翻倍。
- 缓存命中: OpenAI 的 Prompt Caching 可节省 50% 的输入成本,Claude 也有类似机制——善用缓存比选便宜模型更有效。
三、选型决策树:按场景快速匹配
你的主要场景是?
├── 📝 简单对话/客服问答
│ └── 选: 豆包 Lite(免费) 或 Qwen3-Turbo(免费)
│
├── 💻 代码生成/辅助开发
│ ├── 预算充足 → Claude 4 Sonnet(代码能力最强)
│ └── 追求性价比 → Qwen3-Coder / GPT-4.1-mini
│
├── 📊 数据分析/长文档处理
│ ├── 文档 < 128K → GPT-4.1(精度高)
│ └── 文档 > 128K → Gemini 2.5 Pro(1M 上下文,唯一选择)
│
├── 🌍 多语言翻译
│ └── 选: Gemini 2.5 Flash(多语言最强 + 低价)
│
└── 🔬 科研/复杂推理
├── 首选: Claude 4 Opus(推理能力最强)
└── 平替: DeepSeek-R1(价格 1/7,推理接近)
四、完整的大型语言模型(LLM)API价格表
数据更新于 2026年5月24日,具体以厂商最新公告为准。 以下价格为每百万 token 的输入和输出成本(单位: ¥),汇率按 1 USD ≈ 7.2 CNY 计算。
4.1 国际厂商
| 模型 | 平台 | 输入 ¥/百万 token | 输出 ¥/百万 token | 链接 |
|---|---|---|---|---|
| GPT-4.1 | OpenAI | 14.4 | 57.6 | OpenAI GPT-4.1 |
| GPT-4.1-mini | OpenAI | 2.88 | 11.52 | OpenAI GPT-4.1-mini |
| o3 | OpenAI | 72 | 288 | OpenAI o3 |
| o3-mini | OpenAI | 7.92 | 31.68 | OpenAI o3-mini |
| Claude 4 Sonnet | Anthropic | 21.6 | 108 | Anthropic Claude 4 |
| Claude 4 Opus | Anthropic | 108 | 540 | Anthropic Claude 4 |
| Claude 3.5 Haiku | Anthropic | 5.76 | 28.8 | Anthropic Claude 3.5 Haiku |
| Gemini 2.5 Pro | 25.2 | 90 | Google Gemini | |
| Gemini 2.5 Flash | 2.16 | 8.64 | Google Gemini | |
| Gemini 2.0 Flash | 0.72 | 2.88 | Google Gemini | |
| grok-3 | xAI | 21.6 | 108 | xAI Grok |
🚀 立即注册获取免费额度
| 平台 | 注册链接 | 免费额度 | 推荐场景 |
|---|---|---|---|
| OpenAI API | 注册获取 $18 免费额度 → | $18 新用户 | GPT-4.1 / o3-mini |
| Anthropic API | 注册获取 $5 免费额度 → | $5 新用户 | Claude 4 Sonnet |
| Google AI Studio | 免费注册 → | Gemini 2.5 Flash 免费 | 多语言翻译 / 长文本 |
| xAI Grok | 注册 → | 试用额度 | grok-3 |
4.2 国产厂商
| 模型 | 平台 | 输入 ¥/百万 token | 输出 ¥/百万 token | 链接 |
|---|---|---|---|---|
| DeepSeek-R1 | 字节火山 | 2 | 8 | 字节火山 DeepSeek-R1 |
| deepseek-v3 | 字节火山 | 1 | 4 | 字节火山 deepseek-v3 |
| DeepSeek-R1 | DeepSeek | 4 | 16 | DeepSeek-R1 |
| deepseek-v3 | DeepSeek | 2 | 8 | deepseek-v3 |
| DeepSeek-R1 | 硅基流动 | 4 | 16 | 硅基流动 |
| deepseek-v3 | 硅基流动 | 2 | 8 | 硅基流动 |
| DeepSeek-R1 | 百度云千帆 | 2 | 8 | 百度千帆 |
| deepseek-v3 | 百度千帆 | 0.8 | 1.6 | 百度千帆 |
| Qwen3-Max | 阿里云 | 8 | 32 | 阿里云 Qwen3 |
| Qwen3-Plus | 阿里云 | 2 | 8 | 阿里云 Qwen3 |
| Qwen3-Turbo | 阿里云 | 免费 | 免费 | 阿里云 Qwen3 |
| Qwen3-Coder | 阿里云 | 4 | 16 | 阿里云 Qwen3 |
| 文心 4.5 | 百度千帆 | 6 | 24 | 百度千帆 |
| Kimi k2 | 月之暗面 | 10 | 40 | Moonshot AI |
🚀 立即注册获取免费额度
| 平台 | 注册链接 | 免费额度 | 推荐场景 |
|---|---|---|---|
| 阿里云百炼 | 注册 Qwen3-Turbo 永久免费 → | Qwen3-Turbo 永久免费 | 日常对话 / 简单任务 |
| 字节火山引擎 | 注册送 1000 万 tokens → | 新用户 1000 万 tokens | DeepSeek-R1 / v3 |
| 百度千帆 | 注册送 100 万 tokens/月 → | 文心 4.5 每月 100 万 | 中文内容生成 |
| DeepSeek 官方 | 注册送 ¥14 额度 → | 新用户 ¥14 | deepseek-v3 / R1 |
| 月之暗面 Kimi | 注册 → | 试用额度 | Kimi k2 |
| 硅基流动 | 注册送 ¥14 额度 → | 新用户 ¥14 | deepseek-v3 |
关键说明
- 价格差异: 价格可能因地区、使用量和提供商的具体服务层级而有所不同。
- 隐藏成本: 需注意并发限制(如 TPM/RPM)、长文本处理费用和 API 调用配额等额外成本。
- 性能权衡: 低成本模型可能在处理复杂任务或长上下文场景时存在局限性。
- 缓存优化: OpenAI 和 Anthropic 均支持 Prompt Caching,缓存命中时输入成本可降低 50%。
五、2026年6月各平台免费额度速查
| 平台 | 免费政策 | 适用模型 |
|---|---|---|
| 阿里云 | Qwen3-Turbo 永久免费 | Qwen3-Turbo |
| 字节火山 | 新用户 1000 万 tokens | deepseek-v3 / R1 |
| 百度千帆 | 文心 4.5 每月 100 万 tokens | 文心 4.5 |
| DeepSeek | 新用户 ¥14 充值额度 | deepseek-v3 / R1 |
| OpenAI | 新用户 $18 额度 | GPT-4.1-mini / o3-mini |
| Gemini 2.5 Flash 免费额度 | Gemini 2.5 Flash | |
| Anthropic | 新用户 $5 额度 | Claude 3.5 Haiku |
| 硅基流动 | 新用户 ¥14 额度 | deepseek-v3 |
💡 推荐套餐:按使用量选择最佳方案
🟢 轻度用户(月消耗 < 100 万 tokens)
推荐:免费方案组合 - 阿里云 Qwen3-Turbo(永久免费)+ 字节火山引擎(1000 万 tokens 新用户) - 月成本:¥0 - 适合:个人学习、小型项目、测试开发
🟡 中度用户(月消耗 100 万 - 1000 万 tokens)
推荐:混合方案 - OpenAI GPT-4.1-mini($2/百万)+ DeepSeek v3(¥2/百万)+ Google Gemini Flash(免费额度) - 月成本:约 ¥50-200 - 适合:自由职业者、小型团队、内容创作
👉 OpenAI 注册 → | DeepSeek 注册 → | Google AI Studio →
🔴 重度用户(月消耗 > 1000 万 tokens)
推荐:企业级方案 - 阿里云 Qwen3-Max(¥8/百万)+ 百度千帆文心 4.5(¥6/百万)+ Anthropic Claude 4 Sonnet(¥21.6/百万) - 月成本:约 ¥500-2000+ - 适合:企业应用、大规模内容生成、生产环境
👉 阿里云百炼 → | 百度千帆 → | Anthropic →
💎 性价比之王推荐
最佳平衡方案:DeepSeek + Qwen3 组合 - DeepSeek v3(¥2/百万输入,¥8/百万输出)+ Qwen3-Plus(¥2/百万输入,¥8/百万输出) - 性能接近 GPT-4,价格仅 1/5 - 月成本:约 ¥100-500(视用量而定)
👉 DeepSeek 注册 → | 阿里云百炼 →
结语:价格之外,更需关注"价值密度"
大模型的价格战仅是表象,企业需综合考量 "性能×成本×并发" 的三角平衡。2026 年的新趋势是:
- 旗舰降价:GPT-4.1、Claude 4 Sonnet 以"同性能半价"策略入场,拉低了旗舰门槛
- 免费扩容:Qwen3-Turbo 永久免费、豆包 Lite 持续免费,轻量场景零成本
- 缓存为王:善用 Prompt Caching 可节省 50% 成本,比选便宜模型更见效
- 长文本突破:Gemini 2.5 Pro 支持 1M tokens 上下文,超长文档处理成本大幅下降
记住:"便宜≠适合,贵≠浪费",精准匹配业务需求的模型,才是真正的性价比之王!
最后更新:2026-05-24 | 作者:Kevin Peng