Grande Guerre des Tarifs LLM 2025
Tendance tarifaire
Modèles chinois : "gratuit ou presque"
- DeepSeek V3 (Volcano) : 1¥ input / 4¥ output par million tokens (~gratuit)
- Baidu Ernie : DeepSeek-V3 = 0.8¥ input / 1.6¥ output
Modèles internationaux : stratégie "multi-niveaux"
- OpenAI GPT-4o : 18¥ input / 72¥ output (cher mais performant)
- Google Gemini 2.0 Flash : 0.72¥ input / 2.88¥ output (bon compromis)
- Claude 3.5 Sonnet : 21.6¥ input / 108¥ output (meilleur raisonnement)
Tableau complet des prix (¥ par million tokens)
| Modèle | Plateforme | Input | Output | Cas d'usage |
|---|---|---|---|---|
| DeepSeek-R1 | Volcano | 2 | 8 | Raisonnement complexe |
| deepseek-v3 | Volcano | 1 | 4 | Génération texte courant |
| GPT-4o | OpenAI | 18 | 72 | Haute précision |
| Gemini 2.0 Flash | 0.72 | 2.88 | Multilingue, rapide | |
| Claude 3.5 Sonnet | Anthropic | 21.6 | 108 | Logique, sécurité |
Pièges cachés
- Limite concurrence (TPM/RPM) : modèles bon marché restreignent débit
- Coûts texte long : traiter 380k caractères peut être 10x plus cher
- Vectorisation : stocker/chercher en base de données ajoute frais
Matrice de sélection
| Cas | Modèle recommandé | Raison |
|---|---|---|
| Chat simple, haute fréquence | DeepSeek-V3 | Vraiment gratuit |
| Code/logique complexe | DeepSeek-R1 | Prix Déepseek pour logique GPT-3.5 |
| Traduction multi-langue | Gemini 2.0 | Optimisé Google |
| Sécurité/confidentialité | Claude Haiku | Low toxicity, safety-first |
| Production haute performance | GPT-4o | Meilleur absolu malgré prix |
Conclusion
Ne pas confondre prix bas et vraie économie. L'équation: (Performance × Parallélisme) ÷ Coût = Vrai rapport qualité-prix.
2025 appartient à celui qui fait le meilleur choix modèle selon sa charge de travail, pas qui clique sur le tarif le moins cher.