Aller au contenu

Grande Guerre des Tarifs LLM 2025

Tendance tarifaire

Modèles chinois : "gratuit ou presque"

  • DeepSeek V3 (Volcano) : 1¥ input / 4¥ output par million tokens (~gratuit)
  • Baidu Ernie : DeepSeek-V3 = 0.8¥ input / 1.6¥ output

Modèles internationaux : stratégie "multi-niveaux"

  • OpenAI GPT-4o : 18¥ input / 72¥ output (cher mais performant)
  • Google Gemini 2.0 Flash : 0.72¥ input / 2.88¥ output (bon compromis)
  • Claude 3.5 Sonnet : 21.6¥ input / 108¥ output (meilleur raisonnement)

Tableau complet des prix (¥ par million tokens)

Modèle Plateforme Input Output Cas d'usage
DeepSeek-R1 Volcano 2 8 Raisonnement complexe
deepseek-v3 Volcano 1 4 Génération texte courant
GPT-4o OpenAI 18 72 Haute précision
Gemini 2.0 Flash Google 0.72 2.88 Multilingue, rapide
Claude 3.5 Sonnet Anthropic 21.6 108 Logique, sécurité

Pièges cachés

  1. Limite concurrence (TPM/RPM) : modèles bon marché restreignent débit
  2. Coûts texte long : traiter 380k caractères peut être 10x plus cher
  3. Vectorisation : stocker/chercher en base de données ajoute frais

Matrice de sélection

Cas Modèle recommandé Raison
Chat simple, haute fréquence DeepSeek-V3 Vraiment gratuit
Code/logique complexe DeepSeek-R1 Prix Déepseek pour logique GPT-3.5
Traduction multi-langue Gemini 2.0 Optimisé Google
Sécurité/confidentialité Claude Haiku Low toxicity, safety-first
Production haute performance GPT-4o Meilleur absolu malgré prix

Conclusion

Ne pas confondre prix bas et vraie économie. L'équation: (Performance × Parallélisme) ÷ Coût = Vrai rapport qualité-prix.

2025 appartient à celui qui fait le meilleur choix modèle selon sa charge de travail, pas qui clique sur le tarif le moins cher.