Chủ đề: cost-optimization

1 bài

· llm / cost-optimization

LLM cost routing: khi nào Haiku thắng Opus và khi nào không

Chuyển 1M token phân loại từ Opus 4.7 sang Haiku 4.5 tiết kiệm $6.00 — giảm 80%. Đây là phân loại task, yếu tố latency, và các công cụ để triển khai.