1 bài
17 thg 5, 2026 · llm / cost-optimization
Chuyển 1M token phân loại từ Opus 4.7 sang Haiku 4.5 tiết kiệm $6.00 — giảm 80%. Đây là phân loại task, yếu tố latency, và các công cụ để triển khai.