· api / image-generation / flux
API tạo ảnh tốt nhất 2026: giá, rate limit và hướng dẫn SDK
fal.ai FLUX.1 [schnell] $0.003/ảnh cho chi phí thấp, FLUX.2 [pro] cho production, Stable Diffusion open weights cho self-hosting. Phân tích cho developer.
Bởi Ethan · Cập nhật 20 tháng 5, 2026
2.002 từ · 11 phút đọc
Chi phí thấp nhất: FLUX.1 [schnell] qua fal.ai hoặc Replicate ở $0.003/ảnh, độ trễ dưới 1 giây. Chất lượng production: FLUX.2 [pro] qua Black Forest Labs trực tiếp hoặc fal.ai ở $0.030/ảnh, nhanh gấp 2× sau bản cập nhật tháng 3/2026. Self-hosting: FLUX.1 [dev] (Apache 2.0) hoặc SDXL open weights — miễn phí ở quy mô lớn nếu bạn tự quản lý GPU. Midjourney chỉ dành cho gói Enterprise từ tháng 5/2026; bỏ qua trừ khi bạn có $120+/tháng và thời gian chờ xét duyệt thủ công.
Bài này dành cho ai
Developer đang tích hợp tính năng tạo ảnh vào sản phẩm. Bạn cần chọn API, hiểu rõ mức giá sẽ thay đổi như thế nào khi vượt 10.000 ảnh mỗi tháng, và biết provider nào sẽ trả về 429 đúng vào lúc không mong muốn nhất. Đây không phải bài “cái nào tạo ảnh đẹp hơn”.
Những gì chúng tôi đã kiểm tra
Giá, rate limit, SDK và dữ liệu về độ trễ thu thập từ nguồn chính vào ngày 2026-05-20:
- FLUX.1 [schnell] qua fal.ai (
fal-ai/flux/schnell) và Replicate - FLUX.2 [pro] qua Black Forest Labs trực tiếp (
api.bfl.ai) và fal.ai - FLUX.2 [klein] 4B qua BFL trực tiếp
- FLUX1.1 [pro] qua BFL trực tiếp và Replicate
- Stable Image Core, SD3.5 Large, Stable Image Ultra qua Stability AI
- Midjourney API — chỉ từ tài liệu chính thức; không có quyền truy cập trực tiếp (yêu cầu gói Enterprise)
Số liệu về độ trễ lấy từ các công cụ benchmark bên thứ ba (artificialanalysis.ai) và tài liệu của provider, không phải từ môi trường test có kiểm soát. Một script test trực tiếp với từng API sẽ cho kết quả chính xác hơn.
Kết quả
Giá và mô hình credit
Đây là chỗ các quyết định thực sự diễn ra. Tất cả giá ở độ phân giải 1024×1024 (1 megapixel) nếu không ghi chú khác.
| Model | Provider | Giá mỗi ảnh |
|---|---|---|
| FLUX.1 [schnell] | fal.ai | $0.003 |
| FLUX.1 [schnell] | Replicate | $0.003 |
| FLUX.2 [klein] 4B | BFL trực tiếp | $0.014 |
| FLUX.1 [dev] | fal.ai | $0.025 |
| FLUX.1 [dev] | Replicate | $0.025 |
| FLUX.2 [pro] | BFL trực tiếp / fal.ai | $0.030 |
| Stable Image Core | Stability AI | $0.030 |
| FLUX1.1 [pro] | BFL trực tiếp / Replicate | $0.040 |
| SD3.5 Large | Stability AI | $0.065 |
| Stable Image Ultra | Stability AI | $0.080 |
| Midjourney API | Chỉ Enterprise | Không công bố |
Mức chênh lệch khá lớn. FLUX.1 [schnell] ở $0.003 rẻ hơn FLUX.2 [pro] 10 lần và rẻ hơn Stable Image Ultra 26 lần. Ở 10.000 ảnh/tháng, khoảng cách đó là $30 so với $300 so với $800 — chưa tính giảm giá theo khối lượng.
Mô hình credit của Stability AI: 1 credit = $0.01. Pay-as-you-go ở $10 mỗi 1.000 credit. Gói thành viên $20/tháng gồm 6.000 credit, đủ cho khoảng 2.000 lần tạo ảnh với Stable Image Core. Vượt quá sẽ tính theo mức phí credit tương tự.
Giá BFL và fal.ai: BFL tính theo megapixel cho các model FLUX.2 — megapixel đầu tiên theo giá niêm yết, các megapixel tiếp theo tính tỷ lệ. fal.ai khớp đúng giá BFL trên FLUX.2 [pro]. Điểm fal.ai có lợi thế hơn BFL trực tiếp: quyền truy cập FLUX.1 [schnell]. BFL không bán schnell qua API — đây là model Apache 2.0 mã nguồn mở, chỉ dành cho self-hosting. Phiên bản thương mại tương đương qua BFL là FLUX.2 [klein] ($0.014), không phải schnell.
Replicate: tính giá theo đầu ra cho các model Flux chính, không tính theo GPU-second. Trang giá rõ ràng, không có chi phí bất ngờ khi thanh toán.
Dự báo chi phí theo khối lượng (Stable Image Core, $0.030):
| Khối lượng/tháng | Chi phí hàng tháng |
|---|---|
| 100 ảnh | $3 |
| 1.000 ảnh | $30 |
| 10.000 ảnh | $300 |
Với giá schnell ($0.003): $0.30 / $3 / $30 cho cùng khối lượng đó. Để hiểu chi phí tạo ảnh trong bức tranh tổng thể ngân sách AI, xem Chi phí thực tế khi vận hành đội AI agent.
Độ trễ
| Model | Provider | Độ trễ thông thường |
|---|---|---|
| FLUX.1 [schnell] | Together.ai Turbo | ~315 ms |
| FLUX.1 [schnell] | fal.ai | ~0.8 s |
| Stable Image Core | Stability AI | 2–4 s |
| FLUX.1 [dev] | fal.ai / Replicate | ~3.5–4.5 s |
| FLUX.2 [pro] | BFL / fal.ai | ~5–6 s |
| Stable Image Ultra | Stability AI | 6–12 s |
| SD3.5 Large | Stability AI | 6–12 s |
Nguồn: tài liệu provider và artificialanalysis.ai. Độ trễ đo ở một vùng cụ thể và sẽ thay đổi.
Con số nổi bật nhất là schnell: dưới 1 giây ở fal.ai, 315 ms trên endpoint Turbo của Together.ai. Nếu app của bạn tạo ảnh ngay trong luồng tương tác với người dùng, khoảng cách giữa 0.8 giây và 6 giây chính là sự khác biệt giữa cảm giác tức thì và một vòng xoay loading.
FLUX.2 [pro] nhanh hơn khoảng 2× kể từ tháng 3/2026 mà không tăng giá. Với các trường hợp cần chất lượng cao, đây là API cạnh tranh nhất ở mức giá $0.030.
Chất lượng đầu ra
So sánh chất lượng đầu ra không nằm trong phạm vi bài này — xem phần Lưu ý.
Trải nghiệm developer
Black Forest Labs (api.bfl.ai)
Không có SDK Python hay JavaScript chính thức. Tất cả ví dụ code trong tài liệu đều là HTTP thuần — Python requests hoặc curl. Luồng tích hợp là async: POST một yêu cầu tạo ảnh, nhận về một polling_url, polling cho đến khi status là Ready. URL ảnh hết hạn sau 10 phút; bạn phải proxy hoặc tự lưu trên infrastructure của mình, không thể trả URL thẳng về cho client.
Rate limit: 24 concurrent request cho các endpoint thông thường, 6 concurrent cho Kontext [max]. Giới hạn cứng — vượt quá sẽ nhận HTTP 429. Exponential backoff là chiến lược retry được tài liệu khuyến nghị.
Multi-region: api.bfl.ai (global, tự động failover), api.eu.bfl.ai (định tuyến theo GDPR), api.us.bfl.ai. Tùy chọn theo region quan trọng nếu bạn xử lý dữ liệu người dùng EU và cần giữ inference ở phía đó của Đại Tây Dương.
MCP server tại mcp.bfl.ai để tích hợp với Claude Desktop / Claude Code / Cursor — hữu ích nếu bạn dùng một trong các AI coding CLI hỗ trợ MCP.
fal.ai
SDK chính thức: fal-client (Python, PyPI, cập nhật 2026-04-28) và @fal-ai/client (npm, 1.10.1, cập nhật 2026-05-04). Bao gồm TypeScript types. Chất lượng SDK là tốt nhất trong số các provider ở đây.
Truy cập hơn 1.000 model qua một tích hợp API duy nhất. Nếu bạn có kế hoạch dùng nhiều model hơn Flux, fal.ai giảm đáng kể bề mặt tích hợp.
SLA uptime 99.9% được công bố. Rate limit cụ thể không được đăng tải công khai — liên hệ sales để biết cam kết cho môi trường production.
Giá ngang với BFL trực tiếp trên FLUX.2 [pro]. Lý do chính để chọn fal.ai thay vì BFL khi cần chất lượng cao: SDK và catalog model thống nhất. Lý do chính để chọn BFL trực tiếp: bạn nhận model mới trước và có đảm bảo định tuyến theo region rõ ràng.
Replicate
Python client và JavaScript client chính thức khá tốt. Trang giá theo từng model hiển thị số lượt chạy và lịch sử phiên bản — hữu ích để đánh giá độ ổn định trước khi xây dựng trên một model. Mức độ minh bạch về rate limit thấp hơn BFL; không được đăng tải công khai.
Giá theo đầu ra với các model Flux (không theo GPU-second) là lợi thế đáng kể: bạn biết chính xác một lời gọi API tốn bao nhiêu trước khi thực hiện.
Stability AI
Không có SDK REST v2beta chính thức. SDK Python chính thức (stability-sdk) nhắm vào API gRPC cũ (bản phát hành cuối tháng 5/2024). Với v2beta, tài liệu chính thức chỉ có ví dụ thuần requests. Có các wrapper Node.js và TypeScript của cộng đồng nhưng không được duy trì chính thức.
Rate limit: 150 request mỗi 10 giây mỗi API key. Vượt quá sẽ nhận HTTP 429 với timeout 60 giây. Có thể dùng đồng thời tối đa 10 API key — giải pháp được tài liệu ghi nhận cho workload burst.
Không tìm thấy tài liệu SLA chính thức từ nguồn chính.
Kết luận: API tạo ảnh tốt nhất
| Trường hợp sử dụng | Chọn |
|---|---|
| Chi phí < $0.005/ảnh, độ trễ < 1 s, khối lượng > 5.000/tháng | FLUX.1 [schnell] qua fal.ai hoặc Replicate |
| Chất lượng production ở $0.030, model Flux mới nhất, định tuyến GDPR EU | FLUX.2 [pro] qua BFL trực tiếp |
| Chất lượng production + SDK tốt nhất + catalog hơn 1.000 model | FLUX.2 [pro] qua fal.ai |
| Stable Diffusion được quản lý, không cần hạ tầng GPU | Stable Image Core qua Stability AI ($0.030) |
| Hệ sinh thái Stable Diffusion, mức giá $0.065–$0.080 | SD3.5 Large hoặc Stable Image Ultra qua Stability AI |
| Khối lượng > 50.000/tháng, toàn quyền kiểm soát model, không chấp nhận chi phí per-image | FLUX.1 [dev] (Apache 2.0) hoặc SDXL self-hosted trên GPU của bạn |
| Chất lượng đầu ra như Midjourney | Không thể truy cập nếu không có gói Enterprise ($120+/tháng, xét duyệt thủ công) |
Hai lựa chọn cho phần lớn team mới bắt đầu:
- Bắt đầu với fal.ai + schnell cho giai đoạn prototype và workload nhạy cảm về chi phí. $0.003/ảnh, có SDK từ ngày đầu, chuyển sang FLUX.2 [pro] trên cùng provider khi yêu cầu chất lượng tăng lên.
- Dùng BFL trực tiếp cho chất lượng production nếu bạn muốn nhận model Flux mới nhất trước và cần định tuyến dữ liệu EU rõ ràng. Chấp nhận kiến trúc polling và việc không có SDK chính thức.
Lưu ý
Chất lượng đầu ra: Không có phần kiểm tra prompt so sánh các API. Bài này chỉ bao gồm giá, rate limit, độ trễ và chất lượng SDK.
Quyền truy cập Midjourney API: Dựa trên tài liệu công khai. Giá Enterprise chưa được xác nhận ngoài mức sàn $120/tháng. Điều kiện truy cập có thể thay đổi — xác minh trạng thái hiện tại trước khi đưa vào kế hoạch production.
Rate limit fal.ai: Không được đăng tải công khai. Sử dụng high-concurrency theo kế hoạch cần liên hệ sales.
Biến động giá: Tất cả giá truy cập ngày 2026-05-20. Stability AI đã tăng giá một số dịch vụ không phải core vào tháng 8/2025; giá BFL vẫn ổn định nhưng các model FLUX.2 còn tương đối mới. Ghi rõ trong hợp đồng vendor hoặc theo dõi trang giá trước khi chốt ước tính khối lượng.
Benchmark từ một vùng duy nhất: Số liệu độ trễ từ artificialanalysis.ai và tài liệu provider phản ánh snapshot hạ tầng cụ thể. Vùng của bạn, thời điểm trong ngày và tải đồng thời đều ảnh hưởng đến hiệu suất thực tế.
Không có quan hệ affiliate: Không provider nào trong bài so sánh này có chương trình affiliate hay referral với toolchew. Không có affiliate link.
Tài liệu tham khảo
- Giá BFL
- Hướng dẫn tích hợp BFL API
- Ghi chú phát hành BFL
- Trang model fal.ai FLUX.1 [schnell]
- Trang model fal.ai FLUX.2 [pro]
- Giá Replicate
- Giá Stability AI
- Cập nhật giá Stability AI (tháng 8/2025)
- Rate limit Stability AI
- Tracker độ trễ đa provider — FLUX.1 [schnell]
- Tài liệu Midjourney API
- Repo mã nguồn mở FLUX