· grafana / datadog / observability

Grafana vs Datadog — Công cụ monitoring nào thắng 2026?

Với 10 host và 20 GB log/ngày, Grafana Cloud tốn khoảng $321/tháng, Datadog từ $520+. Phân tích chi phí thực tế và tính năng để chọn đúng công cụ monitoring.

Bởi

2.084 từ · 11 phút đọc

Grafana Cloud rẻ hơn ở mọi quy mô SaaS thực tế mà chúng tôi đã kiểm tra. Với 10 host, 10M spans và 20 GB log/ngày, Grafana Cloud Pro chạy khoảng $321/tháng, trong khi Datadog infrastructure + APM bắt đầu từ ~$520/tháng chưa tính chi phí log indexing. Khoảng cách này còn doãng ra khi event density của log tăng lên. Dù vậy, Datadog vẫn vượt trội ở synthetic monitoring và tích hợp Vercel — hai thứ mà Grafana Cloud chưa theo kịp vào thời điểm hiện tại.

Bài viết này dành cho ai

Các team đang chạy trên Vercel + Cloudflare Workers và đang cân nhắc nên đổ telemetry về đâu. Nếu bạn mới bắt đầu (dưới 5 host, log ít), free tier của Grafana là đủ dùng. Nếu cần browser-based synthetic tests cho Vercel frontend ngay từ đầu, Datadog là con đường nhanh hơn. Với phần còn lại, hãy đọc phần pricing trước — khoảng cách chi phí đủ lớn để tính toán kỹ.

Grafana vs Datadog: so sánh nhanh

Grafana CloudDatadog
Free tier10k series, 50 GB/signal/tháng, retention 14 ngàyTối đa 5 host, retention 1 ngày
Paid entry$19/tháng platform + metered usage$15/host/tháng infra (thanh toán năm)
APM$0.025/host-hour (~$18/host/tháng, theo grafana.com/pricing)$31/host/tháng, gồm 1M indexed spans
Logs$0.55/GB hiệu dụng (process + write + retain)$0.10/GB ingestion + $1.70/M events indexing
Cloudflare WorkersOTLP native, mọi planLogpush yêu cầu Cloudflare Enterprise
Vercel syntheticsChưa xác nhậnCó — Core Web Vitals + API tests
OpenTelemetryNative (OTLP)Hỗ trợ, nhưng không phải con đường chính
CNCF membershipPlatinum memberKhông phải contributor cốt lõi OSS
Enterprise SLA remedyTín dụng theo phần trăm (10–100% monthly bill), claim trong 10 ngày — Grafana Cloud SLA; Enterprise SLA không công khaiEnterprise tiêu chuẩn (cần xác nhận điều khoản)
Phù hợp nhất vớiTeam nhạy cảm về chi phí, OTLP-native, Cloudflare WorkersTeam Vercel nặng, synthetic monitoring, UX thống nhất

Phân tích chi phí

Grafana Cloud

Trang pricing của Grafana có ba tier. Free tier là vĩnh viễn — không phải dùng thử. Bạn được 10.000 active metric series và 50 GB/tháng cho mỗi loại tín hiệu (logs, traces, profiles) với retention 14 ngày, miễn phí hoàn toàn.

Pro tính phí theo mức dùng, trên nền $19/tháng platform fee:

  • Metrics: $6.50 cho mỗi 1.000 active series vượt ngưỡng miễn phí
  • Logs/traces/profiles: $0.05/GB process + $0.40/GB write + $0.10/GB retain = $0.55/GB hiệu dụng nếu bạn ingest và retain

Với 20 GB log/ngày (600 GB/tháng), traces vẫn nằm trong ngưỡng miễn phí 50 GB:

  • Platform: $19
  • Logs (550 GB overage × $0.55): ~$302
  • Traces (10M spans ≈ 10 GB, trong free tier): $0
  • Metrics (dưới 10k series): $0
  • Tổng: ~$321/tháng

Grafana Cloud Application Observability được định giá $0.025/host-hour (~$18/host/tháng), xác nhận từ grafana.com/pricing (tháng 6/2026).

Datadog

Datadog tính theo host, không chỉ theo khối lượng dữ liệu. Với 10 host trên Infrastructure Pro hàng năm cộng APM base:

Khoản mụcĐơn giáChi phí 10 host
Infrastructure Pro$15/host/tháng (năm)$150
APM base$31/host/tháng$310
Log ingestion$0.10/GB × 600 GB$60
Log indexing$1.70/M events (15-day, năm)biến động
Tổng cộng (chưa indexing)~$520/tháng

Phần log indexing là chỗ chi phí Datadog trở nên khó kiểm soát. Indexing tính theo triệu events, không theo GB. Nếu event density là 100 KB/event, 600 GB/tháng tương đương ~6M events = ~$10 indexing. Nhưng nếu là 1 KB/event — phổ biến hơn với structured logs — thì 600 GB là ~600M events = ~$1.020 chỉ riêng indexing. Những team có high-cardinality structured logs có thể vọt xa ước tính ban đầu rất nhanh.

APM base gồm 150 GB ingested spans/host (1.500 GB tổng với 10 host) — thừa sức cho 10M spans ở kích thước payload thông thường. Indexed spans: 10M tổng = 1M/host, khớp chính xác với mức base.

Điểm hoà vốn

Với những team dùng log nhiều, trace nhiều và OTLP-native: Grafana Cloud rẻ hơn ở quy mô lớn. Sự chênh lệch này có tính cấu trúc: Grafana tính theo GB cố định, không có bẫy event-count. Chi phí log indexing của Datadog tăng theo cardinality, không chỉ theo khối lượng. Đây là lý do mà hầu hết các team rời Datadog sang Grafana Cloud đều nhắc đến.

Phân tích tính năng

Metrics và dashboard

Cả hai nền tảng đều phủ đủ infrastructure metrics cơ bản — CPU, memory, disk, network — và hỗ trợ custom instrumentation. PromQL của Grafana là native (Grafana là người tạo ra bộ công cụ Prometheus xung quanh LGTM: Loki, Grafana, Tempo, Mimir). Datadog dùng query language riêng, với UI bóng bẩy tích hợp tất cả tín hiệu trên cùng một timeline. Nếu team bạn đã quen viết PromQL, DSL của Grafana sẽ cảm giác quen tay. Nếu cần onboard engineers chưa biết PromQL, visual editor của Datadog thân thiện hơn.

Logs

Cả hai đều nhận structured và unstructured logs. Grafana Cloud dùng label-based indexing của Loki — lưu trữ rẻ hơn, nhưng ad-hoc query với high-cardinality chậm hơn nếu không lên kế hoạch index trước. Datadog index tất cả, khiến full-text search gần như tức thời nhưng tốn kém ở quy mô lớn.

Distributed traces

Grafana Cloud dùng Tempo, vốn là OTLP-native. Datadog APM dùng agent và thư viện DDTrace riêng; OTLP ingestion được hỗ trợ nhưng không phải con đường chính. Với những team đã đầu tư vào OpenTelemetry instrumentation, Grafana Cloud là lựa chọn gọn gàng hơn — không cần đổi SDK, không bị lock-in ở tầng instrumentation.

APM

Cả hai đều có application performance monitoring với service maps, latency histograms và error rate tracking. APM của Datadog trưởng thành hơn, tích hợp UI chặt chẽ hơn nhờ lịch sử phát triển lâu dài. Application Observability của Grafana còn tương đối mới; hãy xác nhận phạm vi tính năng hiện tại tại grafana.com/pricing trước khi so sánh.

Alerting

Cả hai đều hỗ trợ multi-condition alerts gửi đến PagerDuty, Slack và email. Alerting engine của Grafana tương thích với Prometheus Alertmanager. UI alerting của Datadog bóng bẩy hơn và hỗ trợ composite monitors (cảnh báo khi cả metric A lẫn metric B đều vượt ngưỡng). Với alerting tree phức tạp, Datadog có tooling khai báo tốt hơn; còn với team dùng provisioning API của Grafana theo hướng code-as-config, khoảng cách này thu hẹp đáng kể.

Synthetic monitoring — khoảng cách rõ nhất

Datadog Synthetics xác nhận hỗ trợ theo dõi frontend chạy trên Vercel: browser tests đo Largest Contentful Paint và Cumulative Layout Shift; API tests gọi vào Vercel Functions với HTTP step assertions. Tính năng này được document đầy đủ và khả dụng trên các plan Datadog trả phí.

Grafana Cloud Synthetic Monitoring (dựa trên k6) cung cấp API checks và browser-based testing. Mức độ tích hợp đặc thù cho Vercel chưa được xác nhận từ primary sources — hãy kiểm tra tại grafana.com/products/cloud/synthetic-monitoring/ trước khi phụ thuộc vào Vercel Core Web Vitals từ Grafana.

Tích hợp Cloudflare Workers và Vercel

Cloudflare Workers — Grafana thắng

Grafana Cloud hỗ trợ OTLP HTTP ingestion từ Cloudflare Workers natively, không yêu cầu plan Cloudflare cụ thể nào. OTLP endpoint phụ thuộc vào stack — để tìm endpoint của instance bạn, chọn stack trong Grafana Cloud portal, rồi nhấn Configure từ tile OpenTelemetry (grafana.com/docs/grafana-cloud/send-data/otlp/send-data-otlp/). Instrument Workers bằng OpenTelemetry JS SDK và trỏ exporter vào stack endpoint — không cần agent, không cần Logpush.

Tích hợp Cloudflare của Datadog thu thập zone-level metrics (web traffic, DNS, threat insights) qua Cloudflare Analytics API. Để forward log từ Cloudflare, Datadog yêu cầu Cloudflare Logpush — mà Logpush lại đòi hỏi Cloudflare Enterprise plan. Đây là rào cản lớn với các startup đang dùng Cloudflare Pro.

Vercel — Datadog thắng

Datadog có tích hợp Vercel chuyên biệt: Vercel Log Drains chuyển function logs vào Datadog; tích hợp APM instrument Vercel Functions; synthetic browser tests đo Core Web Vitals trên frontend đã deploy. Tính năng này đã được kiểm thử và sẵn sàng cho production.

Grafana Cloud có thể nhận Vercel logs qua Loki HTTP endpoints khi dùng Vercel Log Drains. Full-stack APM cho Vercel Functions đòi hỏi OTLP instrumentation thủ công. Synthetic monitoring cho Vercel frontend chưa được xác nhận ở mức độ tương đương Datadog.

Nếu bạn đang cân nhắc nền tảng deploy cùng lúc với lựa chọn observability, so sánh nền tảng deploy full-stack của chúng tôi bao gồm Vercel, Render, Fly.io và Railway về chi phí và DX.

Cộng đồng và hỗ trợ

Grafana Labs là CNCF Platinum Member và có mặt trong CNCF Governing Board. Grafana, Prometheus, Loki, Tempo và Mimir đều là dự án do CNCF bảo trợ hoặc liên kết. Nếu team bạn xem trọng việc tránh vendor lock-in ở tầng instrumentation, điều này quan trọng: hệ sinh thái OpenTelemetry và bộ công cụ của Grafana có vùng chồng lấn rất lớn.

Datadog không phải contributor cốt lõi của hệ sinh thái observability OSS. Sản phẩm là proprietary. Instrumentation qua DDTrace tạo ra sự phụ thuộc nhà cung cấp không dễ thay thế.

Enterprise SLA

SLA của Grafana Cloud (grafana.com/legal/grafana-cloud-sla/) cấp tín dụng theo phần trăm: 10% monthly bill cho uptime 99.0–99.5%, 20% cho 98.0–99.0%, 50% cho 97.0–98.0%, và 100% nếu thấp hơn 97.0%. Thời hạn nộp claim là 10 ngày. Enterprise SLA của Grafana không công khai — hãy yêu cầu xem điều khoản trực tiếp trước khi ký enterprise contract. Tương tự, điều khoản enterprise SLA của Datadog cũng không được xác nhận độc lập cho bài viết này — hãy yêu cầu MSA hiện hành từ đội enterprise Datadog trước khi ký hợp đồng lớn.

Nên chọn Grafana Cloud khi nào

  • Team đã dùng OpenTelemetry instrumentation — OTLP là native, không phải bolted-on
  • Team trên Cloudflare Workers cần traces và logs mà không muốn nâng lên Cloudflare Enterprise plan
  • SaaS nhạy cảm về chi phí với workload log nặng — mô hình tính theo GB không có bẫy event-density
  • Team đã tự host Grafana OSS và muốn chuyển sang managed mà không cần học lại tooling
  • Tổ chức đặt tiêu chí tham gia CNCF ecosystem trong quá trình chọn vendor

Các team xây dựng stack observability đầy đủ thường bổ sung uptime monitoring bên cạnh metrics — xem so sánh uptime monitor của chúng tôi về Pulsetic, Better Stack và Checkly.

Nên chọn Datadog khi nào

  • Team chạy Vercel frontend cần synthetic Core Web Vitals monitoring mà không cần setup phức tạp
  • Team muốn single-pane-of-glass thống nhất cho metrics, logs, traces và synthetics
  • Tổ chức có engineers chưa quen PromQL hay Loki label filtering — onboarding của Datadog nhanh hơn
  • Team ở host count rất cao (50+) — APM per-host của Datadog trở nên cạnh tranh hơn so với log per-GB của Grafana ở quy mô đó

Error tracking thường được đánh giá song song với observability — so sánh công cụ theo dõi lỗi cho SaaS nhỏ của chúng tôi bao gồm Sentry, Honeybadger và AppSignal.

Kết luận

Với hầu hết các SaaS đang phát triển — đặc biệt team chạy trên Cloudflare Workers hoặc có log volume cao — Grafana Cloud là lựa chọn mặc định tốt hơn. Khoảng cách chi phí ở workload thực tế là có thật và có tính cấu trúc, không phải mức giá khuyến mãi tạm thời. Kiến trúc OTLP-native giữ cho instrumentation luôn portable.

Chọn Datadog nếu bạn cần synthetic monitoring cho Vercel frontend ngay từ đầu, hoặc nếu team sẽ làm việc hiệu quả hơn khi UI observability hoạt động end-to-end mà không cần cấu hình thêm.

Đừng ký Grafana Enterprise contract mà không đọc kỹ điều khoản SLA trực tiếp — SLA công khai của Grafana Cloud tính theo phần trăm, còn Enterprise terms không được đăng online.


Giá xác nhận từ grafana.com/pricingdatadoghq.com/pricing (tháng 6/2026). Tính khả dụng của affiliate link Grafana chưa được xác nhận từ primary sources.