Đánh giá Gemini CLI 2026: nhận định thật trước khi khai tử

Gemini CLI là AI coding agent miễn phí trên terminal tốt nhất có mặt trong năm 2026. Nó có context window 1 triệu token, 1.000 request mỗi ngày hoàn toàn miễn phí, và mã nguồn Apache 2.0 mà ai cũng có thể đọc hay fork. Ngày 19 tháng 5 năm 2026, Google thông báo quyền truy cập miễn phí sẽ kết thúc vào ngày 18 tháng 6. Phiên bản thay thế — Antigravity CLI — là phần mềm độc quyền.

Nếu bạn đang cân nhắc dùng Gemini CLI ngay lúc này, đừng chọn nó. Nếu bạn đã dùng rồi, bạn có thời gian đến ngày 18 tháng 6 để chuyển sang giải pháp khác. Bài viết này tổng kết những gì Gemini CLI thực sự mang lại, điểm yếu của nó là gì, và bước tiếp theo nên làm gì.

Bài viết này dành cho ai

Các developer đã dùng Gemini CLI và muốn có một đánh giá thành thật trước khi chọn giải pháp thay thế. Hoặc những developer chưa từng dùng và muốn hiểu tại sao cộng đồng bức xúc với quyết định khai tử này. Để so sánh tất cả AI coding tool trên terminal hiện tại, đọc Best AI Coding CLI trong năm 2026.

Chúng tôi đã kiểm tra gì

Gemini CLI v0.45.2 (phát hành ngày 5 tháng 6 năm 2026 — phiên bản ổn định cuối cùng trước khi bị khai tử), chạy trên macOS Sequoia, xác thực qua Google AI Pro API key. Model mặc định: Gemini 3 Flash. Để so sánh chất lượng code và tốc độ, chúng tôi tham chiếu từ một benchmark Express.js refactor đã được công bố và điểm SWE-bench Verified công khai.

Cài đặt

Bốn cách cài đặt, tất cả đều yêu cầu Node.js 18+ hoặc một package manager — không có binary độc lập:

# Không cần cài đặt
npx @google/gemini-cli

# Cài đặt global lâu dài
npm install -g @google/gemini-cli

# macOS/Linux qua Homebrew
brew install gemini-cli

# macOS qua MacPorts
sudo port install gemini-cli

Lần đầu khởi chạy sẽ hướng dẫn bạn xác thực: Google OAuth (free tier) hoặc Gemini API key từ Google AI Studio.

Context window 1M token: thực sự thay đổi được gì

Con số quảng cáo này là thật và có ý nghĩa thực tiễn. Gemini 3 Flash và Gemini 2.5 Pro đều cung cấp context window 1 triệu token. Claude Code có 200K. Codex CLI có 128K–200K.

Một triệu token tương đương khoảng 3–4 triệu ký tự mã nguồn. Đủ để nạp hầu hết monorepo trong một lần prompt — không cần chia nhỏ, không cần quản lý context thủ công, không cần xây thêm retrieval layer bên trên. Với phân tích log, khám phá codebase lớn từ đầu, hay làm việc với một spec document dày đặc, lợi thế context này là rất thực tế.

Trên thực tế, câu hỏi đặt ra là liệu model có tận dụng được context đó một cách hiệu quả hay không. Với các task ngắn, sự khác biệt gần như không nhận ra. Với các task đòi hỏi tính nhất quán trên 80+ file — như “refactor module này để khớp với convention interface của toàn bộ codebase” — thì context window 1M token là lợi thế thực sự.

Hiệu năng thực tế

Benchmark

Công cụ	SWE-bench Verified
Claude Code (Sonnet 4)	80,9%
Codex CLI	69,1%

Không có điểm SWE-bench nào được công bố cho Gemini CLI với tư cách là một sản phẩm — benchmark của CodeAnt AI ghi rõ “không có điểm benchmark chi tiết nào được công bố” cho Gemini CLI. Điểm ở cấp model của Gemini 2.5 Pro hay Gemini 3 Flash trong các cấu hình agentic thông thường không tương đương với điểm của một sản phẩm CLI và không được đưa vào đây. Điểm 80,9% của Claude Code đến từ cùng benchmark của CodeAnt AI.

Task thực tế: Express.js refactor

Một benchmark đã được công bố chạy thử Express.js refactor trên ba terminal agent lớn (nguồn):

Công cụ	Thời gian	Số lần sửa thủ công
Claude Code	1h 17m	0
Codex CLI	1h 41m	Điều chỉnh giữa chừng
Gemini CLI	2h 04m	3

Gemini hoàn thành task. Nhưng chậm hơn Claude Code 47 phút và cần thêm ba lần sửa thủ công. Dùng hàng ngày, sự chênh lệch đó tích lũy đáng kể.

Điểm mạnh thực sự của Gemini CLI

Google Search grounding

Đây là điểm độc nhất. Gemini CLI có thể thực hiện tìm kiếm web trực tiếp trong khi làm việc. Claude Code không làm được. Yêu cầu nó “implement Stripe webhook handler theo tài liệu hiện tại” và nó sẽ tự fetch tài liệu Stripe mới nhất thay vì dựa vào dữ liệu training. Với các tích hợp API có thư viện cập nhật liên tục — hay bất cứ thứ gì có thể đã thay đổi kể từ thời điểm cắt của model — đây là cải tiến thực sự trong quy trình làm việc.

Windows native support

Gemini CLI chạy trực tiếp trên Windows mà không cần WSL2. Claude Code cũng có hỗ trợ Windows native. Codex CLI yêu cầu WSL2. Điều này quan trọng với các nhóm có nhiều hệ điều hành khác nhau.

Mã nguồn mở và có thể kiểm tra

Apache 2.0 có nghĩa là bạn có thể đọc code, fork nó, và hiểu chính xác nó làm gì với file và shell environment của bạn trước khi tin dùng. Cộng đồng đã đóng góp đáng kể vào codebase trong năm đầu — mức độ tham gia bên ngoài hiếm gặp với một developer tool còn non trẻ như vậy.

GEMINI.md: project context files

Tương đương trực tiếp với CLAUDE.md của Claude Code. Tạo file GEMINI.md hoặc AGENT.md ở thư mục gốc dự án và Gemini CLI sẽ nạp nó vào mỗi lần prompt. Hỗ trợ style guide, ghi chú kiến trúc, các pattern không được phép, và hướng dẫn tool tùy chỉnh. Theo cùng cấu trúc phân cấp: thư mục gốc, override từ thư mục con, và file toàn cục ~/.gemini/GEMINI.md. Nếu bạn đã quen dùng CLAUDE.md, cách tư duy này hoàn toàn tương tự.

MCP support

Hỗ trợ đầy đủ MCP (Model Context Protocol), cấu hình trong ~/.gemini/settings.json. Hỗ trợ các transport stdio, SSE, và HTTP streaming. MCP server có thể expose tool, resource và prompt. Nếu bạn đã xây dựng MCP server cho Claude Code, hầu hết sẽ hoạt động với Gemini CLI sau khi đổi file cấu hình.

Những điểm còn thiếu sót

Chất lượng code với task phức tạp

Claude Code tạo ra code gọn gàng hơn và đúng chuẩn ngôn ngữ hơn trong hầu hết trường hợp. Khoảng cách này thể hiện rõ nhất trên các refactor nhiều file phức tạp, nơi Gemini CLI cần nhiều lần sửa hơn và thêm nhiều prompt bổ sung để đạt cùng kết quả. Khoảng cách càng lớn hơn với các task về tính nhất quán kiến trúc — nơi agent cần phải đồng bộ convention từ 20 call site khác nhau, không chỉ thỏa mãn một test.

Độ ổn định của phiên làm việc

Nhiều người dùng ghi nhận tình trạng treo 15 phút không có output, cần phải Ctrl+C nhiều lần. Claude Code cũng có vấn đề độ ổn định riêng, nhưng hành vi khi thực hiện task dài của nó có thể dự đoán hơn đáng kể. Trong môi trường script hay CI, điều này tệ hơn nghe có vẻ: một phiên bị treo có thể chặn pipeline vô thời hạn.

Hỏng file trên Windows với locale không phải tiếng Anh

Một sự cố đã được ghi nhận (GitHub Discussion #24725): trên hệ thống Windows với locale không phải tiếng Anh, Gemini CLI dùng PowerShell thay vì công cụ xử lý file gốc, dẫn đến hỏng comment trên diện rộng trong các file mã nguồn. Nguyên nhân là do giả định sai về encoding. Nếu bạn dùng Windows với locale không phải tiếng Anh, đây là lỗi đã biết.

Bảo mật: lỗ hổng RCE CVSS 10.0 trong tích hợp CI

Ngày 24 tháng 4 năm 2026, một lỗ hổng thực thi mã từ xa nghiêm trọng nhất đã được vá trong Gemini CLI v0.39.1 (GHSA-wpqr-6v78-jr5g). Chuỗi tấn công như sau:

Một contributor bên ngoài gửi PR chứa file cấu hình .gemini/ độc hại.
CI runner của bạn đã cài Gemini CLI để chạy trên các PR đến.
Headless mode tự động tin tưởng thư mục workspace; --yolo mode bỏ qua tool allowlist.
Prompt injection trong config kích hoạt thực thi lệnh shell tùy ý trên runner.
Kẻ tấn công thực thi code trên CI runner và đánh cắp secret.

Pillar Security báo cáo lỗ hổng này trong khoảng 16–20 tháng 4 năm 2026, được vá trong vòng bốn ngày. Phản ứng là nhanh. Nhưng một lỗ hổng CVSS 10.0 trong tích hợp CI của một công cụ được khuyến nghị tích cực cho pipeline tự động là dấu hiệu đáng suy nghĩ nghiêm túc. Nếu bạn đã chạy Gemini CLI ở headless mode trên CI runner và chưa kiểm tra log của runner từ tháng 4, bạn nên làm ngay.

v0.45.2 (bản phát hành cuối) đã được vá. v0.39.0 và các phiên bản cũ hơn thì không.

Giá cả: free tier thực sự như thế nào

OAuth / Google Account (free tier, còn hiệu lực đến ngày 18 tháng 6)

Giới hạn	Giá trị
Request	60/phút, 1.000/ngày
Model có sẵn	Flash và Flash-Lite
Gemini 2.5 Pro	50 request/ngày

1.000 request/ngày đủ để phủ workload hàng ngày thông thường của một developer chuyên nghiệp. Giới hạn của Pro model (50/ngày) khá chặt chẽ với người dùng nặng nhưng đủ để kiểm tra định kỳ. Cả hai giới hạn đều kết thúc vào ngày 18 tháng 6 năm 2026.

API key (pay-as-you-go)

Model	Input (≤200K ctx)	Input (>200K ctx)	Output (≤200K ctx)	Output (>200K ctx)
Gemini 2.5 Pro	$1.25/M token	$2.50/M token	$10.00/M token	$15.00/M token
Gemini 2.5 Flash	$0.30/M token	—	$2.50/M token	—

Nguồn: Gemini API pricing. Context caching giảm chi phí input ~90% cho nội dung lặp lại. Batch API giảm 50% với thời gian xử lý 24 giờ.

So với Claude Code

Claude Code yêu cầu gói Max $20/tháng — không có gói API riêng cho CLI, không có free tier. Free tier 1.000 request/ngày của Gemini CLI là cách duy nhất có ý nghĩa để dùng một terminal AI agent đủ năng lực mà không mất chi phí. Lựa chọn đó kết thúc ngày 18 tháng 6.

Cái bẫy mồi nhử: chuyện gì đã xảy ra

Google ra mắt Gemini CLI dưới dạng mã nguồn mở Apache 2.0 vào tháng 6 năm 2025. Cộng đồng phản hồi nhanh chóng: các contributor bên ngoài gửi cải tiến vào codebase trong suốt năm đầu. Những đóng góp đó đã cải thiện sản phẩm của Google.

Ngày 19 tháng 5 năm 2026, Google thông báo chuyển sang Antigravity CLI. Antigravity CLI là phần mềm độc quyền — không mã nguồn mở, không thể fork, không thể kiểm tra. Các contributor bên ngoài không có con đường nào để tiếp tục đóng góp vào phiên bản kế tiếp.

Apache 2.0 không yêu cầu Google giữ bất cứ thứ gì ở dạng mở. Đó không phải vấn đề. Vấn đề là những developer đã đóng góp với kỳ vọng vào một công cụ mã nguồn mở lâu dài, cuối cùng lại nhận được một sản phẩm thương mại, mà không có cách nào để theo đuổi những đóng góp của mình.

Antigravity CLI: bạn nhận được gì khi chuyển sang

Tính năng	Gemini CLI	Antigravity CLI
Agent skills	Có	Có
Hooks	Có	Có
Subagent	Có	Có
Plugin (trước đây là extension)	Không	Có
Background / async multi-agent	Không	Có
Viết bằng	Node.js	Go
Mã nguồn mở	Apache 2.0	Không
Free tier (cá nhân)	Có (đến ngày 18 tháng 6)	Không
Enterprise (Code Assist plans)	Có	Có

Khả năng điều phối nền — nhiều agent chạy song song trên cùng một task — là năng lực mới thực sự. Antigravity CLI được viết bằng Go, Google tuyên bố điều này giúp nó “nhanh hơn và phản hồi tốt hơn.”

Với các nhóm doanh nghiệp đã dùng Google Cloud: quá trình chuyển đổi có thể suôn sẻ. Với các developer cá nhân và người đóng góp mã nguồn mở: điều khoản đã thay đổi.

Nếu bạn có file GEMINI.md, hãy xem lại — Antigravity CLI dùng cùng định dạng. Nếu bạn có cấu hình MCP server, hãy kiểm tra khả năng tương thích; schema cấu hình tương tự nhưng không đảm bảo giống hệt nhau qua major version.

Kết luận

Gemini CLI đã thực hiện đúng lời hứa cốt lõi: context window 1M token, quyền truy cập miễn phí có ý nghĩa, Google Search grounding trong khi làm việc, và mã nguồn Apache 2.0. Trong benchmark Express.js refactor, nó chậm hơn Claude Code 47 phút và cần ba lần sửa thủ công. Nó có vấn đề ổn định thực sự với các phiên làm việc dài và lỗ hổng RCE CVSS 10.0 trong tích hợp CI.

Nếu bạn đã dùng nó ở free tier: xứng đáng trong thời gian nó còn hoạt động. Hãy chuyển sang giải pháp khác trước ngày 18 tháng 6.

Để chọn terminal AI coding agent tiếp theo:

Claude Code — dẫn đầu benchmark hiện tại, gói $20/tháng, chất lượng code tốt nhất với task phức tạp. Không có free tier. Lựa chọn toàn diện nhất cho hầu hết developer. Xem so sánh Gemini CLI vs Claude Code nếu bạn đang phân vân giữa hai.
Antigravity CLI — phiên bản kế nhiệm trực tiếp cho các nhóm doanh nghiệp trên Google Cloud. Độc quyền, không có free tier cá nhân.
Codex CLI — nếu bạn muốn dùng model OpenAI trên terminal. Mã nguồn mở, thực thi trong sandbox (Gemini CLI không có), không có free tier.

Terminal AI agent miễn phí dành cho developer cá nhân đã không còn nữa. Đó là thực tế hiện tại.

Lưu ý

Các số liệu benchmark (SWE-bench Verified, thời gian Express.js refactor) đến từ các nguồn bên thứ ba đã được công bố — chúng tôi không chạy lại độc lập. Phân tích lỗ hổng RCE CVSS 10.0 dựa trên các security advisory công khai. Gemini CLI cập nhật hàng tuần; hành vi trên các phiên bản cũ hơn v0.45.2 có thể khác. toolchew không có quan hệ tài chính với Google.

Tham khảo

Gemini CLI GitHub repo — google-gemini/gemini-cli (v0.45.2, ngày 5 tháng 6 năm 2026)
Thông báo chuyển sang Antigravity CLI — Google Developers Blog (tháng 5 năm 2026)
Gemini 3 Flash trong Gemini CLI — Google Developers Blog
Gemini API pricing — ai.google.dev
Lỗ hổng RCE CVSS 10.0 trong Gemini CLI — CSO Online (tháng 4 năm 2026)
Google vá lỗ hổng CVSS 10 trong Gemini CLI — HackRead (tháng 4 năm 2026)
So sánh Claude Code vs Codex CLI vs Gemini CLI — CodeAnt AI
Gemini CLI bị khai tử — Hacker News (tháng 6 năm 2026)
Google I/O 2026 Developer keynote — Google Developers Blog
MCP với Gemini CLI — tài liệu chính thức