Bạn đã bao giờ rơi vào tình cảnh này chưa: Bạn có tài khoản Google One AI Premium (với Gemini Advanced), bạn có quyền truy cập vào Claude Code hay ChatGPT Plus, nhưng khi muốn code trong Cursor, Windsurf hay xây dựng một con AI Agent riêng, bạn vẫn phải... móc ví trả tiền cho API Key?

Đó là một sự lãng phí tài nguyên khủng khiếp.

Hôm nay, tôi sẽ giới thiệu cho bạn một "vũ khí bí mật" mà giới lập trình viên đang rỉ tai nhau. Một công cụ mã nguồn mở giúp bạn tận dụng tối đa các gói subscription có sẵn để tạo ra các API endpoint miễn phí (hoặc nằm trong gói cước sẵn có). Chào mừng bạn đến với thế giới của CLIProxyAPI.

Lưu ý quan trọng: Bài viết này dành cho mục đích giáo dục và nghiên cứu kỹ thuật. Hãy luôn tuân thủ điều khoản sử dụng (ToS) của các nhà cung cấp dịch vụ AI.

CLIProxyAPI là gì?

router-for-me/CLIProxyAPI không phải là một mô hình AI mới. Nó là một Proxy Server thông minh.

Hãy tưởng tượng thế này: Các công cụ như Gemini CLI, Antigravity, ChatGPT Codex hay Claude Code thường hoạt động dưới dạng dòng lệnh (Command Line Interface) và sử dụng cơ chế xác thực OAuth (đăng nhập bằng trình duyệt) thay vì API Key tính phí theo token.

CLIProxyAPI đứng ở giữa, nó thực hiện hai việc:

  1. Giả lập môi trường CLI: Nó đăng nhập và giữ kết nối với các dịch vụ kia như thể nó là một người dùng đang gõ lệnh.
  2. Chuyển đổi sang chuẩn API: Nó mở ra một cổng (port) trên máy bạn, nhận các yêu cầu chuẩn OpenAI (như /v1/chat/completions) và chuyển tiếp chúng đến các CLI kia.

Kết quả? Bạn có một đường dẫn API http://localhost:8080/v1 tương thích hoàn toàn với OpenAI, nhưng lại chạy trên nền tảng "miễn phí" hoặc "unlimited" của các gói subscription mà bạn đã mua.

Tại sao bạn cần công cụ này ngay bây giờ?

Dựa trên thông tin mới nhất từ repository router-for-me/CLIProxyAPI, công cụ này đang hỗ trợ những tính năng mà nếu bỏ qua, bạn sẽ thấy mình "lạc hậu":

1. Truy cập các Model "Hàng Hiếm" và Tương Lai

Nhà phát triển của CLIProxyAPI tuyên bố công cụ này cho phép bạn trải nghiệm các model cực mới như Gemini 2.5 Pro hay GPT-5 (thông qua các kênh preview/beta của các CLI tương ứng). Thay vì chờ đợi OpenAI hay Google mở API public với giá cắt cổ, bạn có thể trải nghiệm chúng thông qua các công cụ nội bộ hoặc beta mà CLIProxyAPI đã wrap lại.

2. Tiết kiệm chi phí khổng lồ

Nếu bạn dùng Cursor để code, bạn biết rằng chi phí API rất đắt. Với CLIProxyAPI:

  • Dùng Gemini CLI (thường có hạn mức miễn phí rất cao).
  • Dùng Claude Code (tận dụng gói Claude Pro/Team của bạn).
  • Không còn lo về hóa đơn cuối tháng sưng vù vì lỡ chạy một vòng lặp agent vô tận.

3. Hỗ trợ đa nền tảng "All-in-One"

Không chỉ wrap một loại, nó hỗ trợ:

  • Gemini CLI & Antigravity
  • ChatGPT Codex
  • Claude Code
  • Qwen Code
  • iFlow

Đặc biệt, nó có tính năng Multi-account Load Balancing (Cân bằng tải nhiều tài khoản). Bạn có 3 tài khoản Google? Nó sẽ tự động xoay vòng để tối ưu hóa hạn mức rate limit.

Hướng dẫn cài đặt nhanh (Quick Start)

Dành cho người dùng macOS và Linux (Windows có thể dùng qua WSL hoặc Docker), cách nhanh nhất là dùng Homebrew:

Bash

# Thêm tap của router-for-me
brew tap router-for-me/tap

# Cài đặt CLIProxyAPI
brew install cliproxyapi

Sau khi cài đặt, bạn cần thực hiện đăng nhập (OAuth) cho các dịch vụ mình muốn dùng. Ví dụ với Gemini:

Bash

cliproxyapi --login
# Một cửa sổ trình duyệt sẽ hiện ra để bạn cấp quyền truy cập

Sau khi đăng nhập thành công, bạn khởi chạy server:

Bash

cliproxyapi start

Mặc định, server sẽ lắng nghe tại cổng 8085 (hoặc cổng bạn cấu hình). Lúc này, endpoint API của bạn sẽ là: http://localhost:8085/v1

Cách tích hợp vào Cursor / VS Code

Đây là phần thú vị nhất. Để dùng "API nhà làm" này trong Cursor:

  1. Mở cài đặt của Cursor (Settings).
  2. Tìm phần Models hoặc OpenAI Base URL.
  3. Ghi đè Base URL thành: http://localhost:8085/v1
  4. Nhập API Key: Bạn có thể nhập bất kỳ chuỗi nào (ví dụ: sk-cliproxy-provip), vì CLIProxyAPI dùng session token nên thường không check key này (trừ khi bạn cấu hình bảo mật riêng).
  5. Thêm tên Model: Hãy thêm tên model mà CLIProxyAPI hỗ trợ (ví dụ: gemini-2.5-pro-latest hoặc tên mapping trong file config).

Kết luận

router-for-me/CLIProxyAPI không chỉ là một công cụ "tiết kiệm tiền". Nó là minh chứng cho tinh thần của cộng đồng nguồn mở: Sáng tạo, Phá vỡ rào cản và Tối ưu hóa.

Thay vì bị giới hạn bởi các cổng API đắt đỏ, giờ đây bạn có thể biến các công cụ CLI mạnh mẽ thành các trợ lý ảo phục vụ cho quy trình làm việc (workflow) riêng của mình. Dù bạn là một Indie Hacker muốn tiết kiệm chi phí, hay một kỹ sư AI muốn test các model Beta mới nhất, đây là công cụ "must-have" trong năm 2026.

Bạn đã sẵn sàng để "hack" năng suất của mình chưa?