Trong bài viết trước, chúng ta đã cài đặt thành công CLIProxyAPI để biến CLI thành API. Tuy nhiên, nếu bạn là một "Hardcore Coder" sử dụng Cursor để refactor cả một dự án lớn, hoặc chạy một Agent AI tự động crawl dữ liệu, sớm muộn gì bạn cũng sẽ gặp kẻ thù mang tên: HTTP 429 - Too Many Requests.

Các gói miễn phí (Free Tier) hoặc thậm chí gói trả phí của Gemini và Claude đều có giới hạn số lượng request trong một phút (RPM) hoặc một ngày (RPD).

Giải pháp là gì? Mua thêm gói Enterprise? Không cần thiết. Giải pháp của chúng ta là: Load Balancing (Cân bằng tải). Chúng ta sẽ cấu hình để CLIProxyAPI tự động luân chuyển giữa 3 tài khoản khác nhau. Nếu tài khoản A bị chặn, nó tự động nhảy sang B, rồi sang C.

Nguyên lý hoạt động của Multi-Account Routing

Hãy tưởng tượng CLIProxyAPI như một người điều phối giao thông. Thay vì cho tất cả xe (request) đi vào một làn đường (tài khoản 1) gây tắc nghẽn, nó sẽ phân chia xe đi đều vào 3 làn đường.

Có 2 chiến thuật chính mà chúng ta sẽ cấu hình:

  1. Round Robin (Xoay vòng): Request 1 -> Acc 1, Request 2 -> Acc 2, Request 3 -> Acc 3.
  2. Failover (Dự phòng): Dùng Acc 1 cho đến khi lỗi, sau đó mới chuyển sang Acc 2.

Hôm nay tôi sẽ hướng dẫn bạn cấu hình Round Robin để tối ưu hóa tốc độ và giảm thiểu rủi ro bị khóa tài khoản do spam.

Bước 1: Chuẩn bị Session Token

Đầu tiên, bạn cần đăng nhập vào cả 3 tài khoản Google (hoặc Anthropic/OpenAI) mà bạn muốn sử dụng.

Với CLIProxyAPI, cách đơn giản nhất là sử dụng tham số --profile khi đăng nhập để tạo ra các file session riêng biệt.

Mở Terminal và chạy lần lượt:

# Đăng nhập tài khoản 1 (Ví dụ: [email protected])
cliproxyapi --login --profile primary

# Đăng nhập tài khoản 2 (Ví dụ: [email protected])
cliproxyapi --login --profile backup1

# Đăng nhập tài khoản 3 (Ví dụ: [email protected])
cliproxyapi --login --profile backup2

Sau bước này, trong thư mục cấu hình (thường là ~/.config/cliproxyapi/sessions/), bạn sẽ thấy 3 file session tương ứng.

Bước 2: Chỉnh sửa file config.yaml

Đây là bước quan trọng nhất. Hãy mở file cấu hình chính tại ~/.config/cliproxyapi/config.yaml bằng trình soạn thảo yêu thích của bạn (VS Code, Nano, Vim).

Chúng ta sẽ khai báo một provider mới sử dụng chiến thuật round_robin.

Dưới đây là mẫu code cấu hình chuẩn (bạn có thể copy và chỉnh sửa):

server:
  host: "0.0.0.0"
  port: 8085

# Cấu hình Providers
providers:
  - name: "gemini-load-balanced"
    type: "gemini-wrapper"
    
    # KÍCH HOẠT CHẾ ĐỘ LOAD BALANCING
    strategy: "round_robin" 
    
    # Tự động loại bỏ tài khoản chết trong 5 phút
    health_check:
      enabled: true
      interval: 300 
    
    # Danh sách tài khoản
    accounts:
      - profile: "primary"
        weight: 10 # Ưu tiên dùng nhiều hơn (nếu muốn)
      
      - profile: "backup1"
        weight: 5
      
      - profile: "backup2"
        weight: 5

# Map tên model để gọi từ bên ngoài
models:
  - alias: "gpt-4o" # Giả lập tên model của OpenAI để lừa Cursor
    provider: "gemini-load-balanced"
    target_model: "gemini-2.0-pro-exp-0119" # Model thực tế của Google
Giải thích:strategy: "round_robin": Hệ thống sẽ chia đều request.weight: Trọng số. Nếu tài khoản chính của bạn là gói trả phí (Premium), hãy để weight cao hơn để tận dụng nó nhiều hơn.alias: "gpt-4o": Đây là một thủ thuật nhỏ. Một số ứng dụng chỉ chấp nhận tên model chuẩn của OpenAI. Chúng ta đặt alias để khi ứng dụng gọi gpt-4o, hệ thống thực chất lại chạy gemini-2.0.

Bước 3: Kiểm tra hoạt động (Health Check)

Sau khi lưu file, hãy khởi động lại server:

cliproxyapi restart

Để kiểm tra xem Load Balancing có hoạt động không, hãy theo dõi log thời gian thực. Mở một terminal khác và gõ:

tail -f ~/.config/cliproxyapi/logs/access.log

Bây giờ, hãy thử gửi 3 request liên tiếp từ Cursor hoặc Postman. Bạn sẽ thấy log hiện ra tương tự như sau:

[INFO] Request #1 -> Routed to profile: primary (Success)
[INFO] Request #2 -> Routed to profile: backup1 (Success)
[INFO] Request #3 -> Routed to profile: backup2 (Success)
[INFO] Request #4 -> Routed to profile: primary (Success)

Nếu bạn thấy dòng log này, chúc mừng! Bạn đã vừa nhân ba sức mạnh xử lý của mình.

Lời khuyên cho "Nông dân cày AI"

  1. Đừng lạm dụng: Dù bạn có 10 tài khoản, Google/OpenAI vẫn có cơ chế phát hiện IP. Nếu bạn spam quá mức từ 1 IP, họ có thể chặn cả dải IP. Hãy dùng vừa phải.
  2. Kết hợp với VPN (Nâng cao): Nếu bạn thực sự muốn xây dựng một hệ thống quy mô lớn, hãy cấu hình proxy riêng cho từng profile trong file config (CLIProxyAPI có hỗ trợ SOCKS5 proxy cho từng account con).
  3. Bảo mật: File session chứa token truy cập nhạy cảm. Tuyệt đối không share file config hay folder sessions cho người khác.

Với cấu hình này, bạn đã biến chiếc máy tính cá nhân thành một trạm trung chuyển AI mạnh mẽ, sẵn sàng cho mọi tác vụ nặng nề nhất mà không lo bị ngắt quãng giữa chừng.