🇻🇳 VI 🇬🇧 EN

🚀 Hướng dẫn sử dụng API

Nghimmo API - Tương thích Cursor / Cline / Claude Code

📌 Thông tin chung

Mục Giá trị
Base URL https://api.nghimmo.com/v1
API Key sk-xxxxxxxxxxxx (đã cấp riêng)
Trang kiểm tra token api.nghimmo.com/check
Format hỗ trợ OpenAI & Anthropic compatible

🤖 Danh sách Model

Mạnh nhất — dùng cho việc khó, cần suy luận sâu.

nghi/claude-opus-4.8
nghi/claude-opus-4.8-thinking
nghi/claude-opus-4.7
nghi/claude-opus-4.7-thinking
nghi/claude-opus-4.6
nghi/claude-opus-4.6-thinking
nghi/claude-opus-4.5
nghi/claude-opus-4.5-thinking

Cân bằng giữa chất lượng và chi phí — khuyên dùng hằng ngày.

nghi/claude-sonnet-4.6
nghi/claude-sonnet-4.6-thinking
nghi/claude-sonnet-4.5
nghi/claude-sonnet-4.5-thinking
nghi/claude-sonnet-4
nghi/claude-sonnet-4-thinking

Nhanh, rẻ token — dùng cho việc nhẹ (sửa typo, đổi tên, hỏi nhanh).

nghi/claude-haiku-4.5
nghi/claude-haiku-4.5-thinking

GPT, DeepSeek, GLM, Qwen, MiniMax... và nghi/auto (tự chọn).

nghi/gpt-4o
nghi/gpt-4
nghi/deepseek-3.2
nghi/deepseek-3.2-thinking
nghi/glm-5
nghi/glm-5-thinking
nghi/qwen3-coder-next
nghi/qwen3-coder-next-thinking
nghi/minimax-m2.5
nghi/minimax-m2.5-thinking
nghi/minimax-m2.1
nghi/minimax-m2.1-thinking
nghi/auto

⚡ Hướng dẫn cấu hình theo IDE

Chọn tab tương ứng với công cụ bạn đang dùng. Mọi cấu hình đều dùng chung:

Cách nhanh nhất: tải file dưới đây, copy vào thư mục code rồi double-click. Nhập API Key là dùng được ngay (không cần cài gì thêm).

⬇️ Tải file .bat (Windows) 🍎 Tải file .command (Mac)

Các bước dùng (Windows)

  1. Tải file CLAUDE-CODE-CLI.bat ở trên.
  2. Copy file vào thư mục project (chỗ bạn muốn code).
  3. Double-click file đó.
  4. Nhập API Key (sk-...) rồi Enter.
  5. Claude Code tự mở tại thư mục đó, dùng luôn.

Các bước dùng (Mac)

  1. Tải file CLAUDE-CODE-CLI.command ở trên.
  2. Copy file vào thư mục project (chỗ bạn muốn code).
  3. Lần đầu cần cấp quyền chạy: mở Terminal tại thư mục đó và gõ:
    chmod +x CLAUDE-CODE-CLI.command
  4. Double-click file đó. Nếu macOS báo "không mở được", chuột phải → OpenOpen.
  5. Nhập API Key (sk-...) rồi Enter. Claude Code tự mở tại thư mục đó.
File .command tự trỏ về server Nghimmo trong phiên đó, không cần sửa settings.json. Nếu thích cấu hình cố định, xem mục dưới.

Cấu hình Mac / Linux thủ công (tùy chọn)

Tạo file ~/.claude/settings.json:

{
  "env": {
    "ANTHROPIC_BASE_URL": "https://api.nghimmo.com",
    "ANTHROPIC_API_KEY": "sk-xxxxxxxxxxxx",
    "ANTHROPIC_MODEL": "nghi/claude-opus-4.8",
    "ANTHROPIC_SMALL_FAST_MODEL": "nghi/claude-haiku-4.5"
  }
}
Quan trọng:
  • ANTHROPIC_BASE_URL không/v1
  • ANTHROPIC_SMALL_FAST_MODEL bắt buộc — thiếu sẽ lỗi Bash / Auto mode
  • Model phải có prefix nghi/

Hoặc biến môi trường (Windows CMD)

set ANTHROPIC_BASE_URL=https://api.nghimmo.com
set ANTHROPIC_API_KEY=sk-xxxxxxxxxxxx
set ANTHROPIC_MODEL=nghi/claude-opus-4.8
set ANTHROPIC_SMALL_FAST_MODEL=nghi/claude-haiku-4.5
claude

Mẹo dùng ổn định

Cần cài Node.js và Claude Code trước: npm install -g @anthropic-ai/claude-code

Dành cho khách dùng Claude Code extension trong VS Code, Cursor hoặc Antigravity. Cài extension một lần, rồi tải file .bat tương ứng với công cụ bạn dùng, double-click là tự mở.

📌 Bước chung (làm 1 lần): Cài extension Claude Code (của Anthropic) từ Marketplace của công cụ bạn dùng (VS Code / Cursor / Antigravity đều có).

1️⃣ VS Code

⬇️ Windows (.bat) 🍎 Mac (.command)

2️⃣ Cursor

⬇️ Windows (.bat) 🍎 Mac (.command)

3️⃣ Antigravity

⬇️ Windows (.bat) 🍎 Mac (.command)

Các bước dùng (Windows)

  1. Cài extension Claude Code trong công cụ của bạn (VS Code / Cursor / Antigravity).
  2. Tải đúng file .bat ở trên (tương ứng công cụ bạn dùng).
  3. Đóng hết công cụ đó đang chạy.
  4. Double-click file .bat, nhập API Key (sk-...) rồi Enter.
  5. Công cụ tự mở lên, bấm icon Claude Code ở thanh bên là dùng được.

Các bước dùng (Mac)

  1. Cài extension Claude Code trong công cụ của bạn (VS Code / Cursor / Antigravity).
  2. Tải đúng file .command ở trên, copy vào thư mục project.
  3. Lần đầu cấp quyền chạy bằng Terminal (đổi tên file cho đúng công cụ):
    chmod +x MO-CLAUDE-VSCODE.command
  4. Đóng hết công cụ đó đang chạy.
  5. Double-click file .command. Nếu macOS báo chặn, chuột phải → OpenOpen.
  6. Nhập API Key (sk-...) rồi Enter. Công cụ tự mở, bấm icon Claude Code ở thanh bên là dùng được.
Phải đóng hết công cụ (VS Code / Cursor / Antigravity) trước khi mở file. Nếu đã có cửa sổ đang chạy, biến môi trường mới sẽ không có hiệu lực và Claude Code không trỏ về server Nghimmo được.

Cursor dùng định dạng OpenAI. Cấu hình trong phần Models của Settings.

Các bước

  1. Mở Cursor, vào Settings → Models (hoặc nhấn Ctrl + Shift + J).
  2. Kéo xuống mục OpenAI API Key.
  3. Bật Override OpenAI Base URL và dán:
https://api.nghimmo.com/v1
  1. Dán API Key sk-... vào ô OpenAI API Key.
  2. Bấm Verify để xác nhận, rồi bật key lên.
  3. Thêm model thủ công, ví dụ nghi/claude-sonnet-4.6, rồi chọn để dùng.
Cursor chỉ gọi qua base URL tùy chỉnh khi bạn thêm model thủ công và tắt các model mặc định của Cursor.

Cline là extension trong VS Code. Hỗ trợ cả định dạng OpenAI và Anthropic.

Cách 1 - OpenAI Compatible (khuyên dùng)

  1. Mở Cline, bấm icon Settings (⚙️) ở góc trên.
  2. Mục API Provider chọn OpenAI Compatible.
  3. Base URL:
https://api.nghimmo.com/v1
  1. API Key: dán sk-...
  2. Model ID: nhập ví dụ nghi/claude-sonnet-4.6
  3. Bấm Done rồi chat thử.

Cách 2 - Anthropic

  1. API Provider chọn Anthropic.
  2. Bật Use custom base URL, dán https://api.nghimmo.com
  3. API Key: dán sk-..., chọn model rồi dùng.

Roo Code (bản fork của Cline) cũng là extension VS Code, cấu hình tương tự.

Các bước

  1. Mở Roo Code, bấm icon Settings (⚙️).
  2. API Provider chọn OpenAI Compatible.
  3. Base URL:
https://api.nghimmo.com/v1
  1. API Key: dán sk-...
  2. Model: nhập nghi/claude-sonnet-4.6 (hoặc model khác).
  3. Lưu lại và chat thử.

Continue (extension VS Code / JetBrains) cấu hình qua file config.json.

Các bước

  1. Mở Continue, bấm icon Settings (⚙️) để mở file config.json.
  2. Thêm model vào mảng models như dưới:
{
  "models": [
    {
      "title": "Nghimmo Sonnet",
      "provider": "openai",
      "model": "nghi/claude-sonnet-4.6",
      "apiBase": "https://api.nghimmo.com/v1",
      "apiKey": "sk-xxxxxxxxxxxx"
    }
  ]
}
  1. Lưu file, chọn model "Nghimmo Sonnet" ở thanh chat rồi dùng.

Bất kỳ app nào hỗ trợ OpenAI hoặc Anthropic compatible đều dùng được (ChatBox, LobeChat, NextChat, Open WebUI...).

Định dạng OpenAI

Base URL : https://api.nghimmo.com/v1
API Key  : sk-xxxxxxxxxxxx
Model    : nghi/claude-sonnet-4.6

Định dạng Anthropic

Base URL : https://api.nghimmo.com
API Key  : sk-xxxxxxxxxxxx
Model    : nghi/claude-sonnet-4.6
Nếu app yêu cầu endpoint đầy đủ: /v1/chat/completions (OpenAI) hoặc /v1/messages (Anthropic).

💰 Mẹo tiết kiệm token

Token chủ yếu bị tiêu hao ở context (lịch sử + file đính kèm), không phải ở câu trả lời. Mỗi lần chat, toàn bộ hội thoại được gửi lại — phiên càng dài, mỗi lượt càng tốn. Áp dụng các mẹo dưới để dùng được lâu hơn.

1. Quản lý phiên chat

2. Hạn chế file & ngữ cảnh thừa

3. Chọn model hợp lý

💡 Server tự động bỏ phần suy luận cũ (thinking) và nén lịch sử khi context quá lớn, nhưng cách tiết kiệm tốt nhất vẫn là chủ động /clear/compact.
Nếu thấy báo lỗi "Context quá dài": gõ /compact hoặc /clear rồi gửi lại. Đây là lỗi phía bạn (context vượt giới hạn model), không phải lỗi server.

🔍 Kiểm tra token còn lại

Truy cập trang dưới đây, dán API Key, bấm "Kiểm tra" để xem:

🔑 Mở trang kiểm tra key