Đếm Token LLM

Các mô hình ngôn ngữ lớn xử lý văn bản dưới dạng chuỗi "token" — những đoạn 1 hoặc vài ký tự được ánh xạ vào từ vựng số. OpenAI tính phí GPT-4 và GPT-3.5 theo token, Anthropic tính phí Claude theo token, và mỗi mô hình có giới hạn cửa sổ ngữ cảnh cứng (8K, 128K, 200K, 1M+ token). Bộ đếm tính chính xác số token cho mô hình OpenAI (dùng bộ mã BPE tương thích tiktoken chạy trong trình duyệt) và ước lượng theo tỉ lệ ký tự/token cho Claude và Gemini, do Anthropic và Google chưa công bố tokenizer. Dùng để kiểm tra prompt có lọt cửa sổ ngữ cảnh, dự đoán chi phí API, hoặc debug truncation — tất cả không gửi văn bản đi đâu.

Xem tất cả Công cụ lập trình

Định dạng JSON

Mã hóa/Giải mã Base64

Tạo UUID

Kiểm tra Regex

Đếm Token LLM

Xem tất cả Công cụ lập trình

Định dạng JSON

Mã hóa/Giải mã Base64

Tạo UUID

Kiểm tra Regex

Đếm Token LLM là gì?

Tham khảo nhanh: ký tự/token (tiếng Anh)

FAQ