Dạo này nếu anh em đang nghịch AI hoặc build mấy tool nội bộ như agent, openclaw, n8n thì chắc cũng đau đầu vụ cost API. Tin vui là hiện tại có khá nhiều option free tier cho anh em xài, không còn kiểu chỉ test cho vui nữa.
Mình tổng hợp lại một số nền tảng mình đã dùng qua hoặc thấy ổn, kèm vài nhận xét thực tế.

Google AI Studio – free tier khủng nhất hiện tại
Nếu phải chọn một cái ngon – dễ dùng – limit cao, thì đây đang là top 1. 1 vài model được free như bên dưới
- Gemini 2.5 Pro: 5 req/phút, 125k tokens/phút
- Gemini 2.5 Flash: 10 req/phút, 250k tokens/phút
- Gemini 2.0 Flash: lên tới 1M tokens/phút
- Embedding: 100 req/phút

NVIDIA NIM – kho model free khá đa dạng
Cái này giống như model playground cho dev hơn, có thể test nhiều model khác nhau cho từng mục đích nhất định.
Ưu điểm:
- Hơn 90 model từ nhiều provider
- Có cả model cho mục đích cụ thể như: detect PII, generate synthetic data
- Free ~40 req/phút
Nhược điểm:
- Context window thường không quá lớn
- Phải verify số điện thoại

GitHub Models – tiện nhưng limit thấp
Rất nhiều model từ các nhà cung cấp khác nhau nhưng giới hạn free tier thì khá thấp, chủ yếu để test xem model có tốt không

Groq – nếu muốn nhanh và dùng các model opensource
Limit ổn, có các model open source để bạn test, ngoài ra còn có cả model embedding và ASR. Vì là model nhỏ nên response nhanh hơn, tiện test app hơn.

Tóm lại thì với các nguồn trên là đủ để bạn tha hồ vọc vach nghiên cứu rồi:
- Agent cá nhân (chat, auto task)
- Flow automation (n8n, OpenCrawl, v.v.)
- Hệ thống xử lý tài liệu (RAG, classify, extract)
- Tool nội bộ cho team






