AI / Kiến thức · 28/05/2023 0

Top 5 Mô hình ngôn ngữ lớn cho ứng dụng AI của bạn

Những mô hình ngôn ngữ lớn gần đây đã gây bão internet bởi khả năng bất ngờ của chúng trên phương diện giao tiếp và trao đổi thông tin với con người.

Thật tuyệt nếu bạn có thể sở hữu riêng một ứng dụng AI có tích hợp một chatbot tuyệt vời như thế đúng không nào??

Dưới đây là một số mô hình ngôn ngữ lớn TỐT NHẤT hiện nay mà bạn có thể triển khai cho ứng dụng trí tuệ nhân tạo của mình:

1. GPT-3/GPT-4/chatGPT (OpenAI)

Là cái tên được nhắc đến nhiều nhất trong thời gian gần đây, GPT – mô hình ngôn ngữ được công bô bởi OpenAI đã cho phép bạn sử dụng miễn phí và truy xuất thông qua API (có trả phí).

Ngoài ra bạn cũng có thể đăng ký subscription để được quyền truy cập vào GPT4 và khả năng thêm ảnh vào trong input của nó, số lượng token đầu vào cho phép của GPT-4 lên với 32k tokens (khoảng 5 trang tài liệu).

? [https://openai.com/]

2. BLOOM (BigScience)

Được công bố vào tháng 11 năm 2022, BLOOM (BigScience Large Open-Science Open-Access Multilingual Language Model) là sản phẩm LLMs của hơn 1000 nhà nghiên cứu trên thế giới.

Nó có thể sử dụng 46 ngôn ngữ tự nhiên và 13 ngôn ngữ lập trình khác nhau. Mô hình của BigScience đã được train trên 366 tỷ token và public trên huggingface.

Bạn có thể tham khảo lại link bên dưới
? [https://huggingface.co/bigscience/bloom]

3. LaMDA (Google)

LaMDA là mô hình ngôn ngữ lớn được Google công bố vào tháng 5 năm 2021 và gần đây đã được sử dụng để tạo ra BARD, chatbot mới nhất của google cạnh tranh với chatGPT.

BARD tập trung vào khả năng trả lời và phản xạ giống y hệt con người, ngoài ra, việc kết nối internet cũng giúp cho BARD có thể biết được những thông tin mới nhất về các vấn đề được hỏi.

Hiện tại, API cho BARD chỉ được công khai dưới dạng Early Access
? [https://bard.google.com/?hl=en]

4. LLaMA (Meta AI)

Tháng 2 năm 2023, Meta AI đã công bố LLaMA (Large Language Model Meta AI), kèm theo việc cho phép cá nhân apply để tải mô hình về với mục đích research. Điều này đã cho phép dân chủ hóa LLMs, tức là tất cả mọi người đều có thể tự sở hữu 1 MML cho riêng mình.
Những mô hình pretrained của LLaMA trải dài từ 7 tỷ đến 65 tỷ tham số và được train trên các tập dữ liệu khác nhau.

? [https://docs.google.com/…/1FAIpQLSfqNECQnMkycA…/viewform

5. Stanford Alpaca (Stanford)

Stanford Alpaca là mô hình được tinh chỉnh từ LLaMA 7B của Meta AI, với mục tiêu tạo ra một mô hình nhẹ, hiệu quả và chi phí thấp.

Alpaca có thể cạnh tranh với mô hình text-davinci-003 của OpenAI với chỉ 7 tỷ tham số (Mô hình lớn nhất hiện nay, GPT-4 chưa công bố nhưng được ước tính có hơn 1000 tỷ tham số). Điều này khiến cho Alpaca, thậm chí có thể triển khai trên một con Raspberry Pi (chậm).
? [https://crfm.stanford.edu/2023/03/13/alpaca.html

Tổng kết

Ngoài những cái tên kể trên mà bạn có thể sử dụng, vẫn còn có những cái tên đáng phải kể tới trong lĩnh vực LLMs như MT-NLG, Chinchilla70B and PaLM-540B. Các bạn có thể tìm hiểu thêm nhé.

Các bạn chưa biết cách triển khai có thể comment bên dưới để mình viết bài hướng dẫn nhé.