LLM và RAG nở rộ như một phương pháp tận dụng tối ưu khả năng của LLM để tạo ra những ứng dụng cực kỳ thông minh và dễ triển khai. Kỹ năng này dường như đã trở thành 1 kỹ năng cần có cho một AI engineer ở thời điểm hiện tại và là một điểm cộng cực kỳ lớn nếu bạn là một Developer ở các vị trí khác.
Nếu bạn chưa biết thì đừng ngại ngần xem qua bài viết của mình về LLM và RAG, đồng thời tham khảo qua các bài hướng dẫn cấp tốc bên dưới nhé. Chắc chắn bạn sẽ nắm vững cách xây dựng RAG với LLM chỉ trong một vài tuần
- Langchain: Hướng dẫn xây dựng ứng dụng với OpenAI
- Series bài viết: Xây dựng ứng dụng với các mô hình ngôn ngữ lớn LLMs
1. Xây dựng chatbot Q&A sử dụng GPT-4 API
Tạo chatbot thông minh sử dụng GPT-4 API có thể trả lời câu hỏi, tạo nội dung, dịch văn bản,…
Những gì bạn sẽ học được:
- Cách thiết lập giao diện chatbot tương tác.
- Xử lý ngữ cảnh hội thoại để chatbot phản ứng linh động.
- Biết cách gọi API của OpenAI và sử dụng các mô hình GPT-4.
Link bài hướng dẫn: https://www.freecodecamp.org/news/build-gpt-4-api-chatbot-turorial/
2. Tóm tắt Video với LLM
Tóm tắt video YouTube bằng cách sử dụng Mô hình Ngôn ngữ Lớn (LLMs) và phụ đề từ Hệ thống Nhận diện Giọng nói Tự động (ASR).
Những gì bạn sẽ học được:
- Sử dụng YouTube Transcript API để trích xuất phụ đề video.
- Điều chỉnh phụ đề tự động ASR bằng cách sửa lỗi dấu câu với thư viện Rpunct .
- Thực hiện truy vấn mô hình OpenAI để tóm tắt hoặc trả lời câu hỏi dựa trên nội dung video.
Link bài hướng dẫn: https://blog.gopenai.com/summarize-a-video-with-llm-a-tutorial-a78c8e300925
3. Finetune LLM với Qlora
Tinh chỉnh các mô hình ngôn ngữ lớn (LLMs) đã được huấn luyện trước bằng phương pháp QLoRA (Quantized Low-Rank Adaptation). giúp tiết kiệm bộ nhớ, cho phép bạn tùy chỉnh mô hình mà không cần nhiều tài nguyên.
Những gì bạn sẽ học được:
- Thiết lập và tinh chỉnh Phi-2 bằng QLoRA với dữ liệu tùy chỉnh.
- Sử dụng HuggingFace để huấn luyện và đánh giá mô hình.
- Cách đánh giá mô hình đã finetune bằng các chỉ số như ROUGE.
Link bài hướng dẫn: https://dassum.medium.com/fine-tune-large-language-model-llm-on-a-custom-dataset-with-qlora-fb60abdeba07
4. Hệ thống trả lời câu hỏi
Hệ thống trả lời câu hỏi với độ chính xác và tính liên quan của câu trả lời được cải thiện sử dụng phương pháp RAG và mô hình mã nguồn mở Mistral-7B.
Những gì bạn sẽ học được:
- Thiết lập một pipeline RAG với các nguồn dữ liệu bên ngoài.
- Sử dụng các vector store như Chroma để truy xuất dữ liệu.
- Cách sử dụng LLM mã nguồn mở như Mistral-7B.
Link bài hướng dẫn: https://dassum.medium.com/fine-tune-large-language-model-llm-on-a-custom-dataset-with-qlora-fb60abdeba07
5. Hệ thống gợi ý thông minh
Sử dụng các mô hình ngôn ngữ lớn và RAG để xây dựng hệ thống gợi ý về các sản phẩm thời trang cho sàn thương mại điện tử.
Các điểm bạn sẽ học qua khóa học:
- Hệ thống gợi ý truyền thống và các vấn đề của nó.
- Cách LLM và RAG cải thiện hệ thống gợi ý bằng cách hiểu nội dung và ý tưởng của các sản phẩm mới.
- Khai thác nguồn thông tin từ bình luận, hồ sơ người dùng và chi tiết sản phẩm.
Link bài hướng dẫn: https://medium.com/@shireenchand/leveraging-llm-fine-tuning-and-rag-for-advanced-recommendation-engines-a3d683e39976