Báo cáo tình hình phát triển mô hình ngôn ngữ lớn (LLM) tiếng Việt dựa trên nền tảng VMLU do Zalo AI công bố đã ghi nhận sự phát triển mạnh mẽ của các LLM do người Việt huấn luyện.
Ngày 10/01, Zalo AI chính thức công bố Báo cáo tình hình phát triển các mô hình ngôn ngữ lớn (Large Language Model - LLM) tiếng Việt trong năm 2024 dựa trên nền tảng đánh giá và xếp hạng năng lực tiếng Việt VMLU (Vietnamese Multitask Language Understanding Benchmark Suite for Large Language Models).
Trong đó, bảng xếp hạng mô hình ngôn ngữ lớn tiếng Việt (VMLU Leaderboard) dựa trên điểm số về năng lực ở các lĩnh vực: tổng quát, STEM, khoa học xã hội, khoa học nhân văn và mở rộng (kết quả tính tới ngày 31/12/2024).
Bước tiến của cộng đồng AI trong phát triển LLM tiếng Việt
Với sự tham gia của ngày càng nhiều các tổ chức và cá nhân, báo cáo của Zalo AI ghi nhận sự nở rộ mạnh mẽ của các mô hình ngôn ngữ lớn hướng đến người dùng Việt Nam. Cụ thể trong năm 2024, VMLU công bố 45 LLM trên bảng xếp hạng, tiếp nhận yêu cầu đánh giá của hơn 155 tổ chức & cá nhân, tổng kết 691 lượt tải bộ tiêu chuẩn đánh giá và 3.729 lượt đánh giá LLM từ nền tảng.
Kết quả còn khiêm tốn khi so sánh với các nước phát triển trên thế giới. Tuy nhiên, trong bối cảnh AI tạo sinh còn tương đối mới mẻ tại Việt Nam, đồng thời việc phát triển LLM có những hạn chế lớn như thiếu dữ liệu, hạ tầng và nguồn lực, bước tiến này đã phản ánh nỗ lực tiếp cận công nghệ tiên tiến toàn cầu của các đơn vị, cũng như triển vọng của lĩnh vực này tại Việt Nam.