ViGen là dự án xây dựng bộ dữ liệu tiếng Việt phục vụ nghiên cứu, phát triển và ứng dụng AI thuộc Chương trình Thách thức Đổi mới sáng tạo Việt Nam 2025 (VIC) do Trung tâm đổi mới sáng tạo Quốc gia (NIC) – Bộ Tài chính, tập đoàn Meta và Quỹ AI for Vietnam cùng khởi xướng. Dự án ViGen và Viện Công nghệ thông tin - Viện Hàn lâm Khoa học và Công nghệ Việt Nam đã chính thức ký kết biên bản ghi nhớ hợp tác trong tháng 6/2025. Sự kiện này đã đánh dấu bước tiến quan trọng, nhằm phát huy chức năng thế mạnh của mỗi bên để tạo hiệu quả thực hiện dự án “ Xây dựng bộ dữ liệu tiếng Việt mã nguồn mở ViGen phục vụ nghiên cứu, phát triển và ứng dụng AI”.
Được công bố từ tháng 3/2025, Dự án ViGen do Tập đoàn Meta (Hoa Kỳ), Trung tâm Đổi mới Sáng tạo Quốc gia (NIC) – Bộ Tài chính và Quỹ Trí tuệ nhân tạo cho Việt Nam (AI for Vietnam Foundation – AIV) khởi xướng. Đây là dự án nền tảng cho hệ sinh thái AI tại Việt Nam, với sự tham gia của cơ quan đầu mối quốc gia về KHCN & ĐMST (Trung tâm NIC) cùng các đối tác công nghệ hàng đầu thế giới như Meta, AIV. Trong bối cảnh từ Nghị quyết 57 của Bộ Chính trị về đột phá phát triển KHCN, ĐMST và chuyển đổi số quốc gia, ViGen xuất hiện đúng thời điểm, thể hiện sự cam kết về pháp lý, nguồn lực của Chính phủ đối với sự phát triển và tăng cường năng lực làm chủ công nghệ AI tại Việt Nam, đồng thời với việc thu hút đầu tư và hợp tác quốc tế từ các quốc gia phát triển, tập đoàn công nghệ hàng đầu thế giới. Dự án được đảm bảo nguồn lực tài chính, công nghệ, và định hướng chiến lược phát triển lâu dài cho hệ sinh thái AI tại Việt Nam.
Trong Biên bản ghi nhớ giữa ViGen và Viện Công nghệ thông tin (Viện CNTT) – Viện Hàn lâm KHCN Việt Nam, Viện CNTT đảm nhiệm vai trò chính trong các vấn đề liên quan tới công nghệ AI; quản trị, thu thập, làm sạch kho dữ liệu mở liên quan việc huấn luyện mô hình; tham gia xây dựng bộ chỉ tiêu đánh giá các mô hình ngôn ngữ lớn (Large Language Model – LLM) cho tiếng Việt. Với vai trò là viện nghiên cứu đầu ngành trong cả nước, có chuyên môn sâu và hạ tầng công nghệ hiện đại hàng đầu quốc gia trong lĩnh vực AI, Viện được lựa chọn là đối tác công nghệ chính của ViGen, đóng vai trò lớn trong việc thu thập, xử lý, và đánh giá dữ liệu, cũng như phát triển các thuật toán và mô hình AI dựa trên bộ dữ liệu tiếng Việt.
Sự kết hợp giữa Viện CNTT và các đối tác sáng lập ViGen như NIC, Meta và AIV tối ưu hóa nguồn lực và chuyên môn của các bên đạt được mục tiêu của Dự án. Dự án sẽ thúc đẩy quá trình phát triển các mô hình AI nền tảng "thuần Việt". Dựa trên các mô hình nền tảng này, các ứng dụng AI thông minh được phát triển và tích hợp dễ dàng hơn, góp phần quan trọng vào việc bản địa hóa AI, giúp AI hiểu rõ hơn về văn hóa và bối cảnh cũng như cách diễn đạt trong tiếng Việt, từ đó phục vụ tốt hơn cho người dùng và doanh nghiệp tại thị trường Việt Nam.
Thông tin tham khảo về Dự án ViGen tại đường link: