Từ ngày 28/10/2023 đến 01/11/2023 sẽ diễn ra Triển lãm Quốc tế đổi mới sáng tạo Việt Nam tại Trung tâm Đổi mới sáng tạo Quốc gia (cơ sở Hòa Lạc). Viện Công nghệ thông tin sẽ giới thiệu và trưng bày 06 sản phẩm công nghệ nổi bật của đơn vị tại Triển lãm.
Hạ tầng kỹ thuật hiện đại phục vụ xử lý dữ liệu lớn, siêu tính toán trên nền tảng điện toán đám mây (AI Cloud Data Center)
- Hạ tầng siêu tính toán xử lý dữ liệu cực lớn, các mô hình học máy/trí tuệ nhân tạo tiên tiến (mô hình ngôn ngữ lớn Large Language Models - LLMs như ChatGPT), sử dụng dòng chip chuyên dụng các giải thuật trí tuệ nhân tạo của Nvidia GPU A100 80GB
- Hệ thống đang được triển khai cho các ứng dụng xử lý ngôn ngữ lớn (truy vấn thông minh, dịch ngôn ngữ, xử lý ảnh và phát hiện đối tượng, nhận dạng mặt người…), chia sẻ cho nhiều cơ quan đơn vị nghiên cứu hàng đầu của cả nước (Viện Hàn lâm KHCN Việt Nam, Đại học quốc gia Hà Nội…)
Các sản phẩm được Viện Công nghệ thông tin mang đến buổi Triển lãm bao gồm:
- Nền tảng quản lý và chia sẻ dữ liệu nghiên cứu khoa học và công nghệ dùng chung (opensience.vn)
- Hệ thống giám sát và tổng hợp dữ liệu trên Internet
- Hệ thống thông tin tổng hợp thông tin kinh tế, xã hội
- Ứng dụng mô phỏng quy trình sản xuất thuốc 3D
- Phần mềm kiểm soát lượng người vào ra với sự trợ giúp của camera
- Hệ thống giám sát chất lượng nước nuôi tôm
* Thông tin chính và cấu hình kỹ thuật của AI Cloud DC tại Viện CNTT:
Hệ thống AI Cloud DC tại Viện CNTT là sự tích hợp của 2 thành phần chính. Đó là:
a. Hệ thống Cloud với 20 máy chủ server hiện đại, chịp Intel CPU Xeon Gold, dung lượng bộ nhớ RAM 6 TByte, dung lượng lưu trữ dữ liệu lớn trên SAN khoảng 1 Pbyte. Hạ tầng mạng hiện đại lease-line bandwidth tốc độ cao;
b. Hệ thống AI/ML sử dụng dòng chíp tiên tiến Nvidia GPU A100 80GB. Hệ thống quản trị các luồng công việc phiên bản thương mại mới nhất có bản quyền Bright Software version 9.2 (tháng 12/2022) có tích hợp các bản quyền tăng tốc độ Data Accelerator cho từng chip A100;
c. Các ứng dụng mô hình ngôn ngữ lớn (Large Language Models – LLMs), AI tạo sinh (tương tự ChatGPT), các mô hình phân tích dữ liệu sinh học (gene, DNA…) đang được vận hành tính toán trên hệ thống này. Hiện nay, hệ thống đang hỗ trợ chạy và tinh chỉnh các mô hình ngôn ngữ, dịch máy cho nhiều loại ngôn ngữ khác nhau. Dữ liệu đầu vào hàng trăm triệu câu văn bản. Mô hình LLM đã được thử nghiệm từ 500 triệu tới 50 tỉ tham số Để so sánh, ChatGPT của OpenAI là mô hình ngôn ngữ có 175 tỉ tham số, dựa trên hạ tầng AI Cloud lớn hơn rất nhiều so với hạ tầng tại Viện CNTT (gấp khoảng 200 lần).
* Thông tin chi tiết về các sản phẩm phần mềm:
1. Nền tảng quản lý và chia sẻ dữ liệu nghiên cứu khoa học và công nghệ dùng chung (opensience.vn)
Nền tảng quản lý và chia sẻ dữ liệu nghiên cứu khoa học và công nghệ (KH&CN) dùng chung là sản phẩm của dự án “VINIF2020.DA00171 - xây dựng nền tảng quản trị dữ liệu nghiên cứu khoa học và công nghệ quy mô quốc gia sử dụng công nghệ tính toán đám mây và dữ liệu lớn” do Quỹ đổi mới sáng tạo Vingroup (VINIF) thuộc tập đoàn VinGroup tài trợ, Viện Công nghệ thông tin – Viện Hàn lâm KH&CN Việt Nam là đơn vị chủ trì thực hiện.
Nền tảng cho phép thu thập, lưu trữ quản trị, chia sẻ dữ liệu nghiên cứu KH&CN, tích hợp các công cụ phát triển, thực thi mô hình phân tích dữ liệu, học máy. Đối tượng sử dụng là các nhà khoa học dữ liệu, các cán bộ nghiên cứu, giảng viên, học viên, sinh viên các trường đại học, các cán bộ quản lý trong lĩnh vực khoa học dữ liệu, học máy, trí tuệ nhân tạo (AI).
Nền tảng là môi trường cho phép cộng đồng đóng góp, khai thác, chia sẻ dữ liệu và xây dựng, phát triển các mô hình học máy, phân tích dữ liệu. Nền tảng góp phần quan trọng vào việc thực hiện thắng lợi Chiến lược quốc gia về nghiên cứu, phát triển và ứng dụng trí tuệ nhân tạo đến năm 2030.
Hình ảnh nền tảng quản lý và chia sẻ dữ liệu nghiên cứu khoa học
và công nghệ dùng chung
2. Hệ thống giám sát và tổng hợp dữ liệu trên Internet
Hệ thống giám sát và tổng hợp dữ liệu trên Internet là hệ thống cho phép thu thập thông tin quy mô lớn từ các nguồn dữ liệu từ Internet, file local, tích hợp các hệ thống khác…có khả năng nhận diện và phân tích chuyên sâu các vấn đề thông tin theo nhu cầu người dùng.
Với nhiều phân hệ đa năng, đa dạng được thiết kế rất chi tiết và được xây dựng một cách linh hoạt nhằm đáp ứng cho những yêu cầu giám sát và phân tích thông tin đa chiều.
+ Tính bảo mật cao.
+ Hệ thống chức năng phong phú.
+ Giao diện thân thiện.
+ Tốc độ đáp ứng nhanh.
+ Điểm tin theo thời gian.
+ Báo cáo đa dạng phục vụ nhiều cấp quản lý.
+ Đo lường quan điểm dựa trên phương pháp học máy.
Hình ảnh hệ thống giám sát và tổng hợp dữ liệu trên Internet
3. Hệ thống thông tin tổng hợp thông tin kinh tế, xã hội
- Mục tiêu
+ Ứng dụng được xây dựng và triển khai để cung cấp nhanh thông tin cho các cấp tham mưu và lãnh đạo nhằm đáp ứng nhu cầu nâng cao chất lượng nghị quyết, nhiệm vụ hoặc đánh giá kết quả thực hiện nghị quyết, nhiệm vụ đối với vấn đề phát triển kinh tế - xã hội, văn hoá, quy hoạch, phát triển đô thị, xây dựng nông thôn mới, xây dựng Đảng, nội chính, tiếp dân, giải quyết khiếu nại, tố cáo, quốc phòng, an ninh,…tại địa phương.
- Đối tượng sử dụng
+ Người sử dụng tại các tỉnh ủy, thành ủy, huyện ủy, thị ủy và các đơn vị liên quan.
+ Triển khai phần mềm hệ thống thông tin tổng hợp phục vụ sự lãnh đạo, chỉ đạo của các cấp ủy tại địa phương.
- Công nghệ
+ Triển khai trên nền tảng Webbase.
+ Ứng dụng được cài đặt và vận hành trong mạng thông tin diện rộng của Đảng.
+ Thiết kế đảm bảo triển khai tập trung tại cấp Tỉnh và đáp ứng được cho cả nhu cầu của cấp Tỉnh và cấp Quận/Huyện.
Hình ảnh hệ thống thông tin tổng hợp thông tin kinh tế, xã hội
4. Ứng dụng mô phỏng quy trình sản xuất thuốc 3D
Ứng dụng sử dụng công nghệ số hóa 3D, mô phỏng lại toàn bộ các bước sản xuất thuốc viên nén Paracetamol dựa theo quy trình thực tế. Ứng dụng được xây dựng với mục đích hỗ trợ giảng dạy tại khoa Y dược đại học Nguyễn Tất Thành và đã được đưa vào giảng dạy. Ứng dụng được xây dựng bằng Unity 3D chạy trên máy tính cá nhân và các thiết bị di động.
Mô phỏng lại chi tiết các bước thực hiện quá trình chuẩn bị nguyên liệu, tháo lắp máy móc, cách thức hoạt động của máy móc một cách trực quan. Trong thực tế khi giảng dạy, giảng viên sẽ mất rất nhiều thời gian và công sức thực hiện quy trình để truyền tải kiến thức cho sinh viên, ứng dụng sẽ rút ngắn thời gian và tiết kiệm công sức cho giảng viên cũng như sinh viên sẽ tiếp nhận thông tin một cách chi tiết và trực quan hơn ứng dụng sử dụng công nghệ số hoá 3D, mô phỏng lại toàn bộ các bước sản xuất
5. Phần mềm kiểm soát lượng người vào ra với sự trợ giúp của camera:
+ Xử lý hình ảnh 2D,3D, Video.
+ Mô hình hóa cho hệ thống thực tại ảo
+ Kiến trúc tính toán cho thực tại ảo.
+ Các kỹ thuật ghép nỗi vào ra với hệ thống thực tại ảo, thực tại ảo tăng cường.
+ Các ngôn ngữ thực tại ảo, lập trình hệ thống thực tại ảo, thực tại ảo tăng cường, thực tại ảo trộn.
Hình ảnh giới thiệu ứng dụng mô phỏng quy trình sản xuất thuốc 3D và phần mềm kiểm soát lượng người vào ra với sự trợ giúp của camera
6. Hệ thống giám sát chất lượng nước nuôi tôm
+ Cung cấp giao diện giám sát Website
- Dễ dàng truy cập trên các công cụ trình duyệt, thu thập online, lưu trữ, cảnh báo vượt ngưỡng với 5 thông số chính (nhiệt độ, pH, DO, ORP, độ mặn) và hỗ trợ đánh giá chất lượng nước nuôi tôm trên nền tảng máy chủ đám mây;
- Đăng nhập và phân quyền sử dụng;
- Cung cấp các tác vụ thống kê, vẽ đồ thị; các tính năng in ấn bảng số liệu, báo cáo.
- Dễ dàng sử dụng và có khả năng đáp ứng nhu cầu mở rộng của hệ thống giám sát.
+ Theo dõi dữ liệu trên nền tảng ứng dụng hệ điều hành Android
- Cảnh báo vượt ngưỡng với 5 thông số chính (nhiệt độ, pH, DO, ORP, độ mặn) thông qua SMS;
- Cung cấp các tác vụ quan sát thống kê, đồ thị, bảng biểu trên ứng dụng di động.
- Bảo mật đăng nhập xác thực người dùng.
Hình ảnh hệ thống giám sát chất lượng nước nuôi tôm