1. Các hệ thống thông tin và cơ sở dữ liệu
Định hướng nghiên cứu theo hướng này là phân tích và thiết kế hệ thống thông tin nhằm xây dựng các cơ sở dữ liệu lớn, nghiên cứu các mô hình và quy trình phát triển các hệ thống thông tin, nghiên cứu và ứng dụng các công nghệ mới về cơ sở dữ liệu, các vấn đề về quản lý chất lượng dữ liệu. Các nội dung nghiên cứu bao gồm:
a. Các hệ thống cơ sở dữ liệu
- Các hệ thống CSDL theo mô hình quan hệ;
- Các hệ thống CSDL theo mô hình hướng đối tượng và đa phương tiện;
- Các hệ thống CSDL phân tán và suy diễn;
- Các hệ thống CSDL theo mô hình xử lý dữ liệu đa chiều, phân tán hoặc tập trung với khối lượng dữ liệu lớn, đòi hỏi tốc độ cao và xử lý thời gian thực.
b. Các hệ thống thông tin quản lý
- Các phương pháp mô hình hoá, quy trình phát triển các hệ thống thông tin: Mô hình đối tượng, những vấn đề xử lý song song và phân tán;
- Các vấn đề tích hợp ứng dụng và chuẩn hoá trong các hệ thống thông tin: các phương pháp chuyển đổi giữa các mô hình dữ liệu, tích hợp dữ liệu từ nhiều hệ quản trị và từ các nền (platform) khác nhau;
- Các phương pháp phân tích thiết kế hiện đại và phát triển các công cụ phục vụ xây dựng các hệ thống thông tin quản lý;
- Bảo vệ bản quyền cho các hệ CSDL quan hệ.
c. Các hệ thống thông tin đa phương tiện
- Mô hình CSDL đa phương tiện, chuẩn hoá dữ liệu đa phương tiện;
- Phát triển CSDL đa phương tiện trên mạng Internet;
- Tổ chức và truy vấn dữ liệu đa phương tiện;
- Xác thực và bảo mật các sản phẩm đa phương tiện;
d. Các hệ thống thông tin địa lý;
- Mô hình dữ liệu không gian, chuẩn hoá dữ liệu không gian;
- Phát triển các hệ thống thông tin địa lý trên nền web và các thiết bị di động;
- Tổ chức và truy tìm dữ liệu trong CSDL không gian;
- Nghiên cứu và phát triển các hệ thống và dịch vụ thông tin địa lý trên nền tảng của công nghệ mới (điện toán đám mây, tính toán lưới, mạng tiên tiến, ...);
e. Kho dữ liệu, khai phá dữ liệu, phát hiện tri thức
- Mô hình và kỹ thuật phát triển kho dữ liệu;
- Các kỹ thuật khai phá dữ liệu, truy vấn thông tin trong kho dữ liệu, CSDL cỡ lớn và các CSDL đa phương tiện, CSDL không gian;
- Nghiên cứu và phát triển các phương pháp phát triển tri thức từ dữ liệu;
- Nghiên cứu các phương pháp và công cụ về phát triển web để khai phá dữ liệu trong các CSDL hoặc các hệ thống lưu trữ kiểu cũ.
2. Công nghệ phần mềm
- Nghiên cứu các phương pháp phát triển phần mềm linh hoạt (agile software development) phổ biến nhất (như Extreme Programing, Scrum và Feature Driven Development). Ứng dụng thử nghiệm các phương pháp này trong các dự án thực tế;
- Nghiên cứu khai phá dữ liệu và phát hiện tri thức, tập trung vào một số lĩnh vực như tin sinh học (bioinfomatics), tin y học (medicine- infomatics);
- Nghiên cứu mô hình, phương pháp hình thức kiểm chứng phần mềm và phát triển các công cụ kiểm thử phần mềm;
- Nghiên cứu các giải pháp triển khai hệ thống thông tin lớn dựa trên mã nguồn mở, quản lý các dự án CNTT, cung cấp giải pháp, tư vấn và giám sát theo quy trình chuẩn quốc tế;
- Xây dựng và triển khai cổng thông tin điện tử sử dụng công nghệ Oracle và Microsoft;
- Nghiên cứu và triển khai những công nghệ mới, hiện đại, bao gồm kiến trúc phần mềm hướng dịch vụ SOA (Service - Oriented Architecture), công nghệ dựa trên thành phần (Component - Based Software Development) với các chuẩn công nghiệp hiện tại như DCOM (Microsoft), Javabeans (Sun Microsystems), CORBA (OMG)... và các công nghệ tính toán hiện đại như điện toán đám mây, tính toán lưới, hệ tính toán thông minh và di động, công nghệ thành phần với nội dung số trên mạng Internet;
- Chữ ký số, chứng chỉ số và các vấn đề xác thực, an toàn - an ninh hệ thống, bảo vệ bản quyền tác giả;
3. Trí tuệ nhân tạo và công nghệ tri thức
a. Xử lý ngôn ngữ tự nhiên tiếng Việt
- Tiếp tục phát triển hướng nghiên cứu về công nghệ ngôn ngữ: Nghiên cứu, khai thác và phát triển các phương pháp mới trong xử lý ngôn ngữ, tập trung cho hướng truyền thống về xử lý tiếng nói, văn bản, ký tự và xử lý ngôn ngữ tự nhiên cho tiếng Việt.
- Nghiên cứu dịch văn bản tự động theo cách tiếp cận thống kê, tích hợp các tri thức vào mô hình dịch.
- Phát triển công nghệ nền cho nhận dạng từ tiếng nói sang tiếng nói (speech to speech translate)
- Xây dựng kho ngữ liệu tiếng nói văn bản tiếng Việt phục vụ cho các nghiên cứu về công nghệ ngôn ngữ nói trên.
- Phát triển các sản phẩm liên quan đến nhận dạng chữ Việt, tổng hợp tiếng Việt, … trong môi trường nhúng, tích hợp cho nhiều ứng dụng khác nhau ( cổng thông tin, smart phone, máy tính bảng, chip nhúng, …)
b. Phát triển kĩ thuật học máy và ứng dụng
- Nghiên cứu các kỹ thuật trong học máy (machine learning): Kernel method, máy véc-tơ tựa (Support Vertor Machine), cải tiến hiệu năng của phương pháp máy véc tơ tựa trong xử lý dữ liệu lớn.
- Phát triển các kỹ thuật của học máy trong xử lý văn bản tiếng Việt, truy vấn dữ liệu audio, multimedia…
- Nghiên cứu các phương pháp nhận dạng và xử lý ảnh, phát triển các kỹ thuật của học máy trong nhận dạng hình ảnh, nghiên cứu các phương pháp tra cứu hình ảnh dựa trên nội dung (CBIR), các phương pháp trích chọn đặc trưng hình ảnh phục vụ nhận dạng, phân loại, phân cụm, tạo lập các chỉ số truy vấn hình ảnh với độ chính xác cao.
c. Phát triển các kỹ thuật tính toán mềm
- Nghiên cứu và phát triển các phương pháp lập luận xấp xỉ, lôgic mờ, thuật giải di truyền, tính toán tiến hoá, suy diễn xác suất, mạng nơ ron nhân tạo, … trong các mô hình tính toán mềm.
- Nghiên cứu logic ngôn ngữ kết hợp với các phương pháp lập luận suy diễn khác (lập luận xấp xỉ, lập luận mờ, đại số gia tử) trong hướng khai phá dữ liệu (trích xuất luật kết hợp, xây dựng luật phân lớp từ dữ liệu) và CSDL mờ.