Mô hình ngôn ngữ lớn sẽ là trung tâm của cuộc cách mạng AI
Theo Bộ Thông tin và Truyền thông (TT&TT), mô hình ngôn ngữ lớn (LLM) là vấn đề mới đối với cơ quan nhà nước và các doanh nghiệp công nghệ của Việt Nam, đồng thời có ý nghĩa và vai trò quan trọng trong cuộc cách mạng công nghệ AI.
Ngôn ngữ lớn (LLM) là một loại mô hình ngôn ngữ được đào tạo bằng cách sử dụng các kỹ thuật học sâu trên tập dữ liệu văn bản khổng lồ. Các mô hình này có khả năng tạo văn bản tương tự như con người và thực hiện các tác vụ xử lý ngôn ngữ tự nhiên khác nhau. LLM có số lượng tham số rất lớn, có thể từ hàng tỷ đến hàng trăm tỷ. Những mô hình này có thể phát hiện các quy luật phức tạp trong ngôn ngữ và tạo ra các văn bản giống như con người tạo ra.
Tháng 11/2022, Open AI công bố ChatGPT trở thành trợ lý ảo xây dựng trên LLM đã gây ra hiệu ứng toàn cầu, gây ngạc nhiên cho tất cả các quốc gia, gồm cả các cường quốc về công nghệ và AI như Trung Quốc, Hàn Quốc, Nga. Tính đến hết ngày 10/9/2023, cũng mới chỉ có Baidu của Trung Quốc và Naver của Hàn Quốc công bố các mô hình ngôn ngữ lớn tiếng Trung, tiếng Hàn. Còn lại thế giới chưa có mô hình ngôn ngữ đặc thù nào khác với quy mô trên 100 tỷ tham số.
Theo số liệu gần đây của Viện Thông tin Khoa học và Công nghệ Trung Quốc, Mỹ và Trung Quốc chiếm hơn 80% lượng phân phối mô hình lớn trên thế giới. Trong đó, Mỹ dẫn đầu cuộc đua về số lượng và Trung Quốc cũng đang nhanh chóng theo kịp.
Những đột phá trong xu hướng này được giới phân tích dự đoán có thể thúc đẩy 7% tăng trưởng GDP toàn cầu, tương đương gần 7.000 tỷ USD, trong vòng 10 năm tới.
Tại phiên họp chuyên đề lần thứ hai của Ủy ban Quốc gia về Chuyển đổi số, Bộ trưởng Bộ TT&TT Nguyễn Mạnh Hùng khẳng định, AI như điện của Cách mạng công nghiệp lần thứ II, như động cơ hơi nước của Cách mạng công nghiệp lần thứ I. Do đó, cần được phổ cập, thâm nhập vào mọi lĩnh vực, đời sống và công việc hàng ngày của người dân và các tổ chức, doanh nghiệp.
Tuy nhiên, đại diện Bộ TT&TT cho rằng, phổ cập hoá ứng dụng AI vẫn phải do chính tổ chức, doanh nghiệp phát triển và “nuôi dạy” như: dữ liệu, mục tiêu, lựa chọn thuật toán, huấn luyện... Bên cạnh đó, muốn phổ cập AI thì phải biến AI thành dịch vụ và cung cấp qua mạng viễn thông đến mọi người dân, doanh nghiệp như là dịch vụ điện thoại di động với chi phí rẻ.
Theo đó, cần triển khai thúc đẩy LLM tiếng Việt, phát triển trợ lý ảo cho cán bộ và công chức, trợ lý ảo cho người Việt và trợ lý ảo hỗ trợ rà soát văn bản quy phạm pháp luật. Các yếu tố này đóng vai trò tác động đến nhận thức của người dân, do đó, xây dựng được LLM tiếng Việt và trợ lý ảo phục vụ người Việt có ý nghĩa vô cùng lớn ở nhiều khía cạnh.
"Ai nhanh hơn trong ứng dụng thì sẽ được hưởng lợi nhiều hơn", Bộ trưởng Nguyễn Mạnh Hùng đánh giá.
Một số doanh nghiệp đã tiên phong thực hiện nhiệm vụ triển khai LLM tiếng Việt và trợ lý ảo phục vụ người Việt. Trong đó, Tập đoàn Viettel thực hiện việc xây dựng và triển khai nền tảng LLM tiếng Việt phục vụ khối cơ quan hành chính và tư pháp; triển khai trợ lý ảo phục vụ cán bộ công chức, viên chức,….
Tập đoàn CMC thực hiện việc xây dựng và triển khai nền tảng LLM tiếng Việt và trợ lý ảo phục vụ khối cơ quan lập pháp. Trợ lý ảo này giúp cán bộ, công chức trong quá trình xây dựng văn bản quy phạm pháp luật có thể dễ dàng phát hiện sự chồng chéo hay mâu thuẫn giữa các văn bản quy phạm pháp luật đã ban hành với dự thảo đang xây dựng.
Công ty Cổ phần VNG tập trung thực hiện việc triển khai nền tảng LLM tiếng Việt và Trợ lý ảo phục vụ người dân cũng như các vấn đề về dịch vụ công, về quyền lợi, trách nhiệm của người dân.
Theo kế hoạch, dự kiến tháng 12/2023, Bộ TT&TT sẽ mời một số bộ, ngành, địa phương tham gia vào thử nghiệm những phiên bản đầu tiên của LLM tiếng Việt và trợ lý ảo phục vụ người Việt. Thông qua việc thử nghiệm này, chính các bộ, ngành, địa phương sẽ là người huấn luyện, đóng góp tri thức cho sự phát triển của LLM tiếng Việt và trợ lý ảo phục vụ người Việt.