Báo cáo LLM-jp và Đề xuất cho Việt Nam

Giới thiệu chung

Trong kỷ nguyên số hiện nay, Trí Tuệ Nhân Tạo (AI) và đặc biệt là các Mô hình Ngôn ngữ Lớn (LLM) đang nổi lên như một lực lượng chuyển đổi mạnh mẽ, tác động sâu rộng đến mọi khía cạnh của đời sống kinh tế, xã hội và văn hóa trên toàn cầu. Khả năng hiểu, tạo sinh và tương tác bằng ngôn ngữ tự nhiên của LLM không chỉ mở ra những chân trời mới cho nghiên cứu khoa học và phát triển công nghệ mà còn hứa hẹn mang lại những giải pháp đột phá cho các thách thức phức tạp mà nhân loại phải đối mặt. Trong bối cảnh đó, nhiều quốc gia đã và đang đầu tư mạnh mẽ vào việc xây dựng và làm chủ công nghệ LLM, coi đây là một yếu tố then chốt để nâng cao năng lực cạnh tranh quốc gia và đảm bảo chủ quyền số. Nhật Bản, một cường quốc công nghệ, đã tiên phong với dự án LLM-jp, một nỗ lực quy mô lớn nhằm phát triển một mô hình ngôn ngữ lớn mã nguồn mở, được tối ưu hóa cho tiếng Nhật và văn hóa Nhật Bản. Thành công và kinh nghiệm từ dự án LLM-jp không chỉ mang lại lợi ích to lớn cho Nhật Bản mà còn cung cấp những bài học quý báu cho các quốc gia khác, trong đó có Việt Nam, trên con đường xây dựng và phát triển LLM bản địa. Báo cáo này được thực hiện nhằm mục đích khảo sát sâu rộng về dự án LLM-jp, bao gồm lịch sử hình thành, mục tiêu, các khía cạnh chính sách và kỹ thuật phát triển, cũng như những tác động khoa học và công nghiệp mà dự án này mang lại. Đồng thời, báo cáo cũng sẽ phân tích những cơ hội và thách thức đối với Việt Nam trong việc phát triển các mô hình ngôn ngữ lớn tương tự (tạm gọi là llm-vn), từ đó đưa ra những đề xuất và khuyến nghị cụ thể nhằm phục vụ cho mục tiêu tham mưu cho lãnh đạo nhà nước và đóng góp vào kho tàng tri thức khoa học trong nước.

Tổng quan về Dự án LLM-jp của Nhật Bản

Dự án LLM-jp (Large Language Model - Japan) là một minh chứng tiêu biểu cho nỗ lực này. Ra đời trong bối cảnh cuộc cách mạng AI toàn cầu, LLM-jp là một sáng kiến hợp tác quy mô lớn, quy tụ các nhà nghiên cứu hàng đầu từ các trường đại học, viện nghiên cứu và các tập đoàn công nghệ lớn của Nhật Bản. Mục tiêu cốt lõi của dự án là xây dựng một mô hình ngôn ngữ lớn tiếng Nhật mã nguồn mở, có khả năng cạnh tranh với các mô hình hàng đầu thế giới như GPT của OpenAI hay Gemini của Google, đồng thời phục vụ đắc lực cho sự phát triển kinh tế - xã hội và khẳng định vị thế công nghệ của Nhật Bản.

Lịch sử phát triển và Đơn vị chủ trì

Lịch sử phát triển của LLM-jp có thể được tóm lược qua các giai đoạn chính: từ giai đoạn hình thành ý tưởng và tập hợp lực lượng trước năm 2023, khi cộng đồng AI Nhật Bản nhận thấy sự cấp thiết của một LLM tiếng Nhật chất lượng cao; đến việc công bố chính thức và khởi động dự án vào đầu năm 2023; và sau đó là việc phát triển, công bố các phiên bản mô hình đầu tiên vào cuối năm 2023 và đầu năm 2024, chẳng hạn như "llm-jp-3-172b-instruct3" với khoảng 172 tỷ tham số, cho thấy những kết quả ban đầu rất hứa hẹn. Dự án này vẫn đang trong quá trình tiếp tục nghiên cứu và hoàn thiện, với mục tiêu không ngừng nâng cao hiệu năng và mở rộng phạm vi ứng dụng.

Đơn vị chủ trì và điều phối chính của dự án LLM-jp là Viện Tin học Quốc gia Nhật Bản (National Institute of Informatics - NII), một tổ chức nghiên cứu hàng đầu trong lĩnh vực công nghệ thông tin. Tuy nhiên, sức mạnh và sự thành công của LLM-jp đến từ sự hợp tác chặt chẽ của một mạng lưới rộng lớn các đối tác, bao gồm các trường đại học danh tiếng như Đại học Tokyo, Đại học Kyoto, Đại học Tohoku; các viện nghiên cứu uy tín như Viện Khoa học và Công nghệ Tiên tiến Quốc gia (AIST); và sự tham gia của các tập đoàn công nghệ lớn. Cộng đồng hơn 1.500 nhà nghiên cứu và kỹ sư đã đóng góp công sức vào các giai đoạn khác nhau của dự án. Cơ cấu hoạt động của LLM-jp được tổ chức một cách khoa học thông qua các nhóm làm việc chuyên biệt (Working Groups - WGs), mỗi nhóm tập trung vào một khía cạnh cụ thể như xây dựng kho dữ liệu (Corpus Construction WG), phát triển mô hình (Model Development WG), đánh giá và kiểm định (Evaluation and Benchmarking WG), ứng dụng và triển khai (Application and Deployment WG), và các vấn đề đạo đức, an toàn AI (AI Ethics and Safety WG). Sự phối hợp nhịp nhàng và chia sẻ nguồn lực giữa các nhóm này là yếu tố then chốt đảm bảo tiến độ và chất lượng của dự án.

Mục tiêu của dự án

Các mục tiêu mà dự án LLM-jp hướng tới rất toàn diện. Trước hết, đó là xây dựng một LLM tiếng Nhật hàng đầu thế giới, có khả năng hiểu và tạo sinh văn bản tiếng Nhật một cách tự nhiên, chính xác và đa dạng. Tiếp theo, dự án nhằm thúc đẩy mạnh mẽ nghiên cứu và đổi mới sáng tạo trong lĩnh vực AI tại Nhật Bản, cung cấp một nền tảng mở cho cộng đồng. Một mục tiêu quan trọng khác là đảm bảo chủ quyền công nghệ và an ninh dữ liệu quốc gia, giảm sự phụ thuộc vào các LLM từ nước ngoài. LLM-jp cũng được kỳ vọng sẽ hỗ trợ đắc lực cho quá trình chuyển đổi số, nâng cao năng lực cạnh tranh của nền kinh tế Nhật Bản, đồng thời phục vụ lợi ích cộng đồng thông qua các ứng dụng trong giáo dục, y tế, chăm sóc người cao tuổi, và cải thiện dịch vụ công. Cuối cùng, dự án còn hướng đến việc đóng góp vào sự phát triển chung của cộng đồng AI toàn cầu thông qua việc chia sẻ kiến thức, kinh nghiệm và các mô hình mã nguồn mở.

Lợi ích của dự án

Những lợi ích mà LLM-jp mang lại là vô cùng to lớn và đa chiều. Đối với quốc gia Nhật Bản, dự án này là một động lực quan trọng thúc đẩy tăng trưởng kinh tế thông qua việc nâng cao năng suất, tối ưu hóa quy trình và tạo ra các mô hình kinh doanh mới trong nhiều ngành công nghiệp. Về mặt xã hội, LLM-jp có tiềm năng giải quyết nhiều thách thức như hỗ trợ chăm sóc sức khỏe cho dân số già hóa, cá nhân hóa giáo dục, và cải thiện dịch vụ công. Việc phát triển một LLM mạnh mẽ cho tiếng Nhật cũng góp phần bảo tồn và phát huy sự phong phú của ngôn ngữ và văn hóa Nhật Bản trong kỷ nguyên số. Quan trọng hơn cả, việc sở hữu một LLM quốc gia giúp Nhật Bản củng cố chủ quyền công nghệ và an ninh dữ liệu. Đối với người dân Nhật Bản, LLM-jp mang lại khả năng tiếp cận thông tin và tri thức dễ dàng hơn, nâng cao chất lượng cuộc sống thông qua các ứng dụng tiện ích, và tạo ra nhiều cơ hội việc làm mới trong lĩnh vực công nghệ cao. Không chỉ dừng lại ở phạm vi quốc gia, LLM-jp còn có tiềm năng đóng góp tích cực cho thế giới. Nhật Bản có thể chia sẻ kinh nghiệm và công nghệ phát triển LLM với các quốc gia khác, đặc biệt là những nước có ngôn ngữ ít được ưu tiên. Dự án này cũng có thể trở thành nền tảng cho các hợp tác nghiên cứu quốc tế nhằm giải quyết các thách thức toàn cầu, đồng thời góp phần xây dựng một hệ sinh thái AI đa dạng và bao trùm hơn.

Chính sách hỗ trợ và Kỹ thuật phát triển LLM-jp

Sự thành công của dự án LLM-jp không thể tách rời sự hỗ trợ mạnh mẽ từ Chính phủ Nhật Bản về mặt chính sách và nguồn lực, cùng với những đột phá trong kỹ thuật phát triển mô hình.

Chính sách và hỗ trợ từ Chính phủ

Chính phủ Nhật Bản đã sớm nhận diện tầm quan trọng chiến lược của AI và LLM, từ đó ban hành nhiều chính sách và chương trình hỗ trợ cụ thể. Các cơ quan chủ chốt như Bộ Kinh tế, Thương mại và Công nghiệp (METI) và Tổ chức Phát triển Công nghệ Công nghiệp và Năng lượng Mới (NEDO), thông qua dự án GENIAC (Generative AI Accelerator Challenge), đã tích cực hỗ trợ việc phát triển AI tạo sinh, bao gồm việc cung cấp tài nguyên điện toán đám mây từ Google Cloud Japan cho giai đoạn tiền huấn luyện ban đầu của LLM-jp. Bộ Giáo dục, Văn hóa, Thể thao, Khoa học và Công nghệ (MEXT) cũng đóng vai trò quan trọng trong việc tài trợ cho các giai đoạn tiếp theo, cấp ngân sách mua sắm tài nguyên điện toán đám mây từ SAKURA Internet và hỗ trợ thành lập Trung tâm Nghiên cứu và Phát triển Mô hình Ngôn ngữ Lớn (LLMC) tại Viện Tin học Quốc gia (NII) vào tháng 4 năm 2024, với sứ mệnh đảm bảo tính minh bạch và độ tin cậy của AI tạo sinh. Viện Khoa học và Công nghệ Công nghiệp Tiên tiến Quốc gia (AIST), thông qua chương trình hỗ trợ xây dựng LLM quy mô lớn, đã cung cấp quyền truy cập vào Cơ sở hạ tầng Đám mây Kết nối AI (AI Bridging Cloud Infrastructure - ABCI), một trong những siêu máy tính hàng đầu thế giới, cho phép LLM-jp thử nghiệm phát triển mô hình với quy mô lên đến 175 tỷ tham số. Những chính sách và sự hỗ trợ này đã tạo nền tảng vững chắc cho LLM-jp.

Kỹ thuật phát triển mô hình

Về mặt kỹ thuật, LLM-jp đã phát triển và công bố nhiều phiên bản mô hình, trong đó nổi bật là "llm-jp-3-172b-instruct3" với khoảng 172 tỷ tham số, được xây dựng dựa trên kiến trúc LLaMA-2, một kiến trúc LLM mã nguồn mở hiệu quả. Mô hình này đã chứng minh hiệu năng vượt trội so với GPT-3.5 trên nhiều bộ kiểm tra tiếng Nhật. Yếu tố quyết định đến hiệu năng của LLM chính là chất lượng và quy mô của dữ liệu huấn luyện. Đội ngũ LLM-jp đã đầu tư xây dựng một kho dữ liệu (corpus) khổng lồ lên đến khoảng 2.1 nghìn tỷ token, bao gồm một tỷ lệ lớn văn bản tiếng Nhật (khoảng 592 tỷ token) được thu thập từ Common Crawl, kho lưu trữ web của Thư viện Quốc hội Nhật Bản (WARP), Wikipedia tiếng Nhật, và tóm tắt các dự án nghiên cứu khoa học từ KAKEN. Bên cạnh đó, bộ dữ liệu còn bao gồm một lượng lớn tiếng Anh (khoảng 950 tỷ token từ Dolma), một số ngôn ngữ khác như tiếng Trung, tiếng Hàn (khoảng 1 tỷ token) và mã nguồn (khoảng 114 tỷ token). Đáng chú ý, khoảng 0.4 nghìn tỷ token tiếng Nhật đã được sử dụng hai lần trong quá trình huấn luyện, thể hiện sự ưu tiên cho việc nâng cao năng lực xử lý tiếng Nhật. Quá trình huấn luyện LLM-jp được thực hiện trên các hệ thống siêu máy tính và nền tảng đám mây hàng đầu, bao gồm giai đoạn tiền huấn luyện (pre-training) từ đầu trên toàn bộ kho dữ liệu và giai đoạn tinh chỉnh theo hướng dẫn (instruction tuning) sử dụng 13 loại dữ liệu hướng dẫn bằng tiếng Nhật và bản dịch tiếng Anh, giúp mô hình hiểu và thực hiện tốt hơn các yêu cầu cụ thể. Hiệu năng của mô hình được đánh giá liên tục bằng các bộ benchmark chuyên biệt. Một cam kết quan trọng của dự án LLM-jp là tính mở, hướng tới việc công khai không chỉ các tham số mô hình mà còn cả dữ liệu huấn luyện và công cụ liên quan, kể cả các điểm kiểm tra (checkpoint) trung gian. Về vấn đề an toàn và đạo đức, LLM-jp cũng rất được chú trọng, với các biện pháp tinh chỉnh để giảm thiểu phản hồi có hại và thực hiện đánh giá an toàn kỹ lưỡng.

Tác động Khoa học và Công nghiệp của LLM-jp

Những nỗ lực này đã đặt nền móng vững chắc cho sự phát triển của LLM-jp, biến nó thành một tài sản công nghệ quan trọng của Nhật Bản.

Tác động khoa học

Tác động khoa học của LLM-jp là rất đáng kể. Việc phát triển và công khai LLM-jp đã tạo ra một nền tảng quan trọng cho cộng đồng nghiên cứu AI tại Nhật Bản, cho phép các nhà nghiên cứu dễ dàng truy cập, thử nghiệm và cải tiến các mô hình ngôn ngữ lớn cho tiếng Nhật. Quá trình này cũng tạo ra các bộ dữ liệu và công cụ xử lý ngôn ngữ tự nhiên (NLP) tiếng Nhật có giá trị, khuyến khích hợp tác nghiên cứu và đóng góp vào kiến thức toàn cầu về LLM, đặc biệt là cho các ngôn ngữ ít tài nguyên. Các kết quả nghiên cứu, báo cáo kỹ thuật từ dự án được công bố rộng rãi, nâng cao uy tín khoa học của Nhật Bản. Hơn nữa, LLM-jp cũng đặt trọng tâm vào nghiên cứu AI có trách nhiệm, cung cấp những hiểu biết quan trọng về giảm thiểu thiên kiến và xây dựng LLM đáng tin cậy.

Tác động công nghiệp và quốc tế

Về tác động công nghiệp, sự ra đời của LLM-jp mở ra vô vàn cơ hội ứng dụng và chuyển đổi cho các ngành công nghiệp tại Nhật Bản. Nó giúp nâng cao năng lực cạnh tranh và hiệu quả hoạt động trong sản xuất, dịch vụ khách hàng, tài chính, bán lẻ. LLM-jp thúc đẩy đổi mới sáng tạo và phát triển sản phẩm/dịch vụ mới, đặc biệt cho các doanh nghiệp vừa và nhỏ và startups. Nó cũng có tiềm năng giải quyết các vấn đề đặc thù của ngành như hỗ trợ y tế, giáo dục, chăm sóc người cao tuổi. Sự phát triển của hệ sinh thái ứng dụng dựa trên LLM-jp sẽ tạo ra thị trường mới và nhiều cơ hội việc làm. Tiềm năng tác động của LLM-jp không chỉ giới hạn ở Nhật Bản. Mô hình hợp tác công-tư, sự hỗ trợ từ chính phủ và cam kết mã nguồn mở của LLM-jp là hình mẫu quý giá cho các quốc gia khác. Nó thúc đẩy đa dạng ngôn ngữ trong AI, chia sẻ công nghệ và tri thức, đồng thời góp phần xây dựng các tiêu chuẩn và thực hành tốt cho ngành AI toàn cầu. LLM-jp là minh chứng cho thấy cách một quốc gia có thể tận dụng sức mạnh AI để thúc đẩy tiến bộ khoa học, phát triển kinh tế và đóng góp vào cộng đồng quốc tế.

Bối cảnh, Cơ hội và Thách thức cho Việt Nam trong Phát triển LLM (llm-vn)

Trong bối cảnh đó, Việt Nam, một quốc gia đang trong giai đoạn chuyển đổi số mạnh mẽ với mục tiêu trở thành quốc gia số vào năm 2030, cũng đứng trước những cơ hội lớn để xây dựng và làm chủ công nghệ LLM.

Nhu cầu và nỗ lực ban đầu

Nhu cầu về một LLM tiếng Việt (tạm gọi là llm-vn) chất lượng cao là rất lớn, xuất phát từ đặc thù ngôn ngữ và văn hóa, yêu cầu của nền kinh tế số, nhu cầu cải thiện dịch vụ công và quản lý nhà nước, cũng như tiềm năng ứng dụng trong giáo dục, đào tạo và nghiên cứu khoa học. Hiện tại, Việt Nam đã có những nỗ lực ban đầu, nhưng cần một chiến lược tổng thể và sự đầu tư mạnh mẽ hơn.

Cơ hội

Việt Nam có nhiều cơ hội thuận lợi, bao gồm việc học hỏi kinh nghiệm từ các quốc gia đi trước như Nhật Bản, sở hữu nguồn nhân lực trẻ và năng động, thị trường ứng dụng tiềm năng lớn, chính sách hỗ trợ từ Chính phủ và một cộng đồng công nghệ thông tin đang phát triển.

Thách thức

Tuy nhiên, thách thức cũng không hề nhỏ. Nguồn lực của Việt Nam còn hạn chế về tài chính, cơ sở hạ tầng tính toán hiệu năng cao. Việc xây dựng kho dữ liệu tiếng Việt đủ lớn và chất lượng cao là một công việc phức tạp. Tình trạng thiếu hụt nhân lực AI/LLM chất lượng cao vẫn còn tồn tại. Chính sách và hành lang pháp lý liên quan đến AI và LLM vẫn đang trong quá trình hoàn thiện. Môi trường hợp tác và chia sẻ dữ liệu còn hạn chế, trong khi đó llm-vn sẽ phải đối mặt với sự cạnh tranh từ các LLM toàn cầu. Các vấn đề về đạo đức và an toàn khi sử dụng LLM cũng cần được quan tâm giải quyết.

Bài học kinh nghiệm

Bài học kinh nghiệm từ LLM-jp và các dự án LLM quốc gia khác cho thấy tầm quan trọng của một chiến lược quốc gia rõ ràng, vai trò của hợp tác công-tư, sự đầu tư vào dữ liệu và hạ tầng, việc phát triển nguồn nhân lực, xây dựng cộng đồng và hệ sinh thái mở, cũng như việc chú trọng đến đạo đức và an toàn.

Đề xuất và Khuyến nghị cho Việt Nam

Từ những phân tích sâu rộng về dự án LLM-jp của Nhật Bản và thực trạng, cơ hội cũng như thách thức đối với Việt Nam, việc đưa ra những đề xuất và khuyến nghị cụ thể là vô cùng cần thiết nhằm góp phần xây dựng và phát triển thành công Mô hình Ngôn ngữ Lớn cho tiếng Việt (llm-vn), phục vụ các mục tiêu phát triển kinh tế - xã hội và nâng cao vị thế quốc gia.

Về chiến lược và chính sách

Trước hết, về chiến lược và chính sách, Chính phủ Việt Nam cần sớm ban hành một Chiến lược Quốc gia toàn diện và dài hạn về phát triển và ứng dụng LLM, tích hợp chặt chẽ với Chiến lược Quốc gia về Trí tuệ Nhân tạo đã có. Chiến lược này phải xác định rõ tầm nhìn, mục tiêu, lộ trình, các nhiệm vụ trọng tâm, nguồn lực cần thiết và cơ chế điều phối hiệu quả, đồng thời ưu tiên phát triển llm-vn như một dự án trọng điểm quốc gia. Song song đó, việc hoàn thiện chính sách và hành lang pháp lý là tối quan trọng. Cần nghiên cứu và ban hành các chính sách ưu đãi đặc thù về thuế, tín dụng, đất đai, và thủ tục hành chính để khuyến khích đầu tư từ cả khu vực công và tư nhân vào nghiên cứu, phát triển và ứng dụng LLM. Hành lang pháp lý liên quan đến dữ liệu (thu thập, sử dụng, chia sẻ, bảo mật, quyền riêng tư), sở hữu trí tuệ đối với các mô hình LLM và dữ liệu huấn luyện, cũng như các quy định về đạo đức AI và trách nhiệm pháp lý khi triển khai LLM cần được xây dựng và hoàn thiện. Việc tạo cơ chế "sandbox" pháp lý cho phép thử nghiệm các ứng dụng LLM mới trong một môi trường được kiểm soát cũng là một giải pháp cần cân nhắc. Bên cạnh đó, việc thúc đẩy mạnh mẽ các mô hình hợp tác công - tư (PPP) giữa cơ quan nhà nước, các viện nghiên cứu, trường đại học và cộng đồng doanh nghiệp sẽ tạo động lực lớn cho việc đầu tư, nghiên cứu, phát triển và thương mại hóa llm-vn, trong đó Nhà nước có thể đóng vai trò dẫn dắt và tạo thị trường ban đầu.

Về xây dựng nguồn lực

Về xây dựng nguồn lực, việc đầu tư xây dựng một Kho Dữ liệu Tiếng Việt Quốc gia là nhiệm vụ cấp bách. Cần triển khai một dự án quy mô lớn nhằm thu thập, làm sạch, chuẩn hóa và chú giải dữ liệu tiếng Việt đa dạng từ nhiều nguồn, đảm bảo chất lượng, tính đại diện và tuân thủ các quy định về bản quyền và quyền riêng tư. Việc khuyến khích chia sẻ dữ liệu (đã được ẩn danh và đồng ý) từ các tổ chức và xây dựng các nền tảng, công cụ mở để cộng đồng dễ dàng truy cập và đóng góp vào kho dữ liệu này sẽ làm phong phú thêm nguồn tài nguyên quý giá. Song song với dữ liệu, phát triển nguồn nhân lực chất lượng cao là yếu tố then chốt. Cần đầu tư mạnh mẽ vào các chương trình đào tạo đại học và sau đại học về AI, NLP và khoa học dữ liệu, với giáo trình cập nhật và đội ngũ giảng viên chất lượng. Các chương trình học bổng, chính sách thu hút và giữ chân nhân tài AI/LLM, bao gồm cả các chuyên gia người Việt ở nước ngoài, cần được triển khai. Việc tổ chức các khóa đào tạo ngắn hạn và các cuộc thi sẽ giúp nâng cao kỹ năng thực hành và khuyến khích sự sáng tạo. Cuối cùng, việc xây dựng và chia sẻ hạ tầng tính toán hiệu năng cao, bao gồm các trung tâm dữ liệu và siêu máy tính quốc gia, cùng với cơ chế cho phép các tổ chức và doanh nghiệp tiếp cận với chi phí hợp lý là điều kiện cần để huấn luyện các mô hình LLM quy mô lớn.

Về mô hình hợp tác và xây dựng hệ sinh thái

Đối với mô hình hợp tác và xây dựng hệ sinh thái, việc thúc đẩy nghiên cứu và phát triển hợp tác thông qua việc thành lập các trung tâm nghiên cứu xuất sắc về LLM và khuyến khích các dự án nghiên cứu chung là rất quan trọng. Xây dựng một Cộng đồng LLM Tiếng Việt Mở, hỗ trợ và thúc đẩy các sáng kiến phát triển llm-vn mã nguồn mở, tổ chức thường xuyên các hội thảo và diễn đàn khoa học sẽ tạo ra một môi trường năng động cho việc chia sẻ tri thức và kết nối. Đồng thời, việc tăng cường hợp tác quốc tế, chủ động học hỏi kinh nghiệm từ các quốc gia đi trước, tham gia vào các mạng lưới nghiên cứu và thu hút đầu tư, chuyên gia nước ngoài sẽ giúp Việt Nam nhanh chóng tiếp cận với những tiến bộ mới nhất trong lĩnh vực này.

Về định hướng nghiên cứu và ứng dụng trọng tâm

Về định hướng nghiên cứu và ứng dụng trọng tâm, Việt Nam cần ưu tiên các lĩnh vực ứng dụng chiến lược mang lại giá trị kinh tế - xã hội cao và phù hợp với ưu tiên phát triển của đất nước như giáo dục, y tế, nông nghiệp, hành chính công, du lịch và hỗ trợ doanh nghiệp nhỏ và vừa. Việc đầu tư vào nghiên cứu sâu về ngôn ngữ học tính toán cho tiếng Việt, bao gồm các vấn đề về xử lý thanh điệu, từ đa nghĩa, ngữ cảnh văn hóa, và các phương ngữ, là cần thiết để llm-vn không chỉ hiểu đúng ngôn ngữ mà còn phản ánh được các giá trị văn hóa, lịch sử và chuẩn mực xã hội của Việt Nam. Đặc biệt, nghiên cứu về an toàn, minh bạch và kiểm soát thiên kiến phải được ưu tiên, bao gồm việc phát triển các kỹ thuật để phát hiện và giảm thiểu thiên kiến, xây dựng các cơ chế giải thích được cho các kết quả đầu ra của llm-vn, nhất là trong các ứng dụng nhạy cảm.

Kết luận

Sự trỗi dậy của các Mô hình Ngôn ngữ Lớn đang mở ra một chương mới đầy hứa hẹn cho cuộc cách mạng công nghiệp lần thứ tư. Dự án LLM-jp của Nhật Bản là một minh chứng rõ nét về nỗ lực của một quốc gia trong việc làm chủ công nghệ lõi này. Đối với Việt Nam, việc xây dựng và làm chủ llm-vn không chỉ là một cơ hội mà còn là một yêu cầu cấp thiết. Mặc dù con đường phía trước còn nhiều thách thức, từ vấn đề nguồn lực đến hoàn thiện hành lang pháp lý và giải quyết các bài toán kỹ thuật, đạo đức phức tạp, nhưng với một tầm nhìn chiến lược, sự quyết tâm chính trị, sự đầu tư bài bản và sự chung tay của tất cả các bên liên quan, Việt Nam hoàn toàn có thể nắm bắt cơ hội này. Chặng đường phát triển llm-vn sẽ còn nhiều gian nan, nhưng với sự chủ động học hỏi kinh nghiệm quốc tế, phát huy nội lực và tinh thần đổi mới sáng tạo, Việt Nam có thể tạo ra những đột phá, khẳng định vị thế công nghệ và hiện thực hóa khát vọng xây dựng một quốc gia hùng cường, thịnh vượng. Đây không chỉ là một dự án công nghệ, mà còn là một sứ mệnh góp phần định hình tương lai số của dân tộc.

Tài liệu tham khảo

Aizawa, A., Aramaki, E., Chen, B., Cheng, F., Deguchi, H., Enomoto, R., ... & Yoshino, K. (2024). LLM-jp: A Cross-organizational Project for the Research and Development of Fully Open Japanese LLMs. arXiv preprint arXiv:2407.03963. (Truy cập tại: https://arxiv.org/abs/2407.03963)
National Institute of Informatics. (2024, December 24). A Fully Open Large Language Model with Approximately 172 Billion Parameters (GPT-3 Level): "llm-jp-3-172b-instruct3" Now Publicly Available - Achieving Performance Beyond GPT-3.5 -. (Truy cập tại: https://www.nii.ac.jp/en/news/release/2024/1224.html)
Carnegie Endowment for International Peace. (2025, January). Speaking in Code: Contextualizing Large Language Models in Southeast Asia. (Truy cập tại: https://carnegieendowment.org/research/2025/01/speaking-in-code-contextualizing-large-language-models-in-southeast-asia?lang=en)
Vietnam News. (2025, March 14). Vietnam Innovation Challenge 2025 launched to advance AI with Vietnamese open data. (Truy cập tại: https://vietnamnews.vn/economy/1693937/vietnam-innovation-challenge-2025-launched-to-advance-ai-with-vietnamese-open-data.html)
OpenGov Asia. (2025, February 08). Vietnam’s AI Future: Innovation, Policy, and Growth. (Truy cập tại: https://opengovasia.com/2025/02/08/vietnams-ai-future-innovation-policy-and-growth/)
Google Public Policy. An AI Opportunity Agenda for Vietnam. (Truy cập tại: https://publicpolicy.google/resources/vietnam_ai_opportunity_agenda_en.pdf)