Những viện nghiên cứu hàng đầu Trung Quốc có liên hệ với quân đội nước này đã sử dụng mô hình ngôn ngữ lớn nguồn mở Llama của Meta Platforms để phát triển một công cụ AI cho một số ứng dụng quân sự tiềm năng, theo các bài viết học thuật và nhà phân tích.
Trong bài viết vào tháng 6 được Reuters xem xét, 6 nhà nghiên cứu Trung Quốc từ ba viện, gồm cả hai viện trực thuộc Viện Hàn lâm Khoa học Quân sự (AMS), đã trình bày chi tiết cách họ sử dụng phiên bản Llama đầu tiên của Meta Platforms làm nền tảng cho mô hình AI ChatBIT. AMS là cơ quan nghiên cứu hàng đầu của Quân đội Trung Quốc.
Các nhà nghiên cứu này gồm Geng Guotong và Li Weiwei từ Trung tâm Nghiên cứu Thông tin Khoa học Quân sự và Viện Đổi mới Quốc phòng Quốc gia thuộc AMS, cũng như chuyên gia từ Viện Công nghệ Bắc Kinh và Đại học Dân tộc Trung Ương.
Nhóm nhà nghiên cứu đã sử dụng mô hình ngôn ngữ lớn Llama 2 13B mà Meta Platforms phát hành vào tháng 2.2023, rồi tích hợp những tham số riêng để xây dựng ChatBIT - công cụ AI tập trung vào quân sự nhằm thu thập và xử lý thông tin tình báo, đồng thời cung cấp thông tin chính xác và đáng tin cậy để ra quyết định tác chiến.
ChatBIT đã được tinh chỉnh và "tối ưu hóa cho các nhiệm vụ đối thoại và trả lời câu hỏi trong lĩnh vực quân sự". Công cụ này được cho đạt hiệu suất tốt hơn một số mô hình AI khác, có khả năng bằng khoảng 90% so với GPT-4 của OpenAI. Tuy nhiên, các nhà nghiên cứu không giải thích chi tiết về cách họ đánh giá hiệu suất hoặc nêu rõ liệu ChatBIT đã được đưa vào sử dụng hay chưa.
"Đây là lần đầu tiên có bằng chứng đáng kể cho thấy các chuyên gia quân sự quân đội Trung Quốc đã nghiên cứu một cách có hệ thống và cố gắng tận dụng sức mạnh của mô hình ngôn ngữ lớn nguồn mở, đặc biệt là của Meta, cho mục đích quân sự", theo Sunny Cheung, chuyên gia tại tổ chức phi lợi nhuận Jamestown Foundation chuyên nghiên cứu về công nghệ kép và AI của Trung Quốc.
Công nghệ kép thể được sử dụng cho cả mục đích dân sự và quân sự. Đây là các công nghệ và sản phẩm ban đầu được phát triển cho mục đích thương mại hoặc sử dụng dân sự nhưng có thể được áp dụng vào các mục đích quân sự, chẳng hạn các công nghệ thông tin, AI, công nghệ hạt nhân, sinh học hoặc vệ tinh.
Vì có khả năng được sử dụng trong quân sự, công nghệ kép thường là chủ đề của các quy định và kiểm soát xuất khẩu nghiêm ngặt, nhằm ngăn chặn việc sử dụng sai mục đích, bảo vệ an ninh quốc gia, và giảm thiểu nguy cơ phát tán công nghệ có thể gây hại.
Meta Platforms (chủ sở hữu Facebook) đã công khai phát hành nhiều mô hình AI của mình, trong đó có Llama, đồng thời áp dụng các hạn chế về việc sử dụng, gồm yêu cầu các dịch vụ có trên 700 triệu người dùng phải xin giấy phép từ công ty.
Các điều khoản của Meta Platforms cấm sử dụng những mô hình AI này cho "quân sự, chiến tranh, công nghiệp hạt nhân hoặc ứng dụng gián điệp" và hoạt động khác chịu sự kiểm soát xuất khẩu quốc phòng của Mỹ, cũng như để phát triển vũ khí và nội dung nhằm mục đích "kích động và thúc đẩy bạo lực".
Tuy nhiên, vì các mô hình của Meta Platforms là công khai nên công ty có ít cách để thực thi các điều khoản đó.
Trả lời Reuters, Meta Platforms trích dẫn chính sách sử dụng được chấp nhận của mình và cho biết đã thực hiện các biện pháp để ngăn chặn việc dùng sai mục đích.
"Bất kỳ việc dùng mô hình nào của chúng tôi bởi Quân đội Trung Quốc đều là trái phép và trái với chính sách sử dụng được chấp nhận của công ty", Molly Montgomery, Giám đốc chính sách công Meta Platforms, trả lời Reuters trong cuộc phỏng vấn qua điện thoại.
Trong tương lai, thông qua sự tinh chỉnh công nghệ, ChatBIT sẽ không chỉ được áp dụng vào phân tích tình báo mà còn lập kế hoạch chiến lược, huấn luyện mô phỏng và ra quyết định chỉ huy.
Bộ Quốc phòng Trung Quốc, các tổ chức hoặc nhà nghiên cứu nêu trên không trả lời khi Reuters đề nghị bình luận.
Reuters không thể xác nhận khả năng và sức mạnh tính toán của ChatBIT. Tuy nhiên, các nhà nghiên cứu lưu ý rằng ChatBIT chỉ tích hợp 100.000 bản ghi đối thoại quân sự - con số tương đối nhỏ so với các mô hình ngôn ngữ lớn khác.
"Đó chỉ là giọt nước trong đại dương so với hầu hết mô hình được đào tạo bằng hàng nghìn tỉ token. Vì vậy, điều này khiến tôi thực sự thắc mắc về những khả năng khác biệt mà họ có thể đạt được", Joelle Pineau, Phó chủ tịch Nghiên cứu AI tại Meta và giáo sư khoa học máy tính tại Đại học McGill (Canada), nhận xét.
Trong lĩnh vực AI và xử lý ngôn ngữ tự nhiên (NLP), token là đơn vị ngôn ngữ được sử dụng để phân chia văn bản thành các phần nhỏ hơn, giúp mô hình AI hiểu và xử lý văn bản dễ dàng hơn. Một token có thể là một từ, một ký hiệu, một phần của từ hoặc thậm chí một ký tự, tùy thuộc vào cách hệ thống NLP xử lý văn bản. Token giúp AI hiểu cấu trúc ngữ pháp, ngữ nghĩa và mối quan hệ giữa các từ trong câu. Khi được huấn luyện, mô hình ngôn ngữ lớn học cách dự đoán hoặc xử lý một chuỗi token thay vì xử lý toàn bộ câu hoặc văn bản dài trong một lần.
Nghiên cứu này diễn ra trong bối cảnh có một cuộc tranh luận gay gắt trong giới an ninh quốc gia và công nghệ Mỹ về việc liệu các công ty như Meta Platforms có nên công khai các mô hình AI của họ hay không.
Vào tháng 10.2023, Tổng thống Mỹ Joe Biden đã ký một lệnh hành pháp nhằm quản lý các hoạt động phát triển AI, lưu ý rằng dù đổi mới có thể mang lại nhiều lợi ích đáng kể nhưng cũng tồn tại "rủi ro an ninh lớn, chẳng hạn việc loại bỏ các biện pháp bảo vệ trong mô hình".
Tuần này, chính quyền Biden cho biết đang hoàn thiện các quy tắc để hạn chế đầu tư của Mỹ vào AI và những lĩnh vực công nghệ khác tại Trung Quốc có thể đe dọa đến an ninh quốc gia.
John Supple, người phát ngôn Lầu Năm Góc, nói Bộ Quốc phòng Mỹ thừa nhận rằng các mô hình nguồn mở có cả lợi ích và hạn chế. John Supple nói rằng: "Chúng tôi sẽ tiếp tục theo dõi chặt chẽ và đánh giá năng lực của các đối thủ cạnh tranh".
“Hũ bánh quy”
Một số nhà quan sát cho biết những bước tiến của Trung Quốc trong việc phát triển AI nội địa, gồm cả việc thành lập hàng loạt phòng thí nghiệm nghiên cứu, khiến việc ngăn nước này thu hẹp khoảng cách công nghệ với Mỹ trở nên khó khăn hơn.
Trong một bài viết học thuật riêng được Reuters xem xét, hai nhà nghiên cứu thuộc Tập đoàn Công nghiệp Hàng không Trung Quốc (AVIC), công ty bị Mỹ coi là có liên hệ với Quân đội Trung Quốc, đã mô tả về việc sử dụng Llama 2 để "huấn luyện các chiến lược can thiệp tác chiến điện tử trên không".
Việc Trung Quốc sử dụng AI do phương Tây phát triển cũng mở rộng sang an ninh trong nước. Một bài viết vào tháng 6 đã mô tả cách Llama được sử dụng để "giám sát tình báo" nhằm xử lý lượng lớn dữ liệu và nâng cao khả năng ra quyết định của cảnh sát.
Tờ PLA Daily (Trung Quốc) đã đăng bình luận vào tháng 4 về việc AI có thể giúp "đẩy nhanh quá trình nghiên cứu, phát triển vũ khí và trang thiết bị", hỗ trợ phát triển mô phỏng chiến đấu và cải thiện hiệu quả huấn luyện quân sự.
"Bạn có thể giữ Trung Quốc tránh xa khỏi hũ bánh quy không? Không, tôi không thấy làm sao bạn có thể làm được", William Hannas, nhà phân tích chính tại Trung tâm An ninh và Công nghệ mới nổi (CSET) của Đại học Georgetown (Mỹ), nói với Reuters.
Năm 2023, CSET phát hiện 370 tổ chức ở Trung Quốc có các nhà nghiên cứu công bố các bài viết liên quan đến AI tổng quát (AGI), giúp thúc đẩy chiến lược quốc gia của Trung Quốc nhằm dẫn đầu thế giới về AI vào năm 2030.
AGI là một dạng AI có khả năng hiểu, học hỏi và thực hiện các nhiệm vụ đa dạng một cách linh hoạt, giống con người. Không giống như AI hẹp, vốn chỉ giỏi trong một lĩnh vực cụ thể (như nhận dạng giọng nói hoặc hình ảnh), AGI có khả năng áp dụng kiến thức và kỹ năng trong nhiều lĩnh vực khác nhau, từ đó giải quyết các vấn đề phức tạp một cách tự chủ và sáng tạo.
"Có quá nhiều sự hợp tác đang diễn ra giữa các nhà khoa học giỏi nhất Trung Quốc và những nhà khoa học AI giỏi nhất Mỹ để loại trừ họ khỏi các tiến bộ này", William Hannas nhận định.