Hotline quảng cáo: 076 4575985 Hotline nội dung: 0934.999945

Nhịp đập khoa học

Mô hình ngôn ngữ lớn Baidu và Zhipu AI đứng đầu Trung Quốc, nhưng kém OpenAI về khả năng tổng thể

Sơn Vân • 22/04/2024 21:30

Ernie 4.0 của Baidu và GLM-4 của Zhipu AI đứng đầu bảng xếp hạng các mô hình ngôn ngữ lớn Trung Quốc, nhưng các đối thủ nước ngoài vẫn dẫn đầu về khả năng tổng thể, theo thử nghiệm mới từ Đại học Thanh Hoa ở Bắc Kinh (thủ đô Trung Quốc).

Báo cáo đánh giá SuperBench của Đại học Thanh Hoa đã kiểm tra 14 mô hình ngôn ngữ lớn, công nghệ làm nền tảng cho chatbot trí tuệ nhân tạo (AI) tạo sinh. Kết quả cho thấy các mô hình ngôn ngữ lớn nước ngoài, chẳng hạn như GPT-4 của OpenAI và Claude-3 của Anthropic, đã dẫn đầu về nhiều khả năng, gồm cả hiểu ngữ nghĩa, tạo mã lập trình và sự liên kết với các lệnh của con người.

Các nhà nghiên cứu phát hiện ra "sự chênh lệch rõ ràng" về khả năng tạo mã lập trình và vận hành trong môi trường thực tế giữa các mô hình ngôn ngữ lớn nội địa với mô hình nước ngoài hàng đầu.

Báo cáo này nhằm mục đích “cung cấp các tiêu chí đánh giá khách quan và khoa học” để kiểm tra số lượng mô hình ngôn ngữ lớn ngày càng tăng gần đây, theo một bài đăng trên WeChat của Trung tâm Nghiên cứu Mô hình Cơ bản thuộc Đại học Thanh Hoa, nơi tiến hành đánh giá cùng Phòng thí nghiệm Trung Quan Thôn do chính phủ Trung Quốc hậu thuẫn.

Các gã khổng lồ công nghệ và công ty khởi nghiệp Trung Quốc đã chạy đua để phát triển mô hình ngôn ngữ lớn riêng kể từ khi OpenAI tung ra một số công cụ AI tạo sinh gây tiếng vang, gồm cả chabot ChatGPT và mô hình chuyển văn bản thành video Sora. OpenAI là công ty khởi nghiệp Mỹ được Microsoft đầu tư hơn 10 tỉ USD.

Theo số liệu từ chính phủ Trung Quốc, khoảng 200 mô hình ngôn ngữ lớn đã được giới thiệu ở nước này, nơi các dịch vụ của OpenAI không có sẵn.

Báo cáo của Đại học Thanh Hoa tương đồng nhận xét gần đây từ Thái Sùng Tín, đồng sáng lập và Chủ tịch Alibaba. Ông cho biết các hãng công nghệ Trung Quốc đi sau khoảng 2 năm so với các công ty hàng đầu Mỹ trong cuộc đua AI toàn cầu, với lý do OpenAI đã vượt qua phần còn lại của ngành công nghệ trong đổi mới AI.

Bản cập nhật các biện pháp kiểm soát xuất khẩu của Mỹ, có hiệu lực từ ngày 4.4, khiến Trung Quốc gặp khó khăn hơn trong việc tiếp cận các chip AI tiên tiến và thiết bị sản xuất chất bán dẫn. Thái Sùng Tín nói rằng các hãng công nghệ Trung Quốc đang tiếp tục tìm cách giảm thiểu tác động của những hạn chế này, gồm tìm nguồn cung ứng chip lý tiên tiến từ các nhà cung cấp khác và tích trữ chip hiện có sẵn trên thị trường. Ví dụ, gã khổng lồ tìm kiếm Baidu năm ngoái đã đặt mua chip AI từ Huawei, theo trang SCMP.

Thái Sùng Tín nhận định: “Tôi nghĩ trong năm tới hoặc 18 tháng tới, việc đào tạo về các mô hình ngôn ngữ lớn vẫn có thể được tiến hành, dựa trên lượng dữ liệu mà mọi người có sẵn”.

“Việc đào tạo mô hình ngôn ngữ lớn đòi hỏi tính toán hiệu suất cao hơn, trái ngược với các ứng dụng mà nhiều người gọi là suy luận. Vì vậy, về mặt suy luận thì có nhiều lựa chọn. Bạn không cần phải có chip mạnh và cao cấp như phiên bản mới nhất của Nvidia”, ông lý giải.

Chủ tịch Alibaba dự đoán rằng trong dài hạn, Trung Quốc sẽ phát triển khả năng của riêng mình để tạo ra những chip AI cao cấp này.

Bất chấp những thách thức mà các nhà phát triển mô hình ngôn ngữ lớn Trung Quốc phải đối mặt, báo cáo của Đại học Thanh Hoa cho thấy Ernie 4.0 của Baidu và GLM-4 từ Zhipu AI (công ty khởi nghiệp được thành lập bởi một sinh viên Đại học Thanh Hoa) đã dần thu hẹp khoảng cách với những mô hình ngôn ngữ lớn tốt nhất thế giới về thành tích tổng thể.

Thử nghiệm cho thấy một lĩnh vực mà mô hình ngôn ngữ lớn Trung Quốc hoạt động tốt hơn là các tác vụ bằng ngôn ngữ văn bản tiếng Trung. Kimi của công ty khởi nghiệp Moonshot AI, Tongyi Qianwen 2.1 của Alibaba, GLM-4 và Ernie 4.0 được xếp hạng trong top 4 ở hạng mục đó, dù GPT-4 vẫn đứng đầu về lý luận ngôn ngữ văn bản tiếng Trung.

mo-hinh-ngon-ngu-lon-baidu-va-zhipu-ai-dung-dau-trung-quoc-nhung-kem-openai-ve-hieu-suat-tong-the.jpg — Theo đánh giá từ Đại học Thanh Hoa, phiên bản mới nhất Ernie 4.0 của Baidu là một trong những mô hình ngôn ngữ lớn hoạt động tốt nhất ở Trung Quốc - Ảnh: Bloomberg

Moonshot AI, Zhipu AI cùng với Baichuan và MiniMax được người dân địa phương gọi là “bốn con hổ AI mới” của Trung Quốc vì là những công ty khởi nghiệp về AI có khả năng sáng tạo hứa hẹn nhất đất nước.

Được thành lập vào năm 2019 và có trụ sở tại Bắc Kinh, Zhipu AI đã huy động được 2,5 tỉ nhân dân tệ (347 triệu USD) kể từ năm ngoái, từ các nhà đầu tư liên kết với nhà nước, công ty đầu tư mạo hiểm và các hãng công nghệ lớn như Tencent Holdings, Ant Group, Meituan, Xiaomi và Alibaba.

Moonshot AI (cũng có trụ sở tại Bắc Kinh) đã huy động được 1 tỉ USD trong vòng tài trợ vào tháng 2, theo nhiều phương tiện truyền thông Trung Quốc.

“Trung Quốc không thể bắt kịp những tiến bộ của Mỹ về AI do gặp thách thức về lý thuyết và công nghệ”

Trung Quốc không thể bắt kịp Mỹ trong những tiến bộ về AI do "gặp phải nhiều thách thức về lý thuyết và công nghệ", theo một bản thuyết trình gần đây trước Thủ tướng Lý Cường.

Những khó khăn đó được trình bày trước Thủ tướng Trung Quốc - Lý Cường trong chuyến thị sát vào tháng trước của ông tới Học viện Trí tuệ nhân tạo Bắc Kinh (BAAI), tổ chức phi lợi nhuận tư nhân được thành lập vào năm 2018, tham gia nghiên cứu và phát triển AI, đài truyền hình trung ương CCTV đưa tin.

Theo bài thuyết trình tại BAAI, rào cản lớn mà các sáng kiến AI tạo sinh của Trung Quốc phải đối mặt là sự phụ thuộc quá mức vào Llama, mô hình ngôn ngữ được Meta Platforms (Mỹ) phát hành vào tháng 2.2023.

Có “sự thiếu tự chủ nghiêm trọng” trong lĩnh vực phát triển AI của Trung Quốc vì hầu hết mô hình ngôn ngữ lớn trong nước đều được xây dựng dựa trên Llama, theo bài thuyết trình. Meta Platforms (công ty mẹ Facebook) vào tháng 7.2023 đã cung cấp mô hình ngôn ngữ lớn mã nguồn mở Llama 2 miễn phí cho nghiên cứu và sử dụng thương mại. Hôm 18.4, Meta Platforms đã ra mắt phiên bản đầu tiên của phiên bản Llama 3.

Nhược điểm về mô hình ngôn ngữ lớn làm gia tăng mối lo rằng Trung Quốc đang đối mặt với khoảng cách ngày càng mở rộng so với Mỹ về đổi mới AI, điều này đã được nhấn mạnh trong buổi thảo luận tại cuộc họp lưỡng hội đầu tháng 3 ở Bắc Kinh.

Trong khi các cơ quan nhà nước đang hợp tác song song với các hãng công nghệ tư nhân Trung Quốc để đổi mới AI, họ vẫn phải đối mặt với các vấn đề liên quan đến cơ sở hạ tầng điện toán để đào tạo mô hình ngôn ngữ lớn.

“Hàng tá chip được phát triển trong nước khác nhau về dòng và hệ sinh thái, khiến quá trình đào tạo 100 tỉ tham số cho mô hình ngôn ngữ lớn Trung Quốc trở nên rất không ổn định”, trích nội dung bài thuyết trình. Các lệnh trừng phạt công nghệ từ chính quyền Biden đã hạn chế khả năng tiếp cận của Trung Quốc với các chất bán dẫn tiên tiến được sản xuất bằng công nghệ Mỹ, cho các dự án phát triển AI trong nước.

Khả năng của mô hình ngôn ngữ lớn một phần phụ thuộc vào số lượng tham số, thước đo mức độ phức tạp cho mô hình. Ví dụ, mô hình ngôn ngữ lớn GPT-4 của OpenAI được đào tạo với 1.000 tỉ tham số. Trong khi hầu hết mô hình ngôn ngữ lớn nguồn mở của Trung Quốc trên thị trường chỉ có từ 6 tỉ đến 13 tỉ tham số.

Số lượng mô hình ngôn ngữ lớn được chính phủ Trung Quốc phê duyệt hiện có tổng cộng hơn 40.

Theo bài thuyết trình tại BAAI, một vấn đề lớn khác liên quan đến việc kiểm soát nội dung do AI tạo ra. Cụ thể hơn, thách thức lớn mà mô hình ngôn ngữ lớn ở Trung Quốc phải đối mặt là tạo ra “nội dung chất lượng phù hợp với thực tế”, đồng thời cũng phải xem xét tư tưởng chính trị và các cảm xúc khác nhau.

Các chatbot AI, gồm cả ChatGPT và Gemini của Google, đôi khi trả lời sai nhưng y như thật, được gọi là ảo giác.

Dù CCTV không xác định tác giả bài thuyết trình BAAI, các slide được phát sóng có logo của Zhipu AI. Đại diện của Zhipu AI hôm 14.3 xác nhận rằng công ty đã có mặt trong chuyến thị sát của Thủ tướng Trung Quốc tại BAAI một ngày trước đó.

Là một phần của hệ sinh thái hợp tác mà BAAI đang nuôi dưỡng, Zhipu AI cho biết đã xây dựng mô hình ngôn ngữ lớn với quy mô 100 tỉ tham số.

Trong cuộc họp bên lề hôm 5.3 của Ủy ban Chính Hiệp Toàn quốc (CPPCC) - cơ quan cố vấn chính trị hàng đầu Trung Quốc, Zeng Yi (đại biểu đứng đầu China Electronics Corporation) cho biết công ty của ông còn “một chặng đường dài” để bắt kịp Mỹ. China Electronics Corporation là công ty chip lớn thuộc sở hữu nhà nước Trung Quốc có trụ sở ở thành phố Thâm Quyến.

“Nói một cách khách quan, bất chấp những nỗ lực to lớn mà chúng ta đã và đang thực hiện, sự khác biệt của chúng ta với Mỹ vẫn rất lớn”, Zeng Yi phát biểu trước đám đông đại diện của cộng đồng khoa học và công nghệ.

Zeng Yi lãnh đạo một công ty phát triển công nghệ an ninh thông tin và mạng quốc gia, nghiên cứu và thiết kế chip, thiết bị bán dẫn, quy trình sản xuất tiên tiến và hệ điều hành.

Bài liên quan

Trung Quốc phê duyệt hơn 40 mô hình ngôn ngữ lớn trong nửa năm mặc cảnh báo từ CEO Baidu

Trung Quốc đã phê duyệt hơn 40 mô hình ngôn ngữ lớn để sử dụng công khai trong 6 tháng đầu tiên kể từ khi chính quyền bắt đầu quá trình này.

Đọc tiếp

Microsoft: Hacker từ Trung Quốc, Nga và Iran sử dụng các mô hình ngôn ngữ lớn của OpenAI

Adobe đưa Sora của OpenAI và các công cụ AI bên thứ ba vào phần mềm Premiere Pro đình đám

Baidu, Tencent, Ant Group hợp tác với OpenAI, Microsoft, Nvidia tạo 2 tiêu chuẩn AI quốc tế đầu tiên

(0) Bình luận

Xếp theo:

Đọc thêm Nhịp đập khoa học

Nổi bật Một thế giới

Cuộc họp Thủ tướng ba nước Việt Nam, Lào, Campuchia

6 giờ trước Sự kiện

Chiều 22.2, nhân dịp tham dự Cuộc gặp giữa ba người đứng đầu ba Đảng Việt Nam, Campuchia và Lào tại TP.HCM, Thủ tướng Chính phủ Phạm Minh Chính đã có cuộc gặp làm việc với Thủ tướng Campuchia Hun Manet và Thủ tướng Lào Sonexay Siphandone nhằm quán triệt các nội dung thỏa thuận tại kết luận của cuộc gặp giữa ba người đứng đầu ba đảng.

Những khác biệt chính của iPhone 16e và iPhone 16: Nên chọn máy nào?

iPhone 16e là lựa chọn kinh tế hơn iPhone 16, nhưng đi kèm với một số hạn chế nhất định.
TP.HCM: Người nhận hỗ trợ 2,7 tỉ đồng do sắp xếp bộ máy phải đáp ứng điều kiện gì?

Kỳ họp lần thứ 21 (kỳ họp chuyên đề), HĐND TP.HCM chiều 20.2 đã thông qua Nghị quyết về chế...
Kiện toàn Ban Chỉ đạo xây dựng Luật KH-CN (sửa đổi): Phó thủ tướng Bùi Thanh Sơn làm trưởng ban

Thủ tướng Chính phủ Phạm Minh Chính vừa ký Quyết định số 380/QĐ-TTg ngày 20.2.2025 về việc...

Đừng bỏ lỡ

Thành công nhờ... không học đạo diễn chính quy

6 giờ trước Văn hóa

Lý Hải, Trấn Thành, Thu Trang là những đạo diễn thành công với điện ảnh, ít nhất là về mặt doanh thu phòng vé khi phim thu về trên 100 tỉ.
Ai mì Quảng không - ca khúc hay nhất về món ăn của một vùng quê

8 giờ trước Văn hóa

Có thể nói ca khúc Ai mì quảng không của cố nhạc sĩ Trần Phú Thiên là bài hát hay nhất viết về ẩm thực vùng miền.
Kiểm định cầu Đồng Nai, hạn chế lưu thông

9 giờ trước Hạ tầng và bất động sản

Ngày 22.2, Khu Quản lý đường bộ IV (Cục Đường bộ Việt Nam) cho biết đang triển khai công tác kiểm định cầu Đồng Nai cũ theo hướng từ TP.HCM đi Đồng Nai.
'Áo giáp' cho tài xế công nghệ

10 giờ trước Góc bình luận

Nhiều vụ việc xâm phạm sức khỏe, tính mạng và tài sản của shipper, tài xế công nghệ trong thời gian gần đây cho thấy dường như lái xe công nghệ cũng là “nghề nguy hiểm”, nhất là khi nữ giới cầm lái.
Sôi nổi giải giao lưu Pickleball Bộ đội Biên phòng tỉnh An Giang

11 giờ trước Sự kiện

Giải giao lưu pickleball chào mừng kỷ niệm 66 năm ngày truyền thống Bộ đội Biên phòng Việt Nam (3.3.1959 – 3.3.2025) và 36 năm ngày Biên phòng toàn dân (3.3.1989 – 3.3.2025), do Bộ đội Biên phòng tỉnh An Giang tổ chức thu hút đông đảo các vận động viên đến từ cơ quan Bộ Chỉ huy và các đơn vị cơ sở tham gia.

Mới nhất

Cuộc họp Thủ tướng ba nước Việt Nam, Lào, Campuchia

6 giờ trước Sự kiện

Chiều 22.2, nhân dịp tham dự Cuộc gặp giữa ba người đứng đầu ba Đảng Việt Nam, Campuchia và Lào tại TP.HCM, Thủ tướng Chính phủ Phạm Minh Chính đã có cuộc gặp làm việc với Thủ tướng Campuchia Hun Manet và Thủ tướng Lào Sonexay Siphandone nhằm quán triệt các nội dung thỏa thuận tại kết luận của cuộc gặp giữa ba người đứng đầu ba đảng.
Những khác biệt chính của iPhone 16e và iPhone 16: Nên chọn máy nào?

7 giờ trước Thế giới số

iPhone 16e là lựa chọn kinh tế hơn iPhone 16, nhưng đi kèm với một số hạn chế nhất định.
TP.HCM: Người nhận hỗ trợ 2,7 tỉ đồng do sắp xếp bộ máy phải đáp ứng điều kiện gì?

9 giờ trước Theo dòng thời sự

Kỳ họp lần thứ 21 (kỳ họp chuyên đề), HĐND TP.HCM chiều 20.2 đã thông qua Nghị quyết về chế độ hỗ trợ thêm đối với cán bộ, công chức, viên chức, người lao động khi thực hiện sắp xếp tổ chức bộ máy.
Kiện toàn Ban Chỉ đạo xây dựng Luật KH-CN (sửa đổi): Phó thủ tướng Bùi Thanh Sơn làm trưởng ban

11 giờ trước Theo dòng thời sự

Thủ tướng Chính phủ Phạm Minh Chính vừa ký Quyết định số 380/QĐ-TTg ngày 20.2.2025 về việc kiện toàn Ban Chỉ đạo xây dựng Luật Khoa học và Công nghệ (KH-CN) (sửa đổi).
Thủ tướng yêu cầu khắc phục hậu quả vụ TNGT đặc biệt nghiêm trọng tại Sơn La

13 giờ trước Theo dòng thời sự

Ngày 22.2, Thủ tướng Phạm Minh Chính đã có Công điện chỉ đạo khắc phục hậu quả vụ tai nạn giao thông (TNGT) đặc biệt nghiêm trọng tại huyện Yên Châu, tỉnh Sơn La.