Trung Quốc đã phê duyệt hơn 40 mô hình ngôn ngữ lớn để sử dụng công khai trong 6 tháng đầu tiên kể từ khi chính quyền bắt đầu quá trình này.
Khoa học - công nghệ

Trung Quốc phê duyệt hơn 40 mô hình ngôn ngữ lớn trong nửa năm mặc cảnh báo từ CEO Baidu

Sơn Vân 29/01/2024 15:45

Trung Quốc đã phê duyệt hơn 40 mô hình ngôn ngữ lớn để sử dụng công khai trong 6 tháng đầu tiên kể từ khi chính quyền bắt đầu quá trình này.

Các công ty Trung Quốc đã gấp rút phát triển các sản phẩm trí tuệ nhân tạo (AI) kể từ khi chatbot ChatGPT của OpenAI (Mỹ) gây bão trên toàn thế giới vào năm 2022. ChatGPT hoạt động dựa trên mô hình ngôn ngữ lớn GPT-3.5, GPT-4 và GPT-4 Turbo cũng của OpenAI.

Mô hình ngôn ngữ lớn là một loại mô hình học máy được huấn luyện để hiểu và tạo ra ngôn ngữ tự nhiên. Đây là các mô hình có khả năng xử lý và tạo ra văn bản ngôn ngữ tự nhiên với độ phức tạp cao. Thông thường, mô hình ngôn ngữ lớn được huấn luyện trên dữ liệu lớn từ internet, gồm các đoạn văn bản, bài báo, trang web và nguồn thông tin khác.

Các nhà quản lý Trung Quốc đã cấp phép cho tổng cộng 14 mô hình ngôn ngữ lớn để sử dụng công cộng vào tuần trước, theo báo Securities Times do nhà nước hậu thuẫn. Đây là đợt phê duyệt mô hình ngôn ngữ lớn thứ tư của Trung Quốc, với Xiaomi, 4Paradigm và 01.AI nằm trong số những hãng được chấp thuận.

Từ tháng 8.2023, Trung Quốc bắt đầu yêu cầu các hãng công nghệ phải được cơ quan quản lý chấp thuận để phát hành mô hình ngôn ngữ lớn ra công chúng. Điều này nhấn mạnh cách tiếp cận của Trung Quốc với việc phát triển trí tuệ nhân tạo (AI) trong khi vẫn cố gắng kiểm soát công nghệ này.

Trung Quốc đã phê duyệt mô hình ngôn ngữ lớn đầu tiên vào tháng 8.2023 ngay sau khi quy trình này được thông qua. Baidu, Alibaba và ByteDance là một trong những công ty Trung Quốc đầu tiên được phê duyệt mô hình ngôn ngữ lớn.

Sau đó, các cơ quan quản lý Trung Quốc đã thực hiện thêm hai đợt phê duyệt mô hình ngôn ngữ lớn vào tháng 11 và tháng 12.2023, trước khi có thêm một đợt khác trong tháng 1.2024.

Dù chính phủ Trung Quốc không tiết lộ danh sách chính xác các công ty được phê duyệt, Securities Times cho biết đã có tổng cộng hơn 40 mô hình ngôn ngữ lớn được phép sử dụng công khai tính từ tháng 8.2023.

Lý Ngạn Hoành, Giám đốc điều hành gã khổng lồ tìm kiếm Baidu, từng cảnh báo việc vội vàng phát triển các mô hình ngôn ngữ lớn ở Trung Quốc có thể dẫn đến lãng phí tài nguyên rất lớn, đồng thời cho rằng những công ty cần tập trung nỗ lực phát triển ứng dụng thực tế.

trung-quoc-phe-duyet-hon-40-mo-hinh-ai-trong-nua-nam-mac-loi-canh-bao-tu-ceo-baidu.jpg
Lý Ngạn Hoành cảnh báo việc đua nhau phát triển mô hình ngôn ngữ lớn ở Trung Quốc gây lãng phí rất lớn - Ảnh: Internet

Hồi tháng 9.2023, Trung Quốc có ít nhất 130 mô hình ngôn ngữ lớn, chiếm 40% tổng số toàn cầu và chỉ đứng sau Mỹ (chiếm 50%), theo công ty môi giới CLSA. Đến tháng 10.2023, Lý Ngạn Hoành nói đã có 238 mô hình ngôn ngữ lớn đã được phát hành ở Trung Quốc, tăng so với con số 79 vào tháng 6.2023, trích dẫn một báo cáo của bên thứ ba.

Ngoài ra, các công ty Trung Quốc cũng đã công bố hàng chục mô hình ngôn ngữ lớn theo ngành liên kết với mô hình cốt lõi của họ. Tuy nhiên, các nhà đầu tư và nhà phân tích nói rằng hầu hết vẫn chưa tìm được mô hình kinh doanh khả thi, quá giống nhau và đang phải vật lộn với chi phí tăng cao.

Căng thẳng Trung – Mỹ cũng đè nặng lên lĩnh vực này, khi các quỹ đầu tư ít hơn vào các dự án giai đoạn đầu và khó có được chip AI mạnh mẽ do Nvidia sản xuất.

Esme Pau, người đứng đầu bộ phận nghiên cứu tài sản kỹ thuật số và internet Trung Quốc tại tập đoàn tài chính Macquarie Group, cho biết: “Chỉ những người có năng lực mạnh nhất mới tồn tại được”.

Bà nói thêm rằng một số công ty hàng đầu đã phát tín hiệu rằng sẽ cạnh tranh về giá để giành thị phần, giống như các dịch vụ đám mây như của Alibaba và Tencent từng làm.

Esme Pau nhận định: “Trong 6-12 tháng tới, mô hình ngôn ngữ lớn có khả năng thấp hơn sẽ dần bị loại bỏ do hạn chế về chip, chi phí cao và cạnh tranh gay gắt”.

Ý kiến về việc công ty nào sẽ tồn tại trong cuộc đua mô hình ngôn ngữ lớn rất khác nhau. Yuan Hongwei, Chủ tịch của quỹ đầu tư mạo hiểm Z&Y Capital (có trụ sở tại thành phố Thâm Quyến, Trung Quốc), cho biết bà tin rằng chỉ có hai đến ba mô hình ngôn ngữ lớn đa năng sẽ thống trị thị trường. Đó là lý do tại sao Z&Y Capital tìm kiếm những người sáng lập có kinh nghiệm khi quyết định đầu tư vào công ty khởi nghiệp nào.

Từng đầu tư vào nhà sản xuất máy bay không người lái DJI và công ty khởi nghiệp lái xe tự động Pony.ai, Z&Y Capital cuối cùng quyết định ủng hộ Baichuan Intelligence. Hồi tháng 10.2023, Baichuan Intelligence ra mắt mô hình ngôn ngữ lớn Baichuan2-192k mà công ty cho biết có thể hấp thụ và tóm tắt tiểu thuyết. Thời điểm đó, Baichuan tuyên bố Baichuan2-192k là mô hình ngôn ngữ lớn mạnh mẽ nhất thế giới trong việc xử lý các truy vấn văn bản dài và “cửa sổ ngữ cảnh” của nó có thể xử lý khoảng 350.000 ký tự tiếng Trung.

Cửa sổ ngữ cảnh là sự kết hợp giữa văn bản đầu vào và đầu ra mà mô hình có thể xử lý trong quá trình hội thoại với người dùng.

Để so sánh, Claude 2 trước đó là mô hình ngôn ngữ lớn tiên tiến nhất thế giới xét về số lượng từ mà người dùng có thể đưa vào truy vấn trò chuyện của họ, được cho có cửa sổ ngữ cảnh khoảng 75.000 từ tiếng Anh, tương ứng với hàng trăm trang tài liệu hoặc một cuốn sách. Claude 2 được công ty Anthropic (Mỹ), do Amazon hậu thuẫn, giới thiệu vào tháng 7.

Theo bài đăng trên WeChat của Baichuan, cửa sổ ngữ cảnh của Baichuan2-192k lớn hơn 14 lần so với GPT-4.

Baichuan Intelligence được thành lập bởi Wang Xiaochuan, người sáng lập Sogou (công cụ tìm kiếm internet số 2 Trung Quốc). Baichuan Intelligence là 1 trong 5 công ty đầu tiên nhận được sự chấp thuận của Trung Quốc để phát hành chatbot công khai vào cuối tháng 8.2023.

“Chúng tôi nhìn thấy một cơ hội ở đây. Bản thân Wang Xiaochuan đang chỉ đạo dự án này. Với sự hiểu biết về kinh doanh kỹ thuật số, thành công của ông với Sogou và cách ông thu hút sự chú ý của toàn ngành, chúng tôi nghĩ rằng đây là lựa chọn tốt nhất", Yuan Hongwei (lãnh đạo quỹ đầu tư Z&Y Capital) lý giải.

Ngoài Wang Xiaochuan, một số doanh nhân và nhà quản lý công nghệ tên tuổi khác cũng đứng đằng sau các công ty khởi nghiệp AI của Trung Quốc, chẳng hạn Kai-Fu Lee (cựu Chủ tịch Google Trung Quốc) và Yan Juejie (cựu Phó chủ tịch của SenseTime).

Một số nhà phân tích cho rằng các hãng công nghệ lớn nhất Trung Quốc như Alibaba, Tencent và Baidu có khởi đầu thuận lợi nhất và nguồn vốn dồi dào để thành công trong cuộc chiến mô hình ngôn ngữ lớn nhờ cơ sở người dùng lớn lẫn nhiều dịch vụ đa dạng. Chẳng hạn, họ có thể dễ dàng cung cấp các dịch vụ AI sinh dưới dạng một phần bổ trợ bổ sung cho người dùng đám mây của mình.

Tony Tung, Giám đốc điều hành công ty Gobi Partners GBA, cho biết: “Những gã khổng lồ công nghệ đã thừa hưởng một ưu thế từ hầu hết các tình huống kinh doanh dễ dàng trong các hệ sinh thái đã được thiết lập của họ”.

Tony Tung nói thêm rằng một số nhà đầu tư hối tiếc khi đầu tư sớm vào các công ty mô hình ngôn ngữ lớn khi sự phấn khích về AI đạt đỉnh vào đầu năm 2023. Nhiều công ty khởi nghiệp như vậy đang gặp khó khăn trong việc xây dựng các mô hình kinh doanh hiệu quả và hiện tìm cách hợp tác với những gã khổng lồ công nghệ để tìm ra cách sử dụng sản phẩm hoặc có khả năng bán cho họ.

Mục tiêu của việc xây dựng các mô hình kinh doanh hiệu quả là thuyết phục người đầu tư, đối tác hoặc bất kỳ bên nào có liên quan rằng ý tưởng hoặc sản phẩm này có tiềm năng để thành công và tạo ra giá trị kinh doanh.

Lời cảnh báo từ Giám đốc điều hành Baidu

Hồi tháng 11.2023, Lý Ngạn Hoành từng đưa ra nhận xét tại diễn đàn công nghiệp ở thành phố Thâm Quyến trong bối cảnh thị trường ngày càng lo lắng về khả năng xảy ra sự rung chuyển khi các công ty phát triển các mô hình ngôn ngữ lớn vẫn chưa tìm được mô hình kinh doanh khả thi: “Tôi đã quan sát thấy một hiện tượng ở Trung Quốc, trong đó nhiều ngành công nghiệp, công ty và thậm chí cả thành phố đang mua phần cứng, dự trữ chip và xây dựng các trung tâm máy tính để đào tạo các mô hình ngôn ngữ lớn riêng từ đầu.

Bản thân mô hình ngôn ngữ lớn là nền tảng cơ bản giống như hệ điều hành, nhưng cuối cùng các nhà phát triển cần phải dựa vào một số lượng hạn chế các mô hình đó để phát triển ứng dụng gốc khác nhau. Do đó, việc liên tục phát triển lại các mô hình ngôn ngữ lớn mang tính nền tảng sẽ gây lãng phí rất lớn tài nguyên xã hội", Giám đốc điều hành Baidu nói.

Lý Ngạn Hoành cho biết ở Trung Quốc có rất nhiều mô hình ngôn ngữ lớn nhưng các ứng dụng AI được phát triển dựa trên chúng vẫn còn rất ít.

Ernie, mô hình ngôn ngữ lớn của Baidu, đã được phát hành cho công chúng sử dụng vào tháng 8.2023, cùng với các sản phẩm khác nhận được sự chấp thuận phát hành từ chính phủ Trung Quốc.

Baidu đã tiết lộ phiên bản mới nhất Ernie 4.0 mạnh mẽ như GPT-4 của OpenAI. Phiên bản Ernie đầu tiên được Baidu tung ra vào tháng 3.

Bài liên quan
Chủ tịch iFlytek: Mô hình ngôn ngữ lớn Spark 3.0 vượt trội GPT-3.5 của OpenAI ở Trung Quốc
iFlytek, một trong những hãng công nghệ lớn đầu tiên ở Trung Quốc tung ra giải pháp thay thế ChatGPT, cho biết mô hình ngôn ngữ lớn Spark 3.0 của họ hiện đã vượt trội so với GPT-3.5 của OpenAI xét về ngữ cảnh tiếng Trung.

(0) Bình luận
Nổi bật Một thế giới
Công nghiệp bán dẫn - Việt Nam cần nắm bắt cơ hội 'nghìn năm có một'
1 giờ trước Nhịp đập khoa học
Việt Nam đang có cơ hội “nghìn năm có một” để tham gia vào chuỗi giá trị ngành công nghiệp bán dẫn toàn cầu.
Đừng bỏ lỡ
Mới nhất
POWERED BY ONECMS - A PRODUCT OF NEKO
Trung Quốc phê duyệt hơn 40 mô hình ngôn ngữ lớn trong nửa năm mặc cảnh báo từ CEO Baidu