CEO Baidu: Việc đua nhau phát triển mô hình AI ở Trung Quốc gây lãng phí rất lớn

Giám đốc điều hành gã khổng lồ tìm kiếm Baidu hôm 15.11 đã cảnh báo việc vội vàng phát triển các mô hình ngôn ngữ lớn ở Trung Quốc có thể dẫn đến lãng phí tài nguyên rất lớn, đồng thời cho rằng những công ty cần tập trung nỗ lực phát triển ứng dụng thực tế.

Robin Li (Lý Ngạn Hoành), Giám đốc điều hành Baidu - một trong những công ty AI hàng đầu Trung Quốc, đã đưa ra nhận xét của mình tại diễn đàn công nghiệp ở thành phố Thâm Quyến trong bối cảnh thị trường ngày càng lo lắng về khả năng xảy ra sự rung chuyển khi các công ty phát triển các mô hình ngôn ngữ lớn vẫn chưa tìm được mô hình kinh doanh khả thi.

Kể từ khi OpenAI phát hành chatbot ChatGPT vào tháng 11.2022, generative AI (trí tuệ nhân tạo tạo sinh) đã thu hút được sự quan tâm đáng kể ở Trung Quốc, khiến cả các hãng lâu đời và công ty khởi nghiệp đều nhảy vào lĩnh vực này.

“Tôi đã quan sát thấy một hiện tượng ở Trung Quốc, trong đó nhiều ngành công nghiệp, công ty và thậm chí cả thành phố đang mua phần cứng, dự trữ chip và xây dựng các trung tâm máy tính để đào tạo các mô hình ngôn ngữ lớn riêng từ đầu.

Bản thân mô hình ngôn ngữ lớn là nền tảng cơ bản giống như hệ điều hành, nhưng cuối cùng các nhà phát triển cần phải dựa vào một số lượng hạn chế các mô hình đó để phát triển ứng dụng gốc khác nhau. Do đó, việc liên tục phát triển lại các mô hình ngôn ngữ lớn mang tính nền tảng sẽ gây lãng phí rất lớn tài nguyên xã hội", Lý Ngạn Hoành nói.

ceo-baidu-viec-dua-nhau-phat-trien-mo-hinh-ai-o-trung-quoc-gay-lang-phi-rat-lon.jpg — Lý Ngạn Hoành đã cảnh báo việc vội vàng phát triển các mô hình ngôn ngữ lớn ở Trung Quốc có thể dẫn đến lãng phí tài nguyên rất lớn - Ảnh: Internet

Giám đốc điều hành Baidu cho biết ở Trung Quốc có rất nhiều mô hình ngôn ngữ lớn nhưng các ứng dụng AI được phát triển dựa trên chúng vẫn còn rất ít.

Theo Lý Ngạn Hoành, tính đến tháng 10, 238 mô hình ngôn ngữ lớn đã được phát hành ở Trung Quốc, tăng so với con số 79 vào tháng 6, trích dẫn một báo cáo của bên thứ ba.

Ernie, mô hình ngôn ngữ lớn của Baidu, đã được phát hành cho công chúng sử dụng vào tháng 8, cùng với các sản phẩm khác nhận được sự chấp thuận phát hành từ chính phủ Trung Quốc.

Hôm 18.10, Baidu đã tiết lộ phiên bản mới nhất Ernie 4.0 và cho biết nó mạnh mẽ như GPT-4 của OpenAI. Phiên bản Ernie đầu tiên được Baidu tung ra vào tháng 3.

Ngày 24.10, iFlytek, một trong những hãng công nghệ lớn đầu tiên ở Trung Quốc tung ra giải pháp thay thế ChatGPT, cho biết mô hình ngôn ngữ lớn Spark 3.0 của họ hiện đã vượt trội so với GPT-3.5 của OpenAI xét về ngữ cảnh tiếng Trung.

iFlytek ra mắt mô hình ngôn ngữ lớn Spark 3.0 lần đầu tiên vào tháng 5 và phát hành ra công chúng vào tháng 9 sau khi có sự chấp thuận của chính phủ Trung Quốc.

"Spark 3.0 đã vượt trội GPT-3.5 ở các khả năng như tạo văn bản, lý luận logic, toán học và mã hóa, đồng thời sẽ được đặt ngang hàng với GPT- 4 vào nửa đầu năm 2024”, Chủ tịch iFlytek - Liu Qingfeng tuyên bố.

Spark 3.0 (phiên bản thứ tư kể từ lần phát hành đầu tiên) cũng đạt điểm gần bằng GPT-3.5 khi thực hiện 48 nhiệm vụ trong ngữ cảnh tiếng Anh, Liu Qingfeng cho biết.

Song bất chấp những tiến bộ này, Chủ tịch iFlytek cho biết mô hình ngôn ngữ lớn trong nước vẫn có “khoảng cách thực sự” với GPT-4. Ông hy vọng sẽ thách thức mô hình ngôn ngữ lớn do OpenAI phát triển trong nửa đầu năm 2024.

Hôm 31.10, Alibaba Cloud (bộ phận đám mây của tập đoàn Alibaba) đã công bố bản cập nhật 2.0 cho mô hình Tongyi Qianwen, được đào tạo với hàng trăm tỉ thông số.

Chu Jingren, Giám đốc công nghệ Alibaba Cloud, nói tại sự kiện đối tác thường niên của công ty rằng Tongyi Qianwen 2.0 vượt trội hơn GPT-3.5 của OpenAI và Llama2 của Meta Platforms, đồng thời đã thu hẹp khoảng cách với GPT-4.

Cũng vào ngày 31.10, Baichuan ra mắt một mô hình ngôn ngữ lớn Baichuan2-192k mà công ty cho biết có thể hấp thụ và tóm tắt tiểu thuyết. Theo Baichuan, Baichuan2-192k trở thành mô hình ngôn ngữ lớn mạnh mẽ nhất thế giới trong việc xử lý các truy vấn văn bản dài.

Baichuan là công ty khởi nghiệp trí tuệ nhân tạo (AI) có trụ sở tại thủ đô Bắc Kinh, được thành lập bởi Wang Xiaochuan - người sáng lập công cụ tìm kiếm Sogou (Trung Quốc).

Baichuan cho biết “cửa sổ ngữ cảnh” của Baichuan2-192k có thể xử lý khoảng 350.000 ký tự tiếng Trung.

Cửa sổ ngữ cảnh là sự kết hợp giữa văn bản đầu vào và đầu ra mà mô hình có thể xử lý trong quá trình hội thoại với người dùng.

Để so sánh, Claude 2 trước đó là mô hình ngôn ngữ lớn tiên tiến nhất thế giới xét về số lượng từ mà người dùng có thể đưa vào truy vấn trò chuyện của họ, được cho có cửa sổ ngữ cảnh khoảng 75.000 từ tiếng Anh, tương ứng với hàng trăm trang tài liệu hoặc một cuốn sách. Claude 2 được công ty Anthropic (Mỹ), do Amazon hậu thuẫn, giới thiệu vào tháng 7.

Theo Baichuan, cửa sổ ngữ cảnh của Baichuan2-192k lớn hơn 14 lần so với GPT-4 do OpenAI (Mỹ) phát triển.

Baichuan cũng cho biết Baichuan2-192k vượt qua Claude 2 về chất lượng phản hồi cũng như khả năng hiểu và tóm tắt văn bản dài, trích dẫn kết quả kiểm tra từ LongEval - dự án do Đại học California (Berkeley) và các tổ chức khác ở Mỹ khởi xướng để đánh giá mức độ mô hình ngôn ngữ lớn xử lý các yêu cầu lớn.

Baichuan tuyên bố cửa sổ ngữ cảnh lớn hơn sẽ giúp mô hình AI của công ty trở nên hữu ích cho các doanh nghiệp cần xử lý và tạo văn bản dài hàng ngày, chẳng hạn như ngành pháp lý, truyền thông và tài chính. Baichuan tiết lộ công ty đã bắt đầu thử nghiệm nội bộ Baichuan2-192k với các đối tác công nghiệp.

Song theo các nhà phân tích và người trong ngành, mô hình ngôn ngữ lớn GPT-4 Turbo ra mắt tại hội nghị dành cho nhà phát triển đầu tiên của OpenAI hôm 7.11 dự kiến sẽ giúp công ty khởi nghiệp Mỹ nới rộng khoảng cách so với các đối thủ Trung Quốc, .

Các cải tiến của GPT-4 Turbo, bản cập nhật nền tảng cho chatbot AI phổ biến ChatGPT, bao gồm bộ nhớ lớn hơn để ghi nhớ tới 300 trang văn bản chỉ trong một lời nhắc, giá rẻ hơn cho nhà phát triển và ngày được đào tạo kiến thức đến tháng 4.2023, theo Sam Altman - Giám đốc điều hành OpenAI.

Xu Liang, một doanh nhân trong lĩnh vực AI tại thành phố Hàng Châu (Trung Quốc), cho rằng GPT-4 Turbo dự kiến sẽ khởi động một loạt hoạt động khác khi các đối thủ Trung Quốc, như Baidu và Alibaba, chạy đua để cố bắt kịp OpenAI.

Xu Liang nói trong một cuộc phỏng vấn với trang SCMP: “Các Big Tech (hãng công nghệ lớn) và công ty khởi nghiệp sẽ cần đầu tư nhiều hơn để theo kịp với sự phát triển của OpenAI. Nếu không thì sản phẩm của họ sẽ tụt quá xa so với GPT-4 Turbo và khiến người dùng thất vọng”.

Theo ông, trong khi một số công ty có thể tăng cường tập trung vào phát triển các mô hình nền tảng độc quyền, những hãng khác quyết định xây dựng các mô hình cụ thể cho ngành công nghiệp với khả năng tùy chỉnh cho những ngành khác nhau.

Lu Yanxia, Giám đốc nghiên cứu của công ty tư vấn CNTT International Data Corp, nói GPT-4 Turbo sẽ “truyền cảm hứng và thúc đẩy” các hãng công nghệ lớn Trung Quốc đầu tư hơn nữa vào các lĩnh vực như xử lý ngôn ngữ tự nhiên, một công nghệ quan trọng giúp các chatbot AI hiểu và xử lý các ngôn ngữ phức tạp của con người.

Cơn sốt generative AI của Trung Quốc đã dẫn đến hàng loạt thông báo về sản phẩm từ các công ty khởi nghiệp và gã khổng lồ công nghệ thời gian qua, nhưng các nhà đầu tư đang cảnh báo một sự thay đổi sắp xảy ra khi áp lực chi phí và lợi nhuận tăng lên.

Căng thẳng Trung – Mỹ cũng đè nặng lên lĩnh vực này, khi các quỹ USD đầu tư ít hơn vào các dự án giai đoạn đầu và khó khăn trong việc có được chip AI do những công ty như Nvidia sản xuất bắt đầu ảnh hưởng.

Esme Pau, người đứng đầu bộ phận nghiên cứu tài sản kỹ thuật số và internet Trung Quốc tại tập đoàn tài chính Macquarie Group, cho biết: “Chỉ những người có năng lực mạnh nhất mới tồn tại được”.

Bà nói thêm rằng một số công ty hàng đầu đã phát tín hiệu rằng sẽ cạnh tranh về giá để giành thị phần, giống như các dịch vụ đám mây như của Alibaba và Tencent từng làm.

Esme Pau nhận định: “Trong 6-12 tháng tới, mô hình ngôn ngữ lớn có khả năng thấp hơn sẽ dần bị loại bỏ do hạn chế về chip, chi phí cao và cạnh tranh gay gắt”.