Gã khổng lồ tìm kiếm Baidu (Trung Quốc) đã giới thiệu phiên bản beta của Ernie Bot, chatbot tương tự ChatGPT, nhưng lại bỏ qua màn trình diễn trực tiếp thường là mấu chốt của việc ra mắt công nghệ từ Thung lũng Silicon (Mỹ) đến Barcelona (Tây Ban Nha).
Nhiều nhà đầu tư thất vọng vì điều này khiến cổ phiếu Baidu giảm giá ở Hồng Kông trong bối cảnh thị trường đang suy thoái.
Lý Ngạn Hoành, người sáng lập kiêm Giám đốc điều hành Baidu, phát biểu trên sân khấu khoảng 30 phút trong sự kiện ở Bắc Kinh (thủ đô Trung Quốc) chiều 16.3. Sự kiện này cũng được phát trực tiếp trên mạng.
Thay vì tự mình trình diễn công nghệ, bài phát biểu của Lý Ngạn Hoành được kèm theo các slide PowerPoint cho thấy khả năng của Ernie Bot, bao gồm viết khẩu hiệu của công ty, giải toán, tạo âm thanh và video. Các bản ghi hình Ernie Bot tại nơi làm việc cũng được trình chiếu.
Cổ phiếu Baidu đã giảm tới 10% trong suốt bài thuyết trình của Lý Ngạn Hoành.
Cổ phiếu Baidu chốt phiên 16.3 giảm 6,4% xuống còn 125,1 đô la Hồng Kông (15,94 USD). Điều này trái ngược hoàn toàn với tháng 2, khi cổ phiếu Baidu tăng 15% sau thông tin công ty đang làm việc trên ứng dụng thách thức ChatGPT, thổi bùng hy vọng rằng một trong những công ty AI hàng đầu Trung Quốc có thể khai phá tiềm năng các mô hình ngôn ngữ lớn ở nước này.
Sự kiện trên diễn ra một ngày sau khi OpenAI tạo ra nhiều hứng thú hơn với công nghệ AI riêng bằng cách ra mắt GPT-4, phiên bản mới nhất và tiên tiến nhất của mô hình ngôn ngữ GPT (Generative Pre-training Transformer). GPT-4 được xác nhận có khả năng đa phương thức, đồng nghĩa hình ảnh cũng như lời nhắc văn bản có thể thúc đẩy nó tạo ra nội dung.
Ernie Bot ban đầu sẽ chỉ khả dụng cho một số người dùng nhận được mã mời, sau đó sẽ dần dần mở ra cho công chúng.
Lý Ngạn Hoành dành phần lớn thời gian trên sân khấu để trình bày các slide giải thích tiềm năng công nghệ mới của Baidu.
Nhà sáng lập Baidu đã gợi ý đến GPT-4 trong bài thuyết trình, nói rằng ông ngạc nhiên bởi khả năng tóm tắt thông tin của GPT-4, nhưng cảnh báo không nên nhìn nhận điều này dưới góc độ địa chính trị.
“Theo kinh nghiệm cá nhân của tôi với Ernie Bot, tôi không thể nói nó hoàn hảo. Việc ra mắt bây giờ là do có nhu cầu thị trường. Ernie Bot không phải là công cụ để Trung Quốc và Mỹ cạnh tranh. Đó là kết quả tự nhiên mà các thế hệ kỹ sư của Baidu đạt được khi họ mơ ước sử dụng công nghệ để thay đổi thế giới”, Lý Ngạn Hoành nói.
Dù công chúng sẽ không có quyền truy cập vào Ernie Bot ngay lập tức, Baidu cho biết đơn vị điện toán đám mây của họ sẽ ngay lập tức bắt đầu cung cấp giao diện lập trình ứng dụng (API) cho các khách hàng doanh nghiệp.
Baidu không trả lời câu hỏi về cổ phiếu giảm sau bài thuyết trình của Lý Ngạn Hoành, trong đó tuyên bố rằng hơn 30.000 người dùng doanh nghiệp đã đăng ký thử nghiệm API của phiên bản Ernie Bot hướng tới doanh nghiệp và lưu lượng truy cập trên trang web đám mây Baidu tăng vọt.
"Sau khi ChatGPT trình làng, chỉ có Baidu là sản phẩm chuẩn trong số các hãng công nghệ lớn trên thế giới", Baidu nói.
Lý Trí, Giám đốc viện nghiên cứu của công ty tư vấn Analysys có trụ sở tại Bắc Kinh, nói sự ra mắt Ernie Bot của Baidu vừa dũng cảm vừa đáng tiếc.
“Baidu là hãng công nghệ Trung Quốc đầu tiên giới thiệu một mô hình ngôn ngữ lớn sau ChatGPT và GPT-4, nhưng chỉ cho thấy các bản demo video, điều này không gây ấn tượng bằng một bản trình diễn trực tiếp”, Lý Trí nhận xét.
ChatGPT tạo ra sự quan tâm to lớn ở Trung Quốc dù OpenAI không chính thức cung cấp chatbot của mình cho thị trường 1 tỉ người dùng internet. ChatGPT có thể trả lời các truy vấn bằng nhiều ngôn ngữ, gồm cả tiếng Anh và tiếng Trung, điều dường như là hạn chế hiện tại của Ernie Bot.
Lý Trí nói rằng: “Ernie Bot rất giỏi trong xử lý tiếng Trung, nhưng khả năng xử lý tiếng Anh của nó không được tốt”. Giống các mô hình ngôn ngữ khác, Ernie Bot được đào tạo trên lượng lớn tài liệu bằng văn bản, nhưng bị giới hạn bởi việc nằm trong môi trường internet bị kiểm duyệt của Trung Quốc được quản lý bởi Great Firewall (tường lửa vĩ đại).
Trong một tuyên bố, Baidu cho hay: “Mô hình Ernie có khả năng xử lý ngôn ngữ tự nhiên tiên tiến nhất trong tiếng Trung. Sự tiến bộ của nó không chỉ thể hiện ở sự hiểu biết về tiếng Trung mà còn về văn hóa Trung Quốc. Do đó, Ernie Bot sẽ phù hợp hơn với tiếng Trung và thị trường Trung Quốc so với các mô hình được phát triển ở nước ngoài”.
Ernie (viết tắt của Enhanced Discussion through Knowledge Integration) là mô hình máy học quy mô lớn được Baidu đào tạo về dữ liệu trong nhiều năm. Đầu năm 2019, Baidu tung ra Ernie mà các nhà nghiên cứu tại công ty Trung Quốc tuyên bố hoạt động tốt hơn Google Bert trong các tác vụ tiếng Trung.
Charlie Chai, nhà phân tích của công ty 86Research, cho biết sự kiện của Baidu rõ ràng mang đến sự thất vọng cho nhiều người xem nó như một chất xúc tác giao dịch, nhưng ông vẫn coi Baidu là lựa chọn tốt nhất trong không gian AI Trung Quốc.
Baidu đã quảng cáo về khoản đầu tư R&D (nghiên cứu & phát triển) lớn nhiều năm vào AI và học sâu, đồng thời cho biết có kế hoạch sử dụng Ernie Bot để cách mạng hóa công cụ tìm kiếm cũng như tăng hiệu quả trong đám mây, ô tô thông minh và thiết bị gia dụng.
Baidu có kế hoạch tích hợp Ernie Bot trên tất cả hoạt động kinh doanh hiện có của mình, bắt đầu với công cụ tìm kiếm lớn nhất ở Trung Quốc. Baidu cho biết đã lên kế hoạch “định hình lại cách tạo và trình bày thông tin” trên công cụ tìm kiếm này.
Ernie Bot cũng sẽ được nhúng vào các dịch vụ khác như loa thông minh Xiaodu của Baidu, đơn vị xe tự lái Apollo và nền tảng video iQiyi.
Dù Baidu tuyên bố rằng Ernie có 260 tỉ tham số, so với 175 tỉ tham số của GPT-3, vẫn có những lo ngại rằng hiệu suất mô hình của Baidu có thể kém ấn tượng hơn so với GPT-4, một phần là do giới hạn thông tin trên các trang web tiếng Trung.
Một trong những thách thức lớn mà Baidu phải đối mặt là “lưu lượng truy cập ngày càng giảm” với hệ sinh thái của nó, vì rất nhiều thông tin trực tuyến ở Trung Quốc nằm trong các ứng dụng dành cho thiết bị di động và sẽ không được chia sẻ với công cụ AI của Baidu, theo một cựu nhà phát triển tại Nhóm Hệ sinh thái Di động Baidu.
Một lập trình viên sống tại thành phố Trùng Khánh (Trung Quốc), đang làm việc cho một công ty điện toán đám mây nước ngoài, nói: “Một generative AI cần kho dữ liệu khổng lồ để cải thiện hiệu suất của nó. Hầu hết nội dung ngày nay được tạo ra trên các ứng dụng di động do các hãng công nghệ lớn khác ở Trung Quốc kiểm soát chặt chẽ. Do đó, Baidu cần dựa vào việc thu thập dữ liệu để có quyền truy cập vào các nguồn dữ liệu này, nhưng các ứng dụng khiến quá trình khai thác dữ liệu này khó hơn so với các trang web”.
Generative AI là một loại trí tuệ nhân tạo mà máy tính được lập trình để tự động tạo ra nội dung mới, như văn bản, hình ảnh, âm thanh và video. Nó khác với các hệ thống AI khác như máy học sâu (deep learning) hoặc học máy (machine learning) trong việc dự đoán kết quả từ dữ liệu đã có sẵn. Thay vì dựa trên dữ liệu huấn luyện, hệ thống generative AI có khả năng tự tạo ra dữ liệu mới và phong phú hơn. Các ví dụ của generative AI bao gồm các mô hình ngôn ngữ tự động tạo văn bản, các hệ thống nhận dạng hình ảnh, video và âm thanh.
Vào tháng 2, Baidu đã công bố tham vọng của mình về dịch vụ giống ChatGPT trong bối cảnh cơn sốt AI được kích hoạt bởi sản phẩm OpenAI. Thời điểm đó, Lý Ngạn Hoành cho biết ông “rất vui mừng về những cơ hội xung quanh generative AI” sau khi báo cáo doanh thu giảm 1% vào năm 2022.
Baidu đã gấp rút chuẩn bị phát hành Ernie Bot đến mức các nhóm từ các bộ phận không phải AI đã được yêu cầu tham gia và trợ giúp dự án. Một số nhân viên Baidu nói rằng họ không có đủ thời gian để xây dựng một sản phẩm hoạt động tốt, tờ The Wall Street Journal đưa tin tuần trước.
Baidu không phải là công ty Trung Quốc duy nhất trong cuộc đua xây dựng generative AI, sử dụng thuật toán để tạo nội dung mới, bao gồm văn bản, âm thanh, hình ảnh, video và mô phỏng.
Alibaba và Tencent Holdings nằm trong số những hãng công nghệ Trung Quốc đã công bố kế hoạch cho các sản phẩm generative AI của riêng họ.