Baichuan vừa ra mắt một mô hình ngôn ngữ lớn Baichuan2-192k mà công ty cho biết có thể hấp thụ và tóm tắt tiểu thuyết. Theo Baichuan, Baichuan2-192k trở thành mô hình ngôn ngữ lớn mạnh mẽ nhất thế giới trong việc xử lý các truy vấn văn bản dài.

Baichuan tuyên bố vượt OpenAI, Anthropic bằng mô hình AI xử lý 350.000 ký tự tiếng Trung

Sơn Vân | 31/10/2023, 22:50

Baichuan vừa ra mắt một mô hình ngôn ngữ lớn Baichuan2-192k mà công ty cho biết có thể hấp thụ và tóm tắt tiểu thuyết. Theo Baichuan, Baichuan2-192k trở thành mô hình ngôn ngữ lớn mạnh mẽ nhất thế giới trong việc xử lý các truy vấn văn bản dài.

Baichuan là công ty khởi nghiệp trí tuệ nhân tạo (AI) có trụ sở tại thủ đô Bắc Kinh, được thành lập bởi Wang Xiaochuan - người sáng lập công cụ tìm kiếm Sogou (Trung Quốc).

Hôm 31.10, Baichuan đã công bố phiên bản mới nhất mô hình ngôn ngữ lớn Baichuan2-192k, cho biết “cửa sổ ngữ cảnh” của nó có thể xử lý khoảng 350.000 ký tự tiếng Trung.

Cửa sổ ngữ cảnh là sự kết hợp giữa văn bản đầu vào và đầu ra mà mô hình có thể xử lý trong quá trình hội thoại với người dùng.

Để so sánh, Claude 2 trước đó là mô hình ngôn ngữ lớn tiên tiến nhất thế giới xét về số lượng từ mà người dùng có thể đưa vào truy vấn trò chuyện của họ, được cho có cửa sổ ngữ cảnh khoảng 75.000 từ tiếng Anh, tương ứng với hàng trăm trang tài liệu hoặc một cuốn sách. Claude 2 được công ty Anthropic (Mỹ), do Amazon hậu thuẫn, giới thiệu vào tháng 7.

Theo bài đăng trên WeChat của Baichuan, cửa sổ ngữ cảnh của Baichuan2-192k lớn hơn 14 lần so với GPT-4 do OpenAI (Mỹ) phát triển.

Baichuan cũng cho biết Baichuan2-192k vượt qua Claude 2 về chất lượng phản hồi cũng như khả năng hiểu và tóm tắt văn bản dài, trích dẫn kết quả kiểm tra từ LongEval - dự án do Đại học California (Berkeley) và các tổ chức khác ở Mỹ khởi xướng để đánh giá mức độ mô hình ngôn ngữ lớn xử lý các yêu cầu lớn.

Baichuan tuyên bố cửa sổ ngữ cảnh lớn hơn sẽ giúp mô hình AI của công ty trở nên hữu ích cho các doanh nghiệp cần xử lý và tạo văn bản dài hàng ngày, chẳng hạn như ngành pháp lý, truyền thông và tài chính. Baichuan tiết lộ công ty đã bắt đầu thử nghiệm nội bộ Baichuan2-192k với các đối tác công nghiệp.

Tuy nhiên, nghiên cứu chung của các học giả từ Đại học Stanford và Đại học California (Berkeley) cho thấy khả năng xử lý nhiều thông tin hơn không hẳn làm cho một mô hình ngôn ngữ lớn tốt hơn so với các đối thủ khác.

baichuan2-192k-baichuan-tuyen-bo-vuot-openai-anthropic-bang-mo-hinh-ai-xu-ly-350-000-ky-tu-tieng-trung.jpg
Theo Baichuan, Baichuan2-192k là mô hình ngôn ngữ lớn mạnh mẽ nhất thế giới trong việc xử lý các truy vấn văn bản dài - Ảnh: Internet

Baichaun phải đối mặt với sự cạnh tranh ngày càng cao từ các đối thủ Trung Quốc đang chạy đua để thu hút người dùng đến với các mô hình và ứng dụng AI của họ.

Hôm 31.10, Alibaba Cloud (bộ phận đám mây của tập đoàn Alibaba) đã công bố bản cập nhật 2.0 cho mô hình Tongyi Qianwen, được đào tạo với hàng trăm tỉ thông số.

Chu Jingren, Giám đốc công nghệ Alibaba Cloud, nói tại sự kiện đối tác thường niên của công ty rằng Tongyi Qianwen 2.0 vượt trội hơn GPT-3.5 của OpenAI và Llama2 của Meta Platforms, đồng thời đã thu hẹp khoảng cách với GPT-4.

Trong khi đó, Zhipu AI, công ty khởi nghiệp được hỗ trợ bởi Alibaba và Tencent Holdings, tuần trước đã ra mắt mô hình ngôn ngữ lớn ChatGLM3 với nhiều cải tiến khác nhau, bao gồm tốc độ suy luận nhanh hơn, chi phí đào tạo thấp hơn và bổ sung trợ lý viết mã.

Zhipu AI cũng tung ra một phiên bản nhỏ hơn của ChatGLM3, được thiết kế để sử dụng trong các thiết bị điện tử cá nhân như laptop và smartphone.

Cách đây 1 tuần, iFlytek cho biết mô hình ngôn ngữ lớn Spark 3.0 của họ hiện đã vượt trội so với GPT-3.5 xét về ngữ cảnh tiếng Trung.

Là một trong những hãng công nghệ lớn đầu tiên ở Trung Quốc tung ra giải pháp thay thế ChatGPT, iFlytek ra mắt mô hình ngôn ngữ lớn Spark 3.0 lần đầu tiên vào tháng 5 và phát hành ra công chúng vào tháng 9 sau khi có sự chấp thuận của chính phủ Trung Quốc.

"Spark 3.0 đã vượt trội GPT-3.5 ở các khả năng như tạo văn bản, lý luận logic, toán học và mã hóa, đồng thời sẽ được đặt ngang hàng với GPT-4 vào nửa đầu năm 2024”, Chủ tịch iFlytek - Liu Qingfeng tuyên bố.

Spark 3.0 (phiên bản thứ tư kể từ lần phát hành đầu tiên) cũng đạt điểm gần bằng GPT-3.5 khi thực hiện 48 nhiệm vụ trong ngữ cảnh tiếng Anh, Liu Qingfeng cho biết.

Với việc ChatGPT và các chatbot AI đối thủ như Google Bard vẫn chưa chính thức có mặt ở Trung Quốc hay Hồng Kông, các hãng công nghệ lớn Trung Quốc đang nỗ lực phát triển đối thủ cạnh tranh để bắt kịp Mỹ.

Trước đó, gã khổng lồ tìm kiếm Baidu tiết lộ Ernie Bot 4, phiên bản cập nhật của sản phẩm giống ChatGPT ra mắt lần đầu tiên vào tháng 3, và cho biết nó mạnh mẽ như GPT-4.

Tuy nhiên, bất chấp những tiến bộ này, Chủ tịch iFlytek cho biết mô hình ngôn ngữ lớn trong nước vẫn có “khoảng cách thực sự” với GPT-4. Ông hy vọng sẽ thách thức mô hình ngôn ngữ lớn do OpenAI phát triển trong nửa đầu năm 2024.

Các hãng công nghệ và nhà sản xuất chip lớn của Trung Quốc đang vật lộn với những quy tắc xuất khẩu được cập nhật của Mỹ vào ngày 7.10, với những hạn chế mới ngăn nước này tiếp cận các chip tiên tiến hỗ trợ việc đào tạo các thuật toán AI - vốn là nền tảng của mô hình ngôn ngữ lớn.

Liu Qingfeng cho biết tất cả mã cho iFlytek Spark 3.0 đều được phát triển trên “nền tảng điện toán nội địa” và họ đang hợp tác với Huawei để đào tạo các phiên bản mô hình ngôn ngữ lớn trong tương lai dựa trên hệ sinh thái chip AI của gã khổng lồ viễn thông này.

Ngoài ra, iFlytek cũng đã công bố hàng chục mô hình ngôn ngữ lớn dành riêng cho ngành, trong đó có nhiều lĩnh vực như tài chính, ô tô, dịch vụ pháp lý và viễn thông.

Baichuan - “kỳ lân” mới của Trung Quốc

Baichuan gần đây thông báo đã huy động được hơn 300 triệu USD trong vòng Series A1 do các gã khổng lồ công nghệ Trung Quốc là Alibaba, Tencent Holdings và Xiaomi Corp dẫn đầu. Kể từ khi được thành lập vào tháng 4.2023 và qua ba vòng cấp vốn, Baichuan đã được định giá vượt quá 1 tỉ USD, nhanh chóng tham gia vào nhóm “kỳ lân” của Trung Quốc.

Baichuan là một trong những nhà phát triển AI hàng đầu ở Trung Quốc đang nghiên cứu về generative AI (AI tạo sinh) và các mô hình ngôn ngữ lớn, có khả năng cạnh tranh với Microsoft và OpenAI. Kể từ khi ra mắt, công ty đã nhanh chóng tung ra nhiều mô hình ngôn ngữ lớn, bao gồm bốn mô hình nguồn mở đã được tải xuống hơn 6 triệu lượt và hai mô hình độc quyền Baichuan-53B, Baichuan2-53B.

Trung Quốc đang tìm cách bắt kịp Mỹ trong thị trường AI, đặc biệt là với các công ty như OpenAI, Anthropic, Cohere. Một phần nguyên nhân khiến cuộc cạnh tranh trở nên khó khăn hơn là nhiều chip tiên tiến cần thiết để đào tạo và cung cấp thời gian chạy cho các mô hình AI mạnh mẽ bị Mỹ hạn chế xuất khẩu sang Trung Quốc.

Baichuan tự định vị mình là nhà phát triển mô hình ngôn ngữ lớn chuyên cung cấp các dịch vụ công nghệ thông qua giao diện lập trình ứng dụng, cho phép các công ty khác truy cập. Do đó, các công ty khởi nghiệp Trung Quốc muốn tạo chatbot AI bằng giao diện văn bản có thể sử dụng mô hình từ Baichuan rồi tinh chỉnh ở quy mô lớn bằng cách truyền dữ liệu qua hệ thống và nhận đầu ra.

Bài liên quan
Trung Quốc đề xuất danh sách đen dữ liệu đào tạo các mô hình generative AI
Trung Quốc đã công bố các yêu cầu bảo mật được đề xuất với những công ty cung cấp dịch vụ generative AI (trí tuệ nhân tạo tạo sinh), bao gồm cả danh sách đen các nguồn không được sử dụng để đào tạo các mô hình AI.

(0) Bình luận
Nổi bật Một thế giới
Kinh tế-xã hội những năm gần đây và triển vọng trong năm nay - Bài 5: Thách thức và triển vọng
Bước vào năm 2024, nền kinh tế Việt Nam đứng trước những thách thức lớn buộc phải quan tâm, đó là: thuế tối thiểu toàn cầu, thuế môi trường và nguồn năng lượng.
Đừng bỏ lỡ
Mới nhất
POWERED BY ONECMS - A PRODUCT OF NEKO
Baichuan tuyên bố vượt OpenAI, Anthropic bằng mô hình AI xử lý 350.000 ký tự tiếng Trung