Hotline quảng cáo: 096 2445664 Hotline nội dung: 0934.999945

Baichuan tuyên bố vượt OpenAI, Anthropic bằng mô hình AI xử lý 350.000 ký tự tiếng Trung

Sơn Vân | 31/10/2023, 22:50

Baichuan vừa ra mắt một mô hình ngôn ngữ lớn Baichuan2-192k mà công ty cho biết có thể hấp thụ và tóm tắt tiểu thuyết. Theo Baichuan, Baichuan2-192k trở thành mô hình ngôn ngữ lớn mạnh mẽ nhất thế giới trong việc xử lý các truy vấn văn bản dài.

Baichuan là công ty khởi nghiệp trí tuệ nhân tạo (AI) có trụ sở tại thủ đô Bắc Kinh, được thành lập bởi Wang Xiaochuan - người sáng lập công cụ tìm kiếm Sogou (Trung Quốc).

Hôm 31.10, Baichuan đã công bố phiên bản mới nhất mô hình ngôn ngữ lớn Baichuan2-192k, cho biết “cửa sổ ngữ cảnh” của nó có thể xử lý khoảng 350.000 ký tự tiếng Trung.

Cửa sổ ngữ cảnh là sự kết hợp giữa văn bản đầu vào và đầu ra mà mô hình có thể xử lý trong quá trình hội thoại với người dùng.

Để so sánh, Claude 2 trước đó là mô hình ngôn ngữ lớn tiên tiến nhất thế giới xét về số lượng từ mà người dùng có thể đưa vào truy vấn trò chuyện của họ, được cho có cửa sổ ngữ cảnh khoảng 75.000 từ tiếng Anh, tương ứng với hàng trăm trang tài liệu hoặc một cuốn sách. Claude 2 được công ty Anthropic (Mỹ), do Amazon hậu thuẫn, giới thiệu vào tháng 7.

Theo bài đăng trên WeChat của Baichuan, cửa sổ ngữ cảnh của Baichuan2-192k lớn hơn 14 lần so với GPT-4 do OpenAI (Mỹ) phát triển.

Baichuan cũng cho biết Baichuan2-192k vượt qua Claude 2 về chất lượng phản hồi cũng như khả năng hiểu và tóm tắt văn bản dài, trích dẫn kết quả kiểm tra từ LongEval - dự án do Đại học California (Berkeley) và các tổ chức khác ở Mỹ khởi xướng để đánh giá mức độ mô hình ngôn ngữ lớn xử lý các yêu cầu lớn.

Baichuan tuyên bố cửa sổ ngữ cảnh lớn hơn sẽ giúp mô hình AI của công ty trở nên hữu ích cho các doanh nghiệp cần xử lý và tạo văn bản dài hàng ngày, chẳng hạn như ngành pháp lý, truyền thông và tài chính. Baichuan tiết lộ công ty đã bắt đầu thử nghiệm nội bộ Baichuan2-192k với các đối tác công nghiệp.

Tuy nhiên, nghiên cứu chung của các học giả từ Đại học Stanford và Đại học California (Berkeley) cho thấy khả năng xử lý nhiều thông tin hơn không hẳn làm cho một mô hình ngôn ngữ lớn tốt hơn so với các đối thủ khác.

baichuan2-192k-baichuan-tuyen-bo-vuot-openai-anthropic-bang-mo-hinh-ai-xu-ly-350-000-ky-tu-tieng-trung.jpg — Theo Baichuan, Baichuan2-192k là mô hình ngôn ngữ lớn mạnh mẽ nhất thế giới trong việc xử lý các truy vấn văn bản dài - Ảnh: Internet

Baichaun phải đối mặt với sự cạnh tranh ngày càng cao từ các đối thủ Trung Quốc đang chạy đua để thu hút người dùng đến với các mô hình và ứng dụng AI của họ.

Hôm 31.10, Alibaba Cloud (bộ phận đám mây của tập đoàn Alibaba) đã công bố bản cập nhật 2.0 cho mô hình Tongyi Qianwen, được đào tạo với hàng trăm tỉ thông số.

Chu Jingren, Giám đốc công nghệ Alibaba Cloud, nói tại sự kiện đối tác thường niên của công ty rằng Tongyi Qianwen 2.0 vượt trội hơn GPT-3.5 của OpenAI và Llama2 của Meta Platforms, đồng thời đã thu hẹp khoảng cách với GPT-4.

Trong khi đó, Zhipu AI, công ty khởi nghiệp được hỗ trợ bởi Alibaba và Tencent Holdings, tuần trước đã ra mắt mô hình ngôn ngữ lớn ChatGLM3 với nhiều cải tiến khác nhau, bao gồm tốc độ suy luận nhanh hơn, chi phí đào tạo thấp hơn và bổ sung trợ lý viết mã.

Zhipu AI cũng tung ra một phiên bản nhỏ hơn của ChatGLM3, được thiết kế để sử dụng trong các thiết bị điện tử cá nhân như laptop và smartphone.

Cách đây 1 tuần, iFlytek cho biết mô hình ngôn ngữ lớn Spark 3.0 của họ hiện đã vượt trội so với GPT-3.5 xét về ngữ cảnh tiếng Trung.

Là một trong những hãng công nghệ lớn đầu tiên ở Trung Quốc tung ra giải pháp thay thế ChatGPT, iFlytek ra mắt mô hình ngôn ngữ lớn Spark 3.0 lần đầu tiên vào tháng 5 và phát hành ra công chúng vào tháng 9 sau khi có sự chấp thuận của chính phủ Trung Quốc.

"Spark 3.0 đã vượt trội GPT-3.5 ở các khả năng như tạo văn bản, lý luận logic, toán học và mã hóa, đồng thời sẽ được đặt ngang hàng với GPT-4 vào nửa đầu năm 2024”, Chủ tịch iFlytek - Liu Qingfeng tuyên bố.

Spark 3.0 (phiên bản thứ tư kể từ lần phát hành đầu tiên) cũng đạt điểm gần bằng GPT-3.5 khi thực hiện 48 nhiệm vụ trong ngữ cảnh tiếng Anh, Liu Qingfeng cho biết.

Với việc ChatGPT và các chatbot AI đối thủ như Google Bard vẫn chưa chính thức có mặt ở Trung Quốc hay Hồng Kông, các hãng công nghệ lớn Trung Quốc đang nỗ lực phát triển đối thủ cạnh tranh để bắt kịp Mỹ.

Trước đó, gã khổng lồ tìm kiếm Baidu tiết lộ Ernie Bot 4, phiên bản cập nhật của sản phẩm giống ChatGPT ra mắt lần đầu tiên vào tháng 3, và cho biết nó mạnh mẽ như GPT-4.

Tuy nhiên, bất chấp những tiến bộ này, Chủ tịch iFlytek cho biết mô hình ngôn ngữ lớn trong nước vẫn có “khoảng cách thực sự” với GPT-4. Ông hy vọng sẽ thách thức mô hình ngôn ngữ lớn do OpenAI phát triển trong nửa đầu năm 2024.

Các hãng công nghệ và nhà sản xuất chip lớn của Trung Quốc đang vật lộn với những quy tắc xuất khẩu được cập nhật của Mỹ vào ngày 7.10, với những hạn chế mới ngăn nước này tiếp cận các chip tiên tiến hỗ trợ việc đào tạo các thuật toán AI - vốn là nền tảng của mô hình ngôn ngữ lớn.

Liu Qingfeng cho biết tất cả mã cho iFlytek Spark 3.0 đều được phát triển trên “nền tảng điện toán nội địa” và họ đang hợp tác với Huawei để đào tạo các phiên bản mô hình ngôn ngữ lớn trong tương lai dựa trên hệ sinh thái chip AI của gã khổng lồ viễn thông này.

Ngoài ra, iFlytek cũng đã công bố hàng chục mô hình ngôn ngữ lớn dành riêng cho ngành, trong đó có nhiều lĩnh vực như tài chính, ô tô, dịch vụ pháp lý và viễn thông.

Baichuan - “kỳ lân” mới của Trung Quốc

Baichuan gần đây thông báo đã huy động được hơn 300 triệu USD trong vòng Series A1 do các gã khổng lồ công nghệ Trung Quốc là Alibaba, Tencent Holdings và Xiaomi Corp dẫn đầu. Kể từ khi được thành lập vào tháng 4.2023 và qua ba vòng cấp vốn, Baichuan đã được định giá vượt quá 1 tỉ USD, nhanh chóng tham gia vào nhóm “kỳ lân” của Trung Quốc.

Baichuan là một trong những nhà phát triển AI hàng đầu ở Trung Quốc đang nghiên cứu về generative AI (AI tạo sinh) và các mô hình ngôn ngữ lớn, có khả năng cạnh tranh với Microsoft và OpenAI. Kể từ khi ra mắt, công ty đã nhanh chóng tung ra nhiều mô hình ngôn ngữ lớn, bao gồm bốn mô hình nguồn mở đã được tải xuống hơn 6 triệu lượt và hai mô hình độc quyền Baichuan-53B, Baichuan2-53B.

Trung Quốc đang tìm cách bắt kịp Mỹ trong thị trường AI, đặc biệt là với các công ty như OpenAI, Anthropic, Cohere. Một phần nguyên nhân khiến cuộc cạnh tranh trở nên khó khăn hơn là nhiều chip tiên tiến cần thiết để đào tạo và cung cấp thời gian chạy cho các mô hình AI mạnh mẽ bị Mỹ hạn chế xuất khẩu sang Trung Quốc.

Baichuan tự định vị mình là nhà phát triển mô hình ngôn ngữ lớn chuyên cung cấp các dịch vụ công nghệ thông qua giao diện lập trình ứng dụng, cho phép các công ty khác truy cập. Do đó, các công ty khởi nghiệp Trung Quốc muốn tạo chatbot AI bằng giao diện văn bản có thể sử dụng mô hình từ Baichuan rồi tinh chỉnh ở quy mô lớn bằng cách truyền dữ liệu qua hệ thống và nhận đầu ra.

Bài liên quan

Trung Quốc đề xuất danh sách đen dữ liệu đào tạo các mô hình generative AI

Trung Quốc đã công bố các yêu cầu bảo mật được đề xuất với những công ty cung cấp dịch vụ generative AI (trí tuệ nhân tạo tạo sinh), bao gồm cả danh sách đen các nguồn không được sử dụng để đào tạo các mô hình AI.

Đọc tiếp

Bên trong kế hoạch lớn của Apple nhằm đưa generative AI vào tất cả các thiết bị

Các công ty Trung Quốc tranh mua chip AI Nvidia do lệnh cấm từ Mỹ làm giảm nguồn cung

(0) Bình luận

Xếp theo:

Đọc thêm Nhịp đập khoa học

Nổi bật Một thế giới

Cơ hội vàng đưa Việt Nam trở thành trung tâm công nghệ

2 giờ trước Khoa học - công nghệ

Theo Thủ tướng Phạm Minh Chính, Việt Nam coi AI và bán dẫn chính là cơ hội vàng giúp đất nước ta thu hút những nguồn lực lớn về tri thức, đầu tư, đưa Việt Nam trở thành một trung tâm, một điểm đến công nghệ của khu vực và thế giới.

AI và công nghệ bán dẫn cần song hành với yếu tố bền vững

Theo ông Lợi Nguyễn (Phó chủ tịch Marvell), sự phát triển của AI và công nghệ bán dẫn cần phải...
Giám đốc ĐHQG TP.HCM: Nhân lực là chìa khóa để tự chủ công nghệ

Ngày 14.3, Đại học Quốc gia TP.HCM (ĐHQG TP.HCM) phối hợp cùng Tập đoàn CT Group tổ chức hội...
Giá vàng thế giới cao kỷ lục

Hãng Reuters đưa tin giá vàng thế giới trong phiên giao dịch ngày 14.3 đạt mức cao nhất mọi...

Đừng bỏ lỡ

Từ 1.4, BHXH khu vực II hoạt động với cơ cấu tổ chức ra sao?

16 phút trước Theo dòng thời sự

Ngày 14.3, Bảo hiểm xã hội (BHXH) TP.HCM có thông báo về thực hiện chức năng, nhiệm vụ theo cơ cấu tổ chức mới từ ngày 1.4.2025.
Ông Đỗ Anh Tuấn gia nhập CLB tỉ phú USD sau chuỗi ngày cổ phiếu thăng hoa

một giờ trước Thông tin doanh nghiệp

Cổ phiếu Sunshine Homes (Upcom: SSH) và Tập đoàn Sunshine (HNX: KSF) tăng trần nhiều phiên liên tiếp giúp ông Đỗ Anh Tuấn gia nhập nhóm tỉ phú USD tại Việt Nam, tổng tài sản tăng hơn 12.000 tỉ đồng vượt hơn 37.000 tỉ đồng.
Danh ca Phương Dung muốn tìm truyền nhân cho dòng nhạc Bolero

một giờ trước Văn hóa

Danh ca Phương Dung cho biết bà đang muốn tìm truyền nhân cho dòng nhạc Bolero nhưng vẫn còn đang gặp khó khăn trong việc chọn người kế thừa.
Rượu là thủ phạm khiến tuổi thọ người Nga suy giảm

1 giờ trước Quốc tế

Theo các chuyên gia, tuổi thọ trung bình ở Nga đang suy giảm nghiêm trọng vì họ tiêu thụ rượu mạnh tràn lan.
‘Át chủ bài’ của ông Trump có đủ sức khiến Nga nhượng bộ?

1 giờ trước Quốc tế

Tổng thống Donald Trump hôm 13.3 tuyên bố rằng Mỹ có thể áp dụng các biện pháp kinh tế "tàn phá" đối với Nga, buộc Moscow phải chấp nhận một thỏa thuận hòa bình với Ukraine, theo Newsweek.

Mới nhất

AI và công nghệ bán dẫn cần song hành với yếu tố bền vững

2 phút trước Khoa học - công nghệ

Theo ông Lợi Nguyễn (Phó chủ tịch Marvell), sự phát triển của AI và công nghệ bán dẫn cần phải song hành với yếu tố bền vững.
Giám đốc ĐHQG TP.HCM: Nhân lực là chìa khóa để tự chủ công nghệ

38 phút trước Khoa học - công nghệ

Ngày 14.3, Đại học Quốc gia TP.HCM (ĐHQG TP.HCM) phối hợp cùng Tập đoàn CT Group tổ chức hội thảo "Công nghệ đóng gói, kiểm thử tiên tiến: Cơ hội cho Việt Nam".
Cơ hội vàng đưa Việt Nam trở thành trung tâm công nghệ

2 giờ trước Khoa học - công nghệ

Theo Thủ tướng Phạm Minh Chính, Việt Nam coi AI và bán dẫn chính là cơ hội vàng giúp đất nước ta thu hút những nguồn lực lớn về tri thức, đầu tư, đưa Việt Nam trở thành một trung tâm, một điểm đến công nghệ của khu vực và thế giới.
Giá vàng thế giới cao kỷ lục

3 giờ trước Chuyển động

Hãng Reuters đưa tin giá vàng thế giới trong phiên giao dịch ngày 14.3 đạt mức cao nhất mọi thời đại do sự bất ổn về thuế quan của Mỹ, căng thẳng thương mại và kỳ vọng Cục Dự trữ liên bang Mỹ (Fed) nới lỏng chính sách tiền tệ ngày càng tăng.
Khám phá “bản thể” của “sáng tạo ẩm thực”

3 giờ trước Văn hóa

Khi khởi tạo ý tưởng mới, đầu bếp đang viết tiếp câu chuyện của dòng chảy văn hóa ẩm thực, đồng thời gieo mầm cho những món ăn độc đáo mang tinh thần thời đại.

Xem thêm

Cơ quan chủ quản: Hội Thông tin Khoa học và Công nghệ Việt Nam.

ĐC: 24 Lý Thường Kiệt, Hàng Bài, Hoàn Kiếm, Hà Nội.

ĐT: 024.38256203

Hotline nội dung : 0934999945

Tổng biên tập: Hoàng Đại Thanh

Tổng Thư ký Tòa soạn: Nguyễn Đình Mười

Giấy phép số 77/GP-BTTTT do Bộ Thông tin và Truyền thông cấp ngày 26 tháng 2 năm 2020.

Tòa nhà SIMCO Sông Đà, Tiểu KĐT mới Vạn Phúc, Phường Vạn Phúc, Quận Hà Đông, TP. Hà Nội

ĐT: 0984708866

TPHCM: 345/134 Trần Hưng Đạo, phường Cầu Kho, Quận 1

ĐT: 028.38389241

Email: toasoan@1thegioi.vn

Hotline quảng cáo: 096 2445664

Email quảng cáo: sales@1thegioi.vn

Báo giá quảng cáo:

Công ty Cổ phần Truyền thông Một Thế Giới

Baichuan tuyên bố vượt OpenAI, Anthropic bằng mô hình AI xử lý 350.000 ký tự tiếng Trung

Trung Quốc đề xuất danh sách đen dữ liệu đào tạo các mô hình generative AI

Baichuan

OpenAI

Anthropic

mô hình AI

Baichuan2-192k

Claude 2

GPT-4

Zhipu AI

ChatGLM3

Bên trong kế hoạch lớn của Apple nhằm đưa generative AI vào tất cả các thiết bị

Các công ty Trung Quốc tranh mua chip AI Nvidia do lệnh cấm từ Mỹ làm giảm nguồn cung

Bên trong kế hoạch lớn của Apple nhằm đưa generative AI vào tất cả các thiết bị

Các công ty Trung Quốc tranh mua chip AI Nvidia do lệnh cấm từ Mỹ làm giảm nguồn cung

Công nghệ thông minh 5G đảm nhận việc nặng nhọc cho nhiều nông dân Nhật lớn tuổi

Công trình xanh ở Việt Nam: Khó nhất là 'bắc cầu' giải pháp kỹ thuật sang giải pháp tài chính

Lý do lãnh đạo và nhân viên OpenAI từng đánh giá thấp ChatGPT

Tiền Giang: Sầu riêng sốt giá, nhà vườn tích cực 'xử lý' cho cây ra hoa quả trái vụ

Pin mặt trời mới sử dụng perovskite mang đến bước đột phá về năng lượng tái tạo

Trang bị kiến thức xanh cho sinh viên để đạt mục tiêu Net-Zero năm 2050

Cơ hội vàng đưa Việt Nam trở thành trung tâm công nghệ

AI và công nghệ bán dẫn cần song hành với yếu tố bền vững

Giám đốc ĐHQG TP.HCM: Nhân lực là chìa khóa để tự chủ công nghệ

Giá vàng thế giới cao kỷ lục

Từ 1.4, BHXH khu vực II hoạt động với cơ cấu tổ chức ra sao?

Ông Đỗ Anh Tuấn gia nhập CLB tỉ phú USD sau chuỗi ngày cổ phiếu thăng hoa

Danh ca Phương Dung muốn tìm truyền nhân cho dòng nhạc Bolero

Rượu là thủ phạm khiến tuổi thọ người Nga suy giảm

‘Át chủ bài’ của ông Trump có đủ sức khiến Nga nhượng bộ?

AI và công nghệ bán dẫn cần song hành với yếu tố bền vững

Giám đốc ĐHQG TP.HCM: Nhân lực là chìa khóa để tự chủ công nghệ

Cơ hội vàng đưa Việt Nam trở thành trung tâm công nghệ

Giá vàng thế giới cao kỷ lục

Khám phá “bản thể” của “sáng tạo ẩm thực”

Người dân TP.Cao Lãnh vui mừng vì đường Phạm Hữu Lầu được mở rộng

Google Gemini thu thập nhiều dữ liệu cá nhân của người dùng hơn cả DeepSeek và ChatGPT

Đằng sau việc Apple ra mắt iPhone 6e và hàng loạt sản phẩm mới trong 2 tuần qua

Ông Trump nói gì với giới tinh hoa ngành tiền điện tử trong hội nghị thượng đỉnh ở Nhà Trắng?

Apple chuẩn bị đại tu phần mềm cho iPhone, iPad và Mac đi kèm với rủi ro