Hotline quảng cáo: 096 2445664 Hotline nội dung: 0934.999945

Baichuan tuyên bố vượt OpenAI, Anthropic bằng mô hình AI xử lý 350.000 ký tự tiếng Trung

Sơn Vân | 31/10/2023, 22:50

Baichuan vừa ra mắt một mô hình ngôn ngữ lớn Baichuan2-192k mà công ty cho biết có thể hấp thụ và tóm tắt tiểu thuyết. Theo Baichuan, Baichuan2-192k trở thành mô hình ngôn ngữ lớn mạnh mẽ nhất thế giới trong việc xử lý các truy vấn văn bản dài.

Baichuan là công ty khởi nghiệp trí tuệ nhân tạo (AI) có trụ sở tại thủ đô Bắc Kinh, được thành lập bởi Wang Xiaochuan - người sáng lập công cụ tìm kiếm Sogou (Trung Quốc).

Hôm 31.10, Baichuan đã công bố phiên bản mới nhất mô hình ngôn ngữ lớn Baichuan2-192k, cho biết “cửa sổ ngữ cảnh” của nó có thể xử lý khoảng 350.000 ký tự tiếng Trung.

Cửa sổ ngữ cảnh là sự kết hợp giữa văn bản đầu vào và đầu ra mà mô hình có thể xử lý trong quá trình hội thoại với người dùng.

Để so sánh, Claude 2 trước đó là mô hình ngôn ngữ lớn tiên tiến nhất thế giới xét về số lượng từ mà người dùng có thể đưa vào truy vấn trò chuyện của họ, được cho có cửa sổ ngữ cảnh khoảng 75.000 từ tiếng Anh, tương ứng với hàng trăm trang tài liệu hoặc một cuốn sách. Claude 2 được công ty Anthropic (Mỹ), do Amazon hậu thuẫn, giới thiệu vào tháng 7.

Theo bài đăng trên WeChat của Baichuan, cửa sổ ngữ cảnh của Baichuan2-192k lớn hơn 14 lần so với GPT-4 do OpenAI (Mỹ) phát triển.

Baichuan cũng cho biết Baichuan2-192k vượt qua Claude 2 về chất lượng phản hồi cũng như khả năng hiểu và tóm tắt văn bản dài, trích dẫn kết quả kiểm tra từ LongEval - dự án do Đại học California (Berkeley) và các tổ chức khác ở Mỹ khởi xướng để đánh giá mức độ mô hình ngôn ngữ lớn xử lý các yêu cầu lớn.

Baichuan tuyên bố cửa sổ ngữ cảnh lớn hơn sẽ giúp mô hình AI của công ty trở nên hữu ích cho các doanh nghiệp cần xử lý và tạo văn bản dài hàng ngày, chẳng hạn như ngành pháp lý, truyền thông và tài chính. Baichuan tiết lộ công ty đã bắt đầu thử nghiệm nội bộ Baichuan2-192k với các đối tác công nghiệp.

Tuy nhiên, nghiên cứu chung của các học giả từ Đại học Stanford và Đại học California (Berkeley) cho thấy khả năng xử lý nhiều thông tin hơn không hẳn làm cho một mô hình ngôn ngữ lớn tốt hơn so với các đối thủ khác.

baichuan2-192k-baichuan-tuyen-bo-vuot-openai-anthropic-bang-mo-hinh-ai-xu-ly-350-000-ky-tu-tieng-trung.jpg — Theo Baichuan, Baichuan2-192k là mô hình ngôn ngữ lớn mạnh mẽ nhất thế giới trong việc xử lý các truy vấn văn bản dài - Ảnh: Internet

Baichaun phải đối mặt với sự cạnh tranh ngày càng cao từ các đối thủ Trung Quốc đang chạy đua để thu hút người dùng đến với các mô hình và ứng dụng AI của họ.

Hôm 31.10, Alibaba Cloud (bộ phận đám mây của tập đoàn Alibaba) đã công bố bản cập nhật 2.0 cho mô hình Tongyi Qianwen, được đào tạo với hàng trăm tỉ thông số.

Chu Jingren, Giám đốc công nghệ Alibaba Cloud, nói tại sự kiện đối tác thường niên của công ty rằng Tongyi Qianwen 2.0 vượt trội hơn GPT-3.5 của OpenAI và Llama2 của Meta Platforms, đồng thời đã thu hẹp khoảng cách với GPT-4.

Trong khi đó, Zhipu AI, công ty khởi nghiệp được hỗ trợ bởi Alibaba và Tencent Holdings, tuần trước đã ra mắt mô hình ngôn ngữ lớn ChatGLM3 với nhiều cải tiến khác nhau, bao gồm tốc độ suy luận nhanh hơn, chi phí đào tạo thấp hơn và bổ sung trợ lý viết mã.

Zhipu AI cũng tung ra một phiên bản nhỏ hơn của ChatGLM3, được thiết kế để sử dụng trong các thiết bị điện tử cá nhân như laptop và smartphone.

Cách đây 1 tuần, iFlytek cho biết mô hình ngôn ngữ lớn Spark 3.0 của họ hiện đã vượt trội so với GPT-3.5 xét về ngữ cảnh tiếng Trung.

Là một trong những hãng công nghệ lớn đầu tiên ở Trung Quốc tung ra giải pháp thay thế ChatGPT, iFlytek ra mắt mô hình ngôn ngữ lớn Spark 3.0 lần đầu tiên vào tháng 5 và phát hành ra công chúng vào tháng 9 sau khi có sự chấp thuận của chính phủ Trung Quốc.

"Spark 3.0 đã vượt trội GPT-3.5 ở các khả năng như tạo văn bản, lý luận logic, toán học và mã hóa, đồng thời sẽ được đặt ngang hàng với GPT-4 vào nửa đầu năm 2024”, Chủ tịch iFlytek - Liu Qingfeng tuyên bố.

Spark 3.0 (phiên bản thứ tư kể từ lần phát hành đầu tiên) cũng đạt điểm gần bằng GPT-3.5 khi thực hiện 48 nhiệm vụ trong ngữ cảnh tiếng Anh, Liu Qingfeng cho biết.

Với việc ChatGPT và các chatbot AI đối thủ như Google Bard vẫn chưa chính thức có mặt ở Trung Quốc hay Hồng Kông, các hãng công nghệ lớn Trung Quốc đang nỗ lực phát triển đối thủ cạnh tranh để bắt kịp Mỹ.

Trước đó, gã khổng lồ tìm kiếm Baidu tiết lộ Ernie Bot 4, phiên bản cập nhật của sản phẩm giống ChatGPT ra mắt lần đầu tiên vào tháng 3, và cho biết nó mạnh mẽ như GPT-4.

Tuy nhiên, bất chấp những tiến bộ này, Chủ tịch iFlytek cho biết mô hình ngôn ngữ lớn trong nước vẫn có “khoảng cách thực sự” với GPT-4. Ông hy vọng sẽ thách thức mô hình ngôn ngữ lớn do OpenAI phát triển trong nửa đầu năm 2024.

Các hãng công nghệ và nhà sản xuất chip lớn của Trung Quốc đang vật lộn với những quy tắc xuất khẩu được cập nhật của Mỹ vào ngày 7.10, với những hạn chế mới ngăn nước này tiếp cận các chip tiên tiến hỗ trợ việc đào tạo các thuật toán AI - vốn là nền tảng của mô hình ngôn ngữ lớn.

Liu Qingfeng cho biết tất cả mã cho iFlytek Spark 3.0 đều được phát triển trên “nền tảng điện toán nội địa” và họ đang hợp tác với Huawei để đào tạo các phiên bản mô hình ngôn ngữ lớn trong tương lai dựa trên hệ sinh thái chip AI của gã khổng lồ viễn thông này.

Ngoài ra, iFlytek cũng đã công bố hàng chục mô hình ngôn ngữ lớn dành riêng cho ngành, trong đó có nhiều lĩnh vực như tài chính, ô tô, dịch vụ pháp lý và viễn thông.

Baichuan - “kỳ lân” mới của Trung Quốc

Baichuan gần đây thông báo đã huy động được hơn 300 triệu USD trong vòng Series A1 do các gã khổng lồ công nghệ Trung Quốc là Alibaba, Tencent Holdings và Xiaomi Corp dẫn đầu. Kể từ khi được thành lập vào tháng 4.2023 và qua ba vòng cấp vốn, Baichuan đã được định giá vượt quá 1 tỉ USD, nhanh chóng tham gia vào nhóm “kỳ lân” của Trung Quốc.

Baichuan là một trong những nhà phát triển AI hàng đầu ở Trung Quốc đang nghiên cứu về generative AI (AI tạo sinh) và các mô hình ngôn ngữ lớn, có khả năng cạnh tranh với Microsoft và OpenAI. Kể từ khi ra mắt, công ty đã nhanh chóng tung ra nhiều mô hình ngôn ngữ lớn, bao gồm bốn mô hình nguồn mở đã được tải xuống hơn 6 triệu lượt và hai mô hình độc quyền Baichuan-53B, Baichuan2-53B.

Trung Quốc đang tìm cách bắt kịp Mỹ trong thị trường AI, đặc biệt là với các công ty như OpenAI, Anthropic, Cohere. Một phần nguyên nhân khiến cuộc cạnh tranh trở nên khó khăn hơn là nhiều chip tiên tiến cần thiết để đào tạo và cung cấp thời gian chạy cho các mô hình AI mạnh mẽ bị Mỹ hạn chế xuất khẩu sang Trung Quốc.

Baichuan tự định vị mình là nhà phát triển mô hình ngôn ngữ lớn chuyên cung cấp các dịch vụ công nghệ thông qua giao diện lập trình ứng dụng, cho phép các công ty khác truy cập. Do đó, các công ty khởi nghiệp Trung Quốc muốn tạo chatbot AI bằng giao diện văn bản có thể sử dụng mô hình từ Baichuan rồi tinh chỉnh ở quy mô lớn bằng cách truyền dữ liệu qua hệ thống và nhận đầu ra.

Bài liên quan

Trung Quốc đề xuất danh sách đen dữ liệu đào tạo các mô hình generative AI

Trung Quốc đã công bố các yêu cầu bảo mật được đề xuất với những công ty cung cấp dịch vụ generative AI (trí tuệ nhân tạo tạo sinh), bao gồm cả danh sách đen các nguồn không được sử dụng để đào tạo các mô hình AI.

Đọc tiếp

Bên trong kế hoạch lớn của Apple nhằm đưa generative AI vào tất cả các thiết bị

Các công ty Trung Quốc tranh mua chip AI Nvidia do lệnh cấm từ Mỹ làm giảm nguồn cung

(0) Bình luận

Xếp theo:

Đọc thêm Nhịp đập khoa học

Nổi bật Một thế giới

Thủ tướng: Mạnh dạn giao việc khó cho kinh tế tư nhân

2 giờ trước Thị trường và chính sách

Thủ tướng yêu cầu phải tin tưởng vào kinh tế tư nhân, mạnh dạn, tin tưởng giao việc khó cho thành phần kinh tế tư nhân; có cơ chế giao kinh tế tư nhân tham gia phát triển, hiện đại hóa công nghiệp quốc phòng, an ninh.

Cơn lốc plasma và UFO kỳ lạ: Mặt trời bất ngờ hé lộ hiện tượng chưa từng thấy

Một video mới được Cơ quan vũ trụ châu Âu (ESA) công bố đang thu hút sự chú ý của giới khoa...
Nghị định 75: Kỳ vọng tháo gỡ vướng mắc cho nhiều dự án

Chuyên gia cho rằng Nghị định 75 ban hành kịp thời, kỳ vọng sẽ tháo gỡ được vướng mắc cho các...
AI cho cộng đồng: Tạo nền tảng vững chắc để phát triển kỹ năng số

Việc nâng cao hiểu biết về AI cho toàn dân sẽ giúp Việt Nam nhanh chóng thích ứng với những...

Đừng bỏ lỡ

Thủ tướng đề nghị Tập đoàn Standard Chartered hỗ trợ xây dựng trung tâm tài chính

2 giờ trước Tài chính và đầu tư

Tối 2.4, tiếp ông Bill Winters, Tổng giám đốc Tập đoàn Standard Chartered, Thủ tướng Chính phủ Phạm Minh Chính đề nghị tập đoàn hỗ trợ Việt Nam xây dựng các trung tâm tài chính quốc tế.
Dự án vận chuyển hàng hóa bằng tên lửa siêu thanh SpaceX khiến các loài chim biển Thái Bình Dương lâm nguy

3 giờ trước Nhịp đập khoa học

Dự án do SpaceX của Elon Musk và Không quân Mỹ đề xuất nhằm thử nghiệm vận chuyển hàng hóa bằng tên lửa siêu thanh từ Đảo san hô Johnston hẻo lánh ở Thái Bình Dương có thể gây hại cho nhiều loài chim biển làm tổ tại khu bảo tồn thiên nhiên.
Hệ thống giao dịch chứng khoán mới KRX sẽ vận hành từ ngày 5.5

4 giờ trước Kinh tế - đầu tư - dự án

HoSE chia sẻ hệ thống công nghệ thông tin cho thị trường chứng khoán Việt Nam có thể sẽ vận hành chính thức vào ngày 5.5 và trùng với ngày hiệu lực áp dụng của chỉ số kỳ tháng 4.
BIDV góp phần mở rộng, tăng cường sự tham gia của phụ nữ trong nền kinh tế

4 giờ trước Thông tin và phát triển

Trong Diễn đàn thường niên lần thứ 5 về “Mở rộng sự tham gia của phụ nữ trong nền kinh tế” do Ngân hàng Phát triển châu Á (ADB) tổ chức tại Nhật Bản vào cuối tháng 3 vừa qua, đại diện BIDV cùng các chuyên gia đã trao đổi, chia sẻ nhiều kinh nghiệm để xây dựng hệ sinh thái vững mạnh và tăng cường đầu tư cho các doanh nghiệp siêu nhỏ, doanh nghiệp nhỏ và vừa do phụ nữ làm chủ.
TP.HCM: Xây dựng trung tâm đột quỵ tại Bệnh viện đa khoa khu vực Hóc Môn

4 giờ trước Thông tin Y học

Thông qua sự hỗ trợ toàn diện của Bệnh viện Nhân dân 115, Bệnh viện đa khoa khu vực Hóc Môn (TP.HCM) sẽ xây dựng trung tâm điều trị đột quỵ chuyên sâu với cơ sở hạ tầng và trang thiết bị hiện đại.

Mới nhất

Thủ tướng: Mạnh dạn giao việc khó cho kinh tế tư nhân

2 giờ trước Thị trường và chính sách

Thủ tướng yêu cầu phải tin tưởng vào kinh tế tư nhân, mạnh dạn, tin tưởng giao việc khó cho thành phần kinh tế tư nhân; có cơ chế giao kinh tế tư nhân tham gia phát triển, hiện đại hóa công nghiệp quốc phòng, an ninh.
Microsoft sẽ kiếm bộn tiền nhờ trào lưu tạo ảnh Ghibli bằng ChatGPT gây bão internet

6 giờ trước Thế giới số

Một xu hướng trí tuệ nhân tạo (AI) mới đang làm mưa làm gió trên internet và ít nhất một gã khổng lồ công nghệ lớn sẽ kiếm bộn tiền.
Kiên Giang: Lãnh hơn 3 năm tù vì thuê xe cuốc rồi đem bán

7 giờ trước Sự kiện

Ngày 2.4, TAND tỉnh Kiên Giang đã mở phiên tòa sơ thẩm và tuyên phạt Nguyễn Hoàng Khởi (SN 1985, ngụ huyện Châu Thành A, tỉnh Hậu Giang) 3 năm 6 tháng tù về tội “Lạm dụng tín nhiệm chiếm đoạt tài sản” .
Cứu bé gái 14 tuổi thoát khỏi những 'cơn điên' hủy hoại cơ thể

7 giờ trước Thông tin Y học

Mỗi lần lên cơn kích động, bé K.N (14 tuổi, ngụ Lâm Đồng) hay la hét, không nhận ra người nhà; tự hủy hoại bản thân như tự bóp cổ mình, cắn môi, cắn lưỡi...
Bộ Y tế vào cuộc vụ người nhà bệnh nhân hành hung bác sĩ ở Gia Lai

8 giờ trước Thông tin Y học

Ngày 2.4, Bộ Y tế đã có công văn chỉ đạo Giám đốc Sở Y tế tỉnh Gia Lai tăng cường bảo đảm an ninh, trật tự tại cơ sở khám bệnh, chữa bệnh; tập trung các giải pháp để ngăn chặn, hạn chế tối đa các trường hợp gây mất an ninh trật tự.

Xem thêm

Cơ quan chủ quản: Hội Thông tin Khoa học và Công nghệ Việt Nam.

ĐC: 24 Lý Thường Kiệt, Hàng Bài, Hoàn Kiếm, Hà Nội.

ĐT: 024.38256203

Hotline nội dung : 0934999945

Tổng biên tập: Hoàng Đại Thanh

Tổng Thư ký Tòa soạn: Nguyễn Đình Mười

Giấy phép số 77/GP-BTTTT do Bộ Thông tin và Truyền thông cấp ngày 26 tháng 2 năm 2020.

Tòa nhà SIMCO Sông Đà, Tiểu KĐT mới Vạn Phúc, Phường Vạn Phúc, Quận Hà Đông, TP. Hà Nội

ĐT: 0984708866

TPHCM: 345/134 Trần Hưng Đạo, phường Cầu Kho, Quận 1

ĐT: 028.38389241

Email: toasoan@1thegioi.vn

Hotline quảng cáo: 096 2445664

Email quảng cáo: sales@1thegioi.vn

Báo giá quảng cáo:

Công ty Cổ phần Truyền thông Một Thế Giới

Baichuan tuyên bố vượt OpenAI, Anthropic bằng mô hình AI xử lý 350.000 ký tự tiếng Trung

Trung Quốc đề xuất danh sách đen dữ liệu đào tạo các mô hình generative AI

Baichuan

OpenAI

Anthropic

mô hình AI

Baichuan2-192k

Claude 2

GPT-4

Zhipu AI

ChatGLM3

Bên trong kế hoạch lớn của Apple nhằm đưa generative AI vào tất cả các thiết bị

Các công ty Trung Quốc tranh mua chip AI Nvidia do lệnh cấm từ Mỹ làm giảm nguồn cung

Bên trong kế hoạch lớn của Apple nhằm đưa generative AI vào tất cả các thiết bị

Các công ty Trung Quốc tranh mua chip AI Nvidia do lệnh cấm từ Mỹ làm giảm nguồn cung

Công nghệ thông minh 5G đảm nhận việc nặng nhọc cho nhiều nông dân Nhật lớn tuổi

Công trình xanh ở Việt Nam: Khó nhất là 'bắc cầu' giải pháp kỹ thuật sang giải pháp tài chính

Lý do lãnh đạo và nhân viên OpenAI từng đánh giá thấp ChatGPT

Tiền Giang: Sầu riêng sốt giá, nhà vườn tích cực 'xử lý' cho cây ra hoa quả trái vụ

Pin mặt trời mới sử dụng perovskite mang đến bước đột phá về năng lượng tái tạo

Trang bị kiến thức xanh cho sinh viên để đạt mục tiêu Net-Zero năm 2050

Thủ tướng: Mạnh dạn giao việc khó cho kinh tế tư nhân

Cơn lốc plasma và UFO kỳ lạ: Mặt trời bất ngờ hé lộ hiện tượng chưa từng thấy

Nghị định 75: Kỳ vọng tháo gỡ vướng mắc cho nhiều dự án

AI cho cộng đồng: Tạo nền tảng vững chắc để phát triển kỹ năng số

Thủ tướng đề nghị Tập đoàn Standard Chartered hỗ trợ xây dựng trung tâm tài chính

Dự án vận chuyển hàng hóa bằng tên lửa siêu thanh SpaceX khiến các loài chim biển Thái Bình Dương lâm nguy

Hệ thống giao dịch chứng khoán mới KRX sẽ vận hành từ ngày 5.5

BIDV góp phần mở rộng, tăng cường sự tham gia của phụ nữ trong nền kinh tế

TP.HCM: Xây dựng trung tâm đột quỵ tại Bệnh viện đa khoa khu vực Hóc Môn

Thủ tướng: Mạnh dạn giao việc khó cho kinh tế tư nhân

Microsoft sẽ kiếm bộn tiền nhờ trào lưu tạo ảnh Ghibli bằng ChatGPT gây bão internet

Kiên Giang: Lãnh hơn 3 năm tù vì thuê xe cuốc rồi đem bán

Cứu bé gái 14 tuổi thoát khỏi những 'cơn điên' hủy hoại cơ thể

Bộ Y tế vào cuộc vụ người nhà bệnh nhân hành hung bác sĩ ở Gia Lai

Zhipu ra mắt tác tử AI miễn phí, nói GLM-Z1-Air có hiệu suất ngang DeepSeek-R1 nhưng chạy nhanh hơn 8 lần

EU sẽ hạn chế tiền phạt Apple và Meta để tránh gia tăng căng thẳng với ông Trump

Apple và SpaceX của Elon Musk đối đầu vì kế hoạch mở rộng mạng vệ tinh

Giám đốc công nghệ Meta đánh giá vị thế của Google, Microsoft, Amazon trong cuộc đua AI

Apple chuẩn bị bước tiến lớn nhất vào lĩnh vực sức khỏe với bác sĩ AI, muốn thay đổi ngành y tế