Alibaba cho biết mô hình trí tuệ nhân tạo (AI) QwQ-32B vượt trội R1 của DeepSeek về khả năng lập trình và giải quyết vấn đề chung dù sử dụng ít tài nguyên hơn.
Thế giới số

Alibaba tuyên bố mô hình QwQ-32B vượt trội DeepSeek-R1 dù dùng ít tài nguyên hơn, giá cổ phiếu tăng vọt

Sơn Vân 19:08 06/03/2025

Alibaba cho biết mô hình trí tuệ nhân tạo (AI) QwQ-32B vượt trội R1 của DeepSeek về khả năng lập trình và giải quyết vấn đề chung dù sử dụng ít tài nguyên hơn.

Hôm 5.3, Alibaba đã giới thiệu mô hình suy luận AI nguồn mở QwQ-32B mà họ cho biết vượt qua hiệu suất của DeepSeek-R1. Điều này làm nổi bật khả năng AI mạnh mẽ của gã khổng lồ thương mại điện tử Trung Quốc trên nhiều mô hình và cơ sở hạ tầng trung tâm dữ liệu.

Sau khi mô hình QwQ-32B ra mắt, cổ phiếu của Alibaba niêm yết tại Hồng Kông đã tăng gần 8,4% và chốt phiên 5.3 ở mức 140,80 đô la Hồng Kông.

Theo bài đăng trên blog nhóm mô hình AI Qwen của Alibaba, dù chỉ có 32 tỉ tham số, QwQ-32B đã ngang bằng hoặc vượt trội R1, với 671 tỉ tham số, trong các lĩnh vực như toán học, lập trình và giải quyết vấn đề chung.

Theo nhóm nghiên cứu của Alibaba, số lượng tham số nhỏ hơn cho phép mô hình AI hoạt động với yêu cầu về tài nguyên tính toán ít hơn, tạo điều kiện thuận lợi cho việc áp dụng rộng rãi hơn.

Thiết kế tinh gọn của mô hình Alibaba phù hợp với quan điểm mà Chủ tịch Joe Tsai bày tỏ gần đây trên tờ SCMP, trong đó ông nhấn mạnh rằng các ứng dụng thực tế là chìa khóa để tối ưu hóa trí thông minh về phát triển mô hình AI.

Việc Alibaba phát hành mô hình lý luận mới nhất, loại hệ thống AI được thiết kế để suy nghĩ, phản ánh và tự phê bình để giải quyết các vấn đề phức tạp, diễn ra chưa đầy hai tháng sau khi DeepSeek-R1 làm chấn động ngành công nghệ toàn cầu và thị trường chứng khoán vào tháng 1.

Sự kiện này cũng trùng với đợt tăng đột biến việc áp dụng AI trên khắp Trung Quốc và Alibaba hồi tháng 2 công bố kế hoạch đầu tư 52 tỉ USD vào cơ sở hạ tầng điện toán đám mây cùng AI trong ba năm tới. Động thái đó đánh dấu dự án điện toán lớn nhất từ ​​trước đến nay được tài trợ bởi một doanh nghiệp tư nhân tại Trung Quốc.

Alibaba cũng cho biết QwQ-32B vượt trội hơn o1-mini của OpenAI, được xây dựng với 100 tỉ tham số. QwQ-32B có sẵn trên Hugging Face, cộng đồng mô hình AI nguồn mở lớn nhất thế giới.

Nhóm Qwen cho rằng hiệu suất cải thiện của QwQ-32B là nhờ các kỹ thuật học tăng cường, tương tự những gì DeepSeek sử dụng khi phát triển mô hình R1.

Học tăng cường là phương pháp học máy, trong đó một tác nhân học cách đưa ra quyết định bằng cách tương tác với môi trường và nhận phản hồi dưới dạng phần thưởng hoặc hình phạt. Mục tiêu của học tăng cường là giúp tác nhân tối đa hóa phần thưởng dài hạn thông qua các hành động mà nó thực hiện trong môi trường.

Ứng dụng của học tăng cường

Chơi game: Học tăng cường đã được sử dụng để huấn luyện các hệ thống AI chơi game, chẳng hạn AlphaGo của Google DeepMind.

Robot: Điều khiển robot để học cách thực hiện các tác vụ phức tạp như di chuyển hoặc thu thập vật phẩm.

Tối ưu hóa: Ứng dụng trong các lĩnh vực như quảng cáo, tài chính và quản lý tài nguyên để tối đa hóa lợi nhuận hoặc hiệu quả.

Ô tô tự lái: Học tăng cường giúp ô tô tự lái học cách điều khiển an toàn trong môi trường giao thông phức tạp.

Các thuật toán phổ biến trong học tăng cường

Q-learning: Một cơ sở toán học thuật toán giúp nhân viên học giá trị của từng hành động trong một trạng thái cụ thể.

Deep Q-Networks (DQN): Kết hợp học tăng cường với mạng nơ-ron sâu để xử lý môi trường phức tạp hơn.

Policy gradient: Tác nhân học trực tiếp chiến lược tối ưu thay vì giá trị của từng trạng thái.

Diễn viên-nhà phê bình: Kết hợp hai phương pháp trên để tối ưu hóa công việc học chiến lược.

Học tăng cường đã giúp phát triển nhiều công nghệ tiên tiến như AI, tài chính, y tế, robot và xe tự lái.

Nhóm nghiên cứu thuộc Alibaba cho biết những tiến bộ này “không chỉ chứng minh tiềm năng biến đổi của phương pháp học tăng cường mà còn mở đường cho những đổi mới hơn nữa trong việc theo đuổi trí tuệ nhân tạo tổng quát (AGI)”.

AGI là dạng AI có khả năng hiểu, học hỏi và thực hiện các nhiệm vụ đa dạng một cách linh hoạt, giống hay vượt trội con người. Không giống AI hẹp, vốn chỉ giỏi trong một lĩnh vực cụ thể (như nhận dạng giọng nói hoặc hình ảnh), AGI có khả năng áp dụng kiến thức và kỹ năng trong nhiều lĩnh vực khác nhau, từ đó giải quyết các vấn đề phức tạp một cách tự chủ và sáng tạo. OpenAI định nghĩa AGI là "một hệ thống có tính tự chủ cao, vượt trội hơn con người ở hầu hết công việc có giá trị kinh tế".

alibaba-tuyen-bo-mo-hinh-qwq-32b-vuot-troi-deepseek-r1-du-dung-it-tai-nguyen-hon-gia-co-phieu-tang-vot.jpg
Alibaba gần đây tập trung phát triển các mô hình AI mới để cạnh tranh với DeepSeek và các đối thủ quốc tế - Ảnh: SCMP

Việc ra mắt QwQ-32B diễn ra sau phát biểu của Eddie Wu Yongming (Giám đốc điều hành Alibaba) ở buổi báo cáo kết quả tài chính gần đây. Trong đó, Eddie Wu Yongming cho biết trọng tâm chính của Alibaba là phát triển AGI, được ông định nghĩa là thời điểm mà AI có thể đạt được 80% khả năng của con người.

Eddie Wu Yongming nói Alibaba sẽ tăng chi tiêu vào AI và cơ sở hạ tầng đám mây nhiều hơn cả thập kỷ qua chỉ trong 3 năm tới.

Alibaba đã tích cực đầu tư vào các công ty khởi nghiệp AI Trung Quốc như Moonshot và 01.ai nhằm tận dụng chuyên môn của họ để phát triển các công nghệ tiên tiến. Ngoài ra, tập đoàn này cũng đã mở mã nguồn nhiều mô hình ngôn ngữ lớn trong 18 tháng qua để thu hút các nhà phát triển về nền tảng đám mây của mình.

Tổng chi tiêu vốn của Alibaba trong năm 2024 đạt 72,5 tỉ nhân dân tệ (10 tỉ USD), tăng mạnh so với 24 tỉ nhân dân tệ của năm 2023. Phần lớn số tiền này sẽ được sử dụng để mua bộ xử lý và phát triển cơ sở hạ tầng, giúp đào tạo các mô hình ngôn ngữ lớn phục vụ AI.

Cùng với khoản đầu tư lớn vào AI, Alibaba cũng ghi nhận mức tăng trưởng doanh thu ấn tượng. Trong quý 4/2024, doanh thu của Alibaba tăng 8% lên 280 tỉ nhân dân tệ (gần 40 tỉ USD), mức tăng trưởng nhanh nhất hơn một năm qua. Đặc biệt, mảng kinh doanh đám mây, một trong những trọng tâm chiến lược của Alibaba, đạt mức tăng trưởng 13% lên 31,7 tỉ nhân dân tệ (4,3 tỉ USD).

Trong lĩnh vực thương mại điện tử, doanh số từ hoạt động thương mại quốc tế của Alibaba tăng 32% lên 37,8 tỉ nhân dân tệ (5,2 tỉ USD), chủ yếu nhờ vào sự phát triển mạnh mẽ của nền tảng AliExpress, đối thủ cạnh tranh trực tiếp với Temu. Mảng thương mại nội địa, vốn gặp khó khăn trong thời gian qua, cũng bắt đầu phục hồi với mức tăng 5%, đạt 136 tỉ nhân dân tệ (20 tỉ USD), nhờ vào các khoản phí trên nền tảng Taobao và Tmall.

Cuối tháng 1, Alibaba đã phát hành Qwen 2.5-Max, phiên bản mới của mô hình Qwen 2.5, mà họ tuyên bố vượt trội DeepSeek-V3.

V3 của DeepSeek là mô hình AI nguồn mở, mạnh mẽ với chi phí đào tạo thấp.

Thời điểm phát hành Qwen 2.5-Max vào mùng 1 Tết Nguyên đán, khi hầu hết người dân Trung Quốc nghỉ làm và quây quần bên gia đình, cho thấy áp lực từ sự trỗi dậy mạnh mẽ của DeepSeek không chỉ đè nặng lên các các công ty nước ngoài mà còn lên cả những đối thủ trong nước.

"Qwen 2.5-Max vượt trội gần như trên mọi phương diện so với GPT-4o, DeepSeek-V3 và Llama-3.1-405B", Alibaba Cloud (đơn vị điện toán đám mây của Alibaba) thông báo trên tài khoản WeChat chính thức.

GPT-4o và Llama-3.1-405B lần lượt là mô hình AI tiên tiến của OpenAI ("cha đẻ" ChatGPT) và Meta Platforms (chủ sở hữu Facebook).

Bài liên quan
Giải mã mối quan hệ đối tác giữa Apple với Alibaba và Baidu để triển khai AI trên iPhone ở Trung Quốc
Apple đang nỗ lực đưa các tính năng trí tuệ nhân tạo (AI) của mình đến Trung Quốc vào giữa năm 2025, đẩy nhanh dự án phức tạp đòi hỏi phải thay đổi phần mềm và phụ thuộc nhiều vào các đối tác địa phương.

(0) Bình luận
Nổi bật Một thế giới
Đẩy nhanh tiến độ các dự án giao thông trọng điểm tại ĐBSCL
11 phút trước Theo dòng thời sự
Ngày 6.3, tại tỉnh Đồng Tháp, Phó thủ tướng Trần Hồng Hà cùng đoàn công tác đã có buổi kiểm tra, làm việc về tiến độ thực hiện các dự án đường cao tốc tại vùng đồng bằng sông Cửu Long (ĐBSCL).
Đừng bỏ lỡ
Mới nhất
POWERED BY ONECMS - A PRODUCT OF NEKO
Alibaba tuyên bố mô hình QwQ-32B vượt trội DeepSeek-R1 dù dùng ít tài nguyên hơn, giá cổ phiếu tăng vọt