Nhịp đập khoa học

DeepSeek-R1 xếp sau o3-mini và o1 của OpenAI về độ thông minh nhưng giá rẻ hơn rất nhiều

Sơn Vân • 20/03/2025 22:08

DeepSeek-R1 xếp thứ ba về hiệu suất trong khi có mức giá rẻ hơn nhiều so với các mô hình hàng đầu của OpenAI, theo công ty Artificial Analysis.

Các mô hình trí tuệ nhân tạo (AI) do các công ty Trung Quốc phát triển đang nhanh chóng thu hẹp khoảng cách hiệu suất với các đối thủ hàng đầu Mỹ, đồng thời cung cấp mức giá thấp hơn đáng kể, theo công ty tư vấn và đánh giá Artificial Analysis.

R1, mô hình suy luận do công ty khởi nghiệp DeepSeek (Trung Quốc) phát triển, đạt 60 điểm trên Artificial Analysis Intelligence Index. Qua đó, R1 trở thành mô hình AI thông minh thứ ba thế giới. Xếp trên R1 là hai mô hình của OpenAI gồm o1 (62 điểm) và o3-mini (66 điểm).

Artificial Analysis Intelligence Index là chỉ số đánh giá hiệu suất của mô hình AI dựa trên nhiều tập dữ liệu về trí tuệ và suy luận.

Về giá dành cho nhà phát triển, DeepSeek-R1 đứng thứ 8 toàn cầu, còn GPT-4.5 và o1 của OpenAI là hai mô hình AI đắt đỏ nhất.

Bảng xếp hạng này cho thấy các mô hình AI Trung Quốc đang nhanh chóng bắt kịp đối thủ phương Tây về hiệu suất, đồng thời tích cực giảm giá để cạnh tranh tại thị trường nội địa.

"Một năm trước, các công ty Mỹ thống trị tuyệt đối ở lĩnh vực AI tiên phong. Hôm nay, gần một tá công ty Trung Quốc đã phát triển các mô hình AI có thể sánh ngang hoặc vượt các mô hình thế hệ hiện tại của hầu hết phòng thí nghiệm Mỹ", Artificial Analysis viết trên X vào tháng 2.

Một công ty AI hàng đầu khác là gã khổng lồ thương mại điện tử Alibaba. QwQ-32B, mô hình suy luận mới nhất của Alibaba ra mắt đầu tháng 3, xếp thứ 4 về độ thông minh và thứ 10 về giá.

Cả DeepSeek-R1 và QwQ-32B đều được đánh giá thông minh hơn cũng như rẻ hơn các sản phẩm của phương Tây như Claude 3.7 Sonnet (Anthropic), Mistral Large 2 (Mistral AI), Nova Pro (Amazon).

DeepSeek-R1 chỉ tính 2,19 USD cho mỗi triệu token đầu ra khi truy cập qua giao diện lập trình ứng dụng (API).

Token đầu ra là đơn vị đo lường dữ liệu được tạo ra bởi mô hình AI trong quá trình xử lý ngôn ngữ.

Token là gì?

Token có thể là một từ, một phần của từ, một ký tự hoặc một chuỗi ký tự, tùy thuộc vào phương pháp token hóa mà mô hình sử dụng.

Ví dụ: Câu "Tôi thích AI" có thể được chia thành các token: ["Tôi", "thích", "AI"].

Token đầu ra

Là số lượng token mà mô hình AI sinh ra khi trả lời một yêu cầu.

Ví dụ: Nếu bạn hỏi ChatGPT "Giải thích về AI", câu trả lời "AI là trí tuệ nhân tạo..." sẽ được tính bằng số token đầu ra.

Tại sao tính phí theo token?

Mỗi token đầu ra đòi hỏi tài nguyên tính toán (CPU/GPU) để xử lý.

Các công ty như OpenAI hay DeepSeek tính phí dựa trên lượng token sinh ra để đo lường mức độ sử dụng dịch vụ.

Trong khi đó, các công ty Mỹ vẫn phụ thuộc vào tài nguyên điện toán khổng lồ để huấn luyện mô hình AI, dẫn đến tính phí cao hơn cho nhà phát triển. Mô hình o1 tính phí tới 60 USD mỗi triệu token đầu ra, gấp gần 30 lần so với DeepSeek-R1.

deepseek-r1-xep-sau-ve-o3-mini-va-o1-cua-openai-ve-do-thong-minh-nhung-gia-re-hon-rat-nhieu.jpg — o1 thông minh R1 nhưng tính phí sử dụng cho nhà phát triển đắt hơn rất nhiều - Ảnh: Internet

Hôm 20.3, OpenAI ra mắt o1-pro, phiên bản nâng cấp cho o1 trên nền tảng API của hãng.

o1-pro sử dụng nhiều tài nguyên tính toán hơn để cung cấp phản hồi tốt hơn, đồng thời trở thành mô hình AI đắt nhất từ trước đến nay của OpenAI với mức giá 150 USD mỗi triệu token đầu vào và 600 USD mỗi triệu token đầu ra.

Token đầu vào là đơn vị nhỏ nhất của văn bản được mô hình AI xử lý khi nhận lệnh từ người dùng. Nó có thể là một từ, một phần của từ hoặc một ký tự, tùy thuộc vào cách mô hình mã hóa văn bản.

Ví dụ: Câu "Hello, how are you?" có thể được tách thành khoảng 5-6 token (tùy mô hình). Từ artificial có thể được chia thành "art", "ifi", "cial" trong một số trường hợp.

DeepSeek gây chấn động thị trường đầu năm nay khi tung ra các mô hình AI nguồn mở V3 và R1 hiệu suất cao với chi phí huấn luyện thấp hơn nhiều so với các đối thủ phương Tây.

Tại Trung Quốc, DeepSeek gia nhập hàng ngũ nhiều công ty đang tham gia vào cuộc chiến giá khốc liệt nhằm thu hút người dùng.

Alibaba Cloud, đơn vị điện toán đám mây của Alibaba, gần đây bắt đầu cung cấp các mô hình AI DeepSeek trên nền tảng dịch vụ ngôn ngữ lớn Bailian. Họ cung cấp một triệu token miễn phí mỗi người dùng cho cả hai mô hình DeepSeek V3 và R1.

Ngoài ra, một trong những mô hình được rút gọn của Alibaba Cloud có giá chỉ 0,5 nhân dân tệ (0,07 USD) mỗi triệu token, mức giá được quảng bá là "thấp nhất trên thị trường".

Hôm 26.2, DeepSeek đã giới thiệu mức giá giảm sâu cho các nhà phát triển muốn sử dụng mô hình AI của hãng để xây dựng sản phẩm riêng. Động thái này có thể gây áp lực lên các đối thủ ở Trung Quốc và quốc tế trong việc cắt giảm giá.

DeepSeek cho biết trong khung giờ từ 16:30 GMT đến 00:30 GMT, chi phí sử dụng API (nền tảng cho phép các nhà phát triển tích hợp mô hình AI của DeepSeek vào ứng dụng và sản phẩm web) sẽ giảm tới 75%, đồng thời mở lại nạp tiền cho dịch vụ này sau hơn 2 tuần tạm dừng do quá tải nhu cầu.

Theo bảng giá trên trang web của DeepSeek, chi phí sử dụng API của R1 và V3 trong khung giờ này sẽ giảm lần lượt 75% và 50%.

Dù DeepSeek gọi khung giờ này là "ngoài giờ cao điểm" vì kéo dài từ 0 giờ 30 đến 8 giờ 30 theo giờ Bắc Kinh, nhưng thực tế lại rơi vào ban ngày tại châu Âu và Mỹ.

DeepSeek đã tiết lộ các chi tiết kỹ thuật về quá trình phát triển mô hình suy luận R1 có hiệu suất ngang bằng o1 của OpenAI, với chi phí chỉ bằng một phần nhỏ so với thông thường. Đây là động thái được cho là sẽ thúc đẩy những tiến bộ toàn cầu trong lĩnh vực này.

Cuối tháng 2, DeepSeek đã công bố 8 dự án nguồn mở trên GitHub. Đây là lần đầu tiên DeepSeek tiết lộ chi tiết về cách họ khai thác hiệu suất tốt nhất từ các chip trong tính toán, truyền thông và lưu trữ, vốn là những yếu tố then chốt của đào tạo mô hình AI.

Nhóm các nhà khoa học trẻ của DeepSeek cho biết đã tiết lộ "các khối xây dựng được thử nghiệm trong thực tế để chia sẻ tiến bộ tuy nhỏ nhưng chân thành với sự minh bạch tuyệt đối".

DeepSeek được các nhà phát triển toàn cầu hoan nghênh, ca ngợi vì tiết lộ các kỹ thuật mà họ sử dụng để xây dựng các mô hình AI hiệu suất cao, chi phí thấp của mình. Một số nhà phát triển, gồm cả người sáng lập nền tảng phát triển AI Hyperbolic, gọi DeepSeek mới là "OpenAI thực sự".

Dù có tên gọi như vậy nhưng OpenAI đã chuyển sang phương pháp tiếp cận nguồn đóng, giữ kín các phương pháp đào tạo cụ thể và chi phí tính toán của các mô hình AI. Sam Altman, người đồng sáng lập kiêm Giám đốc điều hành OpenAI, nói đầu tháng 2 rằng công ty "đã đi ngược lại lịch sử" và "cần tìm ra một chiến lược nguồn mở khác".

Hôm 27.2, OpenAI đã ra mắt GPT-4.5, mô hình AI mới nhất trong họ GPT-4 (được giới thiệu cách đây gần hai năm). GPT-4.5 được OpenAI mô tả là "mô hình trò chuyện lớn nhất và tốt nhất", nhưng đi kèm mức giá 150 USD cho mỗi triệu token đầu ra, cao gấp 270 lần mức 55 cent Mỹ mà DeepSeek áp dụng cho mô hình V3 và R1 vào giờ thấp điểm.