Các sản phẩm mới của Nvidia có thể cải thiện đáng kể hiệu suất cho mô hình DeepSeek-R1, Jensen Huang tuyên bố hôm 18.3. Đây là thông điệp nhằm nhấn mạnh vị thế không thể thay thế của công ty Mỹ trong kỷ nguyên trí tuệ nhân tạo (AI).
Thế giới số

Jensen Huang: Các sản phẩm AI mới của Nvidia cải thiện đáng kể khả năng suy luận cho mô hình DeepSeek

Sơn Vân 19/03/2025 21:10

Các sản phẩm mới của Nvidia có thể cải thiện đáng kể hiệu suất cho mô hình DeepSeek-R1, Jensen Huang tuyên bố hôm 18.3. Đây là thông điệp nhằm nhấn mạnh vị thế không thể thay thế của công ty Mỹ trong kỷ nguyên trí tuệ nhân tạo (AI).

Tại hội nghị dành cho các nhà phát triển phần mềm của Nvidia diễn ra ở thành phố San Jose (bang California, Mỹ), Giám đốc điều hành Jensen Huang giải thích cách các sản phẩm mới nhất của Nvidia có thể cải thiện đáng kể khả năng suy luận cho các mô hình AI như DeepSeek-R1.

Ông mô tả Dynamo, phần mềm suy luận mã nguồn mở mới của Nvidia, là “hệ điều hành của một nhà máy AI”. Theo Nvidia, Dynamo (hiện đã có trên nền tảng mã nguồn mở GitHub) có thể cải thiện hiệu suất lên đến 30 lần trên các bộ xử lý đồ họa (GPU) và kiến trúc hiện có dành cho các tác vụ suy luận AI.

Vai trò thống lĩnh của Nvidia với tư cách là "nhà cung cấp vũ khí" lớn nhất trong cuộc đua AI toàn cầu đã bị đặt dấu hỏi vào tháng 1, khi DeepSeek (công ty khởi nghiệp có trụ sở tại Hàng Châu, Trung Quốc) công bố mô hình AI nguồn mở V3 và R1 có hiệu suất cao với chi phí đào tạo thấp. Điều này làm dấy lên nghi vấn về việc có cần thiết phải mua các chip AI đắt đỏ hay không.

Bị cấm bán các chip tiên tiến cho Trung Quốc do lệnh hạn chế xuất khẩu từ Mỹ, Nvidia đã cố gắng xoa dịu lo ngại về "định luật mở rộng" (quy tắc cho rằng hệ thống AI càng mạnh khi có nhiều tài nguyên hơn) sau thành công của DeepSeek.

Cổ phiếu Nvidia đã giảm 3,4% xuống còn 115,4 USD hôm 18.3. Đây là mức giá thấp hơn so với ngày 27.11, khi cổ phiếu Nvidia giảm 17% chỉ trong một ngày giao dịch chủ yếu vì thông tin DeepSeek đào tạo V3 chỉ bằng 2.048 GPU Nvidia H800 trong vòng hai tháng.

Đây không phải là loại chip AI hàng đầu của Nvidia. Ban đầu H800 được Nvidia phát triển như một sản phẩm giảm hiệu năng để vượt qua các hạn chế từ chính quyền Biden với mục đích bán cho thị trường Trung Quốc, song sau đó bị cấm theo lệnh trừng phạt của Mỹ.

Trong một bài viết về V3, DeepSeek tuyên bố rằng quá trình huấn luyện mô hình này chỉ tiêu tốn 2,8 triệu giờ GPU với chi phí 5,6 triệu USD, bằng một phần nhỏ thời gian và tiền bạc mà các công ty Mỹ bỏ ra cho các mô hình AI của họ.

Các mô hình mã nguồn mở của DeepSeek gây lo ngại ở Mỹ trong bối cảnh căng thẳng chính trị giữa hai nước gia tăng. Thế nhưng, các công ty chip Mỹ, gồm cả Nvidia và AMD, đã nhanh chóng hỗ trợ các mô hình AI phổ biến của DeepSeek.

Một bài viết gần đây của Nvidia cho biết hệ thống Nvidia DGX với tám GPU Blackwell có thể đạt tốc độ suy luận 253 token/giây mỗi người dùng, hoặc đạt thông lượng tối đa hơn 30.000 token/giây trên mô hình DeepSeek-R1 với 671 tỉ tham số. Từ tháng 1 đến nay, đội ngũ Nvidia đã cải thiện thông lượng của R1 lên 36 lần.

1. Trong lĩnh vực AI và xử lý ngôn ngữ tự nhiên (NLP), token là đơn vị ngôn ngữ được sử dụng để phân chia văn bản thành các phần nhỏ hơn, giúp mô hình AI hiểu và xử lý văn bản dễ dàng hơn. Một token có thể là một từ, một ký hiệu, một phần của từ hoặc thậm chí một ký tự, tùy thuộc vào cách hệ thống NLP xử lý văn bản. Token giúp AI hiểu cấu trúc ngữ pháp, ngữ nghĩa và mối quan hệ giữa các từ trong câu. Khi được huấn luyện, mô hình ngôn ngữ lớn học cách dự đoán hoặc xử lý một chuỗi token thay vì xử lý toàn bộ câu hoặc văn bản dài trong một lần.

2. Trong AI, đặc biệt là NLP, thông lượng thường đề cập đến số lượng token mà một mô hình AI có thể xử lý một giây.

Thông lượng là thuật ngữ dùng để chỉ lượng dữ liệu hoặc số lượng tác vụ có thể được xử lý trong một khoảng thời gian nhất định. Nó thường được sử dụng trong nhiều lĩnh vực khác nhau như công nghệ, mạng máy tính, sản xuất và AI.

Tại hội nghị cho các nhà phát triển phần mềm của Nvidia, Jensen Huang đã trình chiếu video so sánh mô hình ngôn ngữ truyền thống của Meta Platforms với DeepSeek-R1 ở một bài toán sắp xếp chỗ ngồi. Trong khi mô hình của Meta Platforms chỉ sử dụng 439 token nhưng không đưa ra được đáp án đúng, R1 sử dụng 8.559 token nhưng cuối cùng đã tìm ra câu trả lời chính xác sau khi thử nghiệm nhiều kịch bản khác nhau.

Jensen Huang lập luận rằng các mô hình suy luận sẽ tạo ra nhu cầu tính toán tăng vọt và "định luật mở rộng" vẫn sẽ có hiệu quả trong các giai đoạn phát triển AI khác nhau.

Các gã khổng lồ công nghệ Trung Quốc như Baidu, Alibaba Cloud và ByteDance tham gia hội nghị của Nvidia năm nay. DeepSeek không tham dự hội nghị này. Thế nhưng, quỹ đầu tư định lượng High-Flyer (công ty mẹ DeepSeek) đã tham gia hội nghị năm 2022 của Nvidia và giới thiệu công nghệ lập lịch tài nguyên tính toán AI của mình.

jensen-huang-cac-san-pham-ai-moi-cua-nvidia-cai-thien-dang-ke-kha-nang-suy-luan-cho-mo-hinh-deepseek.jpg
Ông Jensen Huang nói chuyện với một con robot trong hội nghị ở San Jose - Ảnh: Getty Images

Tại sự kiện, Jensen Huang còn công bố nhiều bước tiến quan trọng của Nvidia, gồm:

GPU Blackwell Ultra, được tối ưu hóa đặc biệt cho các mô hình suy luận, dự kiến xuất xưởng vào cuối năm nay.

Kiến trúc GPU Vera Rubin, thế hệ bộ xử lý tiếp theo của Nvidia, sẽ ra mắt vào năm 2026.

Kiến trúc Feynman dự kiến xuất hiện vào năm 2028.

Các cập nhật khác liên quan đến robotics và máy tính lượng tử.

Máy tính cá nhân mới mạnh mẽ có tên DGX Workstation, dựa trên chip Blackwell, sẽ được sản xuất bởi Dell, Lenovo, HP và một số công ty khác. DGX Workstation, tiếp nối một mẫu máy tính để bàn nhỏ hơn ra mắt hồi đầu năm, là thách thức với một số dòng máy Mac cao cấp của Apple.

Ngoài ra, Jensen Huang còn thông báo rằng hãng ô tô General Motors (Mỹ) đã chọn Nvidia để xây dựng đội xe tự lái của mình.

General Motors sẽ sử dụng chip AI và phần mềm của Nvidia để phát triển công nghệ xe tự lái và cải thiện quy trình sản xuất tại các nhà máy của mình, theo thông báo từ hai công ty hôm 18.3.

Các hãng ô tô truyền thống đã gặp nhiều khó khăn trong việc thương mại hóa công nghệ tự lái, vì lĩnh vực này phức tạp và tốn kém hơn dự kiến. Tuy nhiên, công nghệ tự lái đã trở thành một cách để thúc đẩy doanh số và tạo ra doanh thu từ dịch vụ đăng ký dành cho tài xế.

General Motors và Nvidia có kế hoạch hợp tác xây dựng hệ thống AI, sử dụng nền tảng của Nvidia để huấn luyện mô hình sản xuất AI nhằm tối ưu hóa quy trình tại các nhà máy.

Ngoài ra, General Motors cũng sẽ tích hợp công nghệ tự lái của Nvidia vào các hệ thống hỗ trợ lái xe tiên tiến (ADAS) trong tương lai.

Khi được hỏi về các điều khoản tài chính, người phát ngôn của General Motors cho biết hai công ty có thỏa thuận hợp tác chiến lược về việc ứng dụng AI trong sản xuất. General Motors cũng sẽ mua chip AI Nvidia để hỗ trợ công nghệ lái xe tự động.

Jensen Huang: Cuộc cách mạng robot hình người đang đến gần hơn bạn nghĩ

Jensen Huang tin rằng robot hình người sẽ được sử dụng rộng rãi trong các cơ sở sản xuất trong vòng chưa đầy 5 năm nữa.

Ông đã có bài phát biểu quan trọng tại một sân vận động khúc côn cầu đông người trong hội nghị dành cho nhà phát triển thường niên của công ty hôm 18.3.

Tỷ phú 62 tuổi người Mỹ gốc Đài Loan được các nhà báo hỏi về những dấu hiệu nào cho thấy AI đã trở nên phổ biến.

Ông đáp: “Có thể đó sẽ là khi robot hình người thực sự đi lại xung quanh chúng ta. Đây không phải là vấn đề của 5 năm tới, mà chỉ là vài năm nữa thôi”.

Jensen Huang cho biết ngành công nghiệp sản xuất có khả năng sẽ áp dụng robot hình người trước, vì đây là ngành có các nhiệm vụ được xác định rõ ràng mà robot có thể thực hiện trong một môi trường được kiểm soát.

"Tôi nghĩ robot hình người nên được đưa vào các nhà máy trước tiên. Lý do là vì lĩnh vực này có nhiều quy tắc, tiêu chuẩn an toàn hơn và các trường hợp sử dụng cũng cụ thể hơn.

Giá trị của robot hình người rất dễ xác định. Mức giá thuê một robot hình người có lẽ vào khoảng 100.000 USD và tôi nghĩ đó là mức giá khá hợp lý", doanh nhân này nói thêm.

Bài liên quan
TSMC đề nghị Nvidia, AMD, Broadcom tham gia liên doanh vận hành các nhà máy sản xuất chip của Intel
TSMC (Đài Loan) đã đề xuất với các nhà thiết kế chip hàng đầu Mỹ là Nvidia, Advanced Micro Devices (AMD) và Broadcom về việc tham gia góp vốn vào một liên doanh sẽ vận hành các nhà máy sản xuất chip của Intel, theo bốn nguồn tin của Reuters thân cận với vấn đề.

(0) Bình luận
Nổi bật Một thế giới
Thủ tướng: Khuyến khích đổi mới sáng tạo, chấp nhận rủi ro, độ trễ
5 giờ trước Nhịp đập khoa học
Nhấn mạnh nghiên cứu khoa học, đổi mới sáng tạo không có giới hạn, Thủ tướng cho rằng cần mở ra không gian sáng tạo, khuyến khích đổi mới, chấp nhận rủi ro, độ trễ.
Đừng bỏ lỡ
Mới nhất
POWERED BY ONECMS - A PRODUCT OF NEKO
Jensen Huang: Các sản phẩm AI mới của Nvidia cải thiện đáng kể khả năng suy luận cho mô hình DeepSeek