Nvidia trong cuộc chiến AI suy luận
Khoa học - công nghệ - Ngày đăng : 14:58, 12/03/2025
Nvidia trong cuộc chiến AI suy luận
Nvidia đã thống lĩnh thị trường chip trí tuệ nhân tạo (AI) trong suốt nhiều năm, nhưng một thay đổi quan trọng đang mở ra cơ hội cho các đối thủ cạnh tranh lật đổ gã khổng lồ này.
Công nghệ AI suy luận (Inference) - quá trình xử lý và phản hồi yêu cầu của người dùng theo thời gian thực - đang dần trở thành yếu tố cốt lõi trong lĩnh vực AI.
Theo Financial Times, sự thay đổi này diễn ra mạnh mẽ hơn khi DeepSeek, một công ty khởi nghiệp AI từ Trung Quốc, thúc đẩy chuyển dịch trọng tâm từ huấn luyện mô hình sang suy luận. Các mô hình tiên tiến như DeepSeek R1, OpenAI o3 và Claude 3.7 của Anthropic đang tiêu tốn nhiều tài nguyên tính toán hơn tại thời điểm xử lý yêu cầu của người dùng, thay vì trong giai đoạn huấn luyện truyền thống.

Đối thủ của Nvidia
Trước đây, phần lớn nhu cầu tính toán AI tập trung vào quá trình huấn luyện - xây dựng mô hình từ dữ liệu khổng lồ. Tuy nhiên, khi AI được tích hợp vào nhiều ứng dụng hơn, từ chatbot như ChatGPT hay Grok của xAI đến những công cụ hỗ trợ doanh nghiệp phức tạp hơn, nhu cầu về suy luận AI đang ngày càng gia tăng.
Chính tại đây, các đối thủ của Nvidia như Cerebras, Groq và các ông lớn công nghệ như Google, Amazon, Microsoft, Meta đang dồn lực để phá vỡ sự thống trị của công ty bán dẫn có giá trị nhất thế giới.
Andrew Feldman, CEO của Cerebras, nhận định: “Huấn luyện tạo ra AI, còn suy luận là cách AI hoạt động. Nhu cầu sử dụng AI đang bùng nổ, và hiện tại là thời điểm vàng để tạo ra một con chip tối ưu hơn nhiều cho suy luận”.
Dù Nvidia vẫn thống trị thị trường trung tâm dữ liệu khổng lồ, phục vụ các hệ thống như xAI của Elon Musk tại Memphis hay dự án Stargate của OpenAI với SoftBank, nhưng hãng đang phải đối mặt với thách thức nghiêm trọng từ các trung tâm dữ liệu nhỏ hơn, nơi suy luận AI là ưu tiên hàng đầu.
"Tôi tin rằng suy luận AI sẽ trở thành một trong những khối lượng công việc quan trọng nhất trên internet trong tương lai", Vipul Ved Prakash, CEO của Together AI, công ty dịch vụ đám mây AI trị giá 3,3 tỉ USD, khẳng định.
Theo Morgan Stanley, hơn 75% nhu cầu tính toán trong các trung tâm dữ liệu tại Mỹ sẽ dành cho suy luận trong những năm tới, mở ra thị trường hàng trăm tỉ USD cho các công ty chip AI.
Sự bùng nổ đầu tư vào suy luận AI
Công ty dịch vụ tài chính Anh Barclays ước tính trong vòng hai năm tới, chi phí đầu tư vào suy luận AI sẽ chính thức vượt qua huấn luyện AI. Từ 122,6 tỉ USD vào năm 2025, con số này sẽ tăng vọt lên 208,2 tỉ USD vào năm 2026.
Dự báo này cũng chỉ ra một sự thay đổi lớn trong thị trường chip AI. Nếu như Nvidia nắm giữ gần như toàn bộ thị phần huấn luyện AI, thì đến năm 2028, thị phần suy luận AI của họ sẽ giảm xuống còn 50%. Điều này đồng nghĩa với việc các đối thủ khác sẽ kiểm soát phần còn lại của thị trường trị giá gần 200 tỉ USD.
Walter Goodwin, CEO của Fractile, nhận định: "Các nhà cung cấp điện toán đám mây đang tìm kiếm những giải pháp thay thế để không phải phụ thuộc quá nhiều vào Nvidia".
Bên cạnh đó, sự phát triển của chip tối ưu hơn, thuật toán AI cải tiến và cạnh tranh khốc liệt giữa các gã khổng lồ công nghệ như Google, OpenAI và Anthropic đang đẩy chi phí vận hành AI xuống nhanh chóng.
"Mỗi năm, chi phí sử dụng AI giảm khoảng 10 lần. Giá thấp hơn luôn dẫn đến nhu cầu sử dụng cao hơn", Sam Altman, CEO của OpenAI, cho biết.
Một trong những tác nhân chính gây ra cơn sốt này là sự xuất hiện của DeepSeek R1 và v3 vào đầu năm nay. Những mô hình này đã khiến thị trường chao đảo khi chứng minh rằng chi phí huấn luyện AI có thể được giảm đáng kể. Không dừng lại ở đó, cải tiến về kiến trúc và mã hóa của DeepSeek còn giúp cắt giảm mạnh chi phí suy luận, tạo ra áp lực lớn lên Nvidia.
Bên cạnh đó, sự phức tạp ngày càng cao của các truy vấn AI cũng đặt ra những yêu cầu bộ nhớ lớn hơn, mở ra cơ hội cho các giải pháp thay thế GPU của Nvidia.
Andrew Feldman, CEO của Cerebras, nhấn mạnh rằng tốc độ phản hồi là yếu tố quan trọng nhất trong việc thu hút người dùng AI. "Google đã chứng minh rằng ngay cả độ trễ chỉ vài micro giây cũng có thể làm giảm đáng kể sự chú ý của người dùng", ông nói.
Điều này đặc biệt quan trọng trong suy luận AI, nơi thời gian phản hồi càng nhanh, trải nghiệm người dùng càng tốt. Feldman cho biết chip của Cerebras giúp chatbot Le Chat của Mistral AI trả lời chỉ trong một giây, trong khi OpenAI o1 cần tới 40 giây để hoàn thành tác vụ tương tự. Đây là lợi thế cạnh tranh lớn mà các công ty đang khai thác để thách thức vị thế của Nvidia.
Câu trả lời mang tên Blackwell
Nhận thấy cơ hội khổng lồ trong suy luận AI, Jensen Huang, CEO của Nvidia, khẳng định rằng các chip của công ty ông không chỉ mạnh mẽ trong huấn luyện mà còn vượt trội trong suy luận.
Dòng chip Blackwell thế hệ mới được thiết kế để tối ưu hóa suy luận, với nhiều khách hàng đầu tiên đã sử dụng chúng để vận hành AI thay vì chỉ huấn luyện mô hình. Phần mềm Cuda độc quyền của Nvidia tiếp tục là rào cản lớn đối với các đối thủ muốn giành thị phần trong thị trường này.
"Lượng tính toán suy luận hiện đã gấp 100 lần so với khi mô hình ngôn ngữ lớn mới ra đời, và đây mới chỉ là khởi đầu", ông Huang nhấn mạnh.
Dù đối mặt với áp lực ngày càng lớn, Nvidia vẫn tự tin vào khả năng dẫn đầu thị trường. Họ tuyên bố hiệu suất suy luận của chip Nvidia đã tăng gấp 200 lần chỉ trong hai năm.
Prakash, CEO của Together AI, cho biết công ty ông vẫn sử dụng cùng một chip Nvidia cho cả suy luận và huấn luyện, điều này mang lại sự linh hoạt quan trọng.
Tuy nhiên, không giống như GPU đa năng của Nvidia, các bộ tăng tốc suy luận chuyên biệt có thể được tối ưu hóa tốt hơn cho một loại mô hình AI cụ thể. Trong một ngành công nghiệp phát triển nhanh, các công ty chip AI mới có thể chiếm lĩnh thị phần nếu Nvidia không theo kịp xu hướng.
"Lợi thế của điện toán đa dụng là khả năng thích ứng với sự thay đổi mô hình AI. Nhưng trong tương lai, sẽ có một sự pha trộn phức tạp của nhiều loại chip AI khác nhau", Prakash dự đoán.
Nvidia hiện là ông lớn trong ngành AI, nhưng các đối thủ đang tăng tốc mạnh mẽ để giành thị phần. DeepSeek, Cerebras, Google, Amazon, Microsoft và nhiều công ty khác đều đang đầu tư mạnh vào chip AI suy luận, tạo ra cuộc cạnh tranh chưa từng có trong lĩnh vực này.