Nvidia phô diễn bước tiến AI ở GTC để giữ ngôi vương, trước nguy cơ mất thị phần
Khi mạc hội nghị GTC của Nvidia ngày 16.3 tới, Jensen Huang nhiều khả năng sẽ công bố các sản phẩm và quan hệ hợp tác mới nhằm giúp hãng chip AI này duy trì vị thế dẫn đầu trước số lượng đối thủ ngày càng tăng.
Diễn ra tại trung tâm Thung lũng Silicon tuần tới, hội nghị GTC dành cho nhà phát triển là sự kiện để Giám đốc điều hành Jensen Huang trình diễn các bước tiến AI của Nvidia trong nhiều lĩnh vực: chip, trung tâm dữ liệu, CUDA, tác tử AI và AI vật lý.
Năm nay, sự kiện kéo dài bốn ngày này càng trở nên quan trọng khi các nhà đầu tư tìm kiếm sự đảm bảo rằng chiến lược tái đầu tư lợi nhuận của Nvidia vào toàn bộ hệ sinh thái AI đang mang lại hiệu quả.
“Tôi kỳ vọng Nvidia sẽ cập nhật lộ trình toàn diện từ chip Rubin đến Feynman, đồng thời nhấn mạnh các lĩnh vực suy luận, agentic AI (AI có khả năng tự chủ), mạng kết nối và hạ tầng nhà máy AI”, nhà phân tích Jacob Bourne của eMarketer nói. Rubin và Feynman là hai thế hệ chip AI tiếp theo của Nvidia, sau Blackwell.
eMarketer là công ty nghiên cứu thị trường và phân tích dữ liệu có trụ sở ở Mỹ, chuyên cung cấp báo cáo về kinh tế số, quảng cáo, thương mại điện tử, truyền thông và công nghệ.
Các chip Nvidia hiện nằm ở trung tâm của hàng trăm tỉ USD đầu tư vào trung tâm dữ liệu từ các chính phủ và doanh nghiệp trên thế giới. Tuy nhiên, gã khổng lồ Mỹ đang phải đối mặt với sự cạnh tranh từ các hãng sản xuất chip AI khác, thậm chí từ chính khách hàng của mình như Meta, OpenAI và Microsoft, vốn đang phát triển chip riêng.
Các nhà phân tích nói với Reuters rằng thị trường chip AI tổng thể vẫn sẽ tiếp tục tăng trưởng. Tuy nhiên, thị phần của Nvidia có thể giảm phần nào khi thị trường chip AI đang nhanh chóng thay đổi theo hướng tác tử AI tự thực hiện các công việc thay cho con người.
Điều này khác với giai đoạn huấn luyện trước đây, khi các phòng thí nghiệm AI kết nối nhiều chip Nvidia thành một siêu máy tính để xử lý khối lượng dữ liệu khổng lồ nhằm hoàn thiện mô hình AI.
Các tác tử AI được dự đoán sẽ trở nên nhiều đến mức con người không thể quản lý trực tiếp. Vì vậy, sẽ cần thêm một tầng AI trung gian đóng vai trò điều phối, giống các quản lý, đứng giữa người dùng và đội ngũ tác tử AI để phân công và phối hợp công việc. Trong giới công nghệ, tầng này được gọi là lớp điều phối.
Ở một khía cạnh nào đó, các nhà phân tích cho rằng đây là tín hiệu tích cực cho Nvidia vì cho thấy AI đang trở nên hữu ích hơn. Thế nhưng, những nhiệm vụ được gọi chung là suy luận trong ngành AI cũng có thể chạy trên các loại chip khác, gồm cả những chip do khách hàng lớn của Nvidia tự phát triển.
Meta gần đây cho biết dự định tung ra các chip AI mới 6 tháng một lần. Các chip AI mới nằm trong chương trình Meta Training and Inference Accelerator (MTIA) của công ty. Chip đầu tiên trong loạt này có tên MTIA 300, đã được đưa vào sử dụng để vận hành các hệ thống xếp hạng và gợi ý nội dung của Meta.
Ba chip còn lại gồm MTIA 400, MTIA 450, MTIA 500 sẽ được triển khai vào năm 2026 và 2027. Trong đó, MTIA 450 và MTIA 500 được thiết kế để thực hiện suy luận, quá trình mô hình AI phản hồi các câu hỏi và yêu cầu của người dùng.

“Nvidia chắc chắn sẽ đối mặt với nhiều cạnh tranh hơn so với một năm trước. Hiện Nvidia vẫn nắm hơn 90% thị phần ở cả thị trường huấn luyện và suy luận”, ông KinNgai Chan, Giám đốc điều hành Summit Insights Group, cho hay.
“Chúng tôi cho rằng Nvidia sẽ bắt đầu mất thị phần từ năm 2027, khi các chương trình ASIC nội bộ đạt được quy mô nhất định, đặc biệt là trong thị trường suy luận”, ông nói.
ASIC là các chip được thiết kế cho một chức năng hoặc khối lượng công việc cụ thể, thường hiệu quả hơn so với GPU (bộ xử lý đồ họa) đa dụng.
Summit Insights Group là công ty nghiên cứu và tư vấn trong lĩnh vực công nghệ, có trụ sở tại Mỹ. Công ty chuyên phân tích các ngành như chip, trung tâm dữ liệu, điện toán đám mây và phần cứng công nghệ.
Nvidia sẽ phô diễn bước tiến AI
Nvidia vào tháng 12.2025 ký thỏa thuận trị giá khoảng 20 tỉ USD để cấp phép công nghệ AI suy luận của Groq và thu hút đội ngũ kỹ sư của công ty khởi nghiệp này. Groq là công ty khởi nghiệp chip chuyên về tính toán suy luận nhanh và chi phí thấp.
Trong cuộc họp công bố kết quả kinh doanh quý 1 năm tài chính 2026 tháng trước, Jensen Huang cho biết Nvidia sẽ trình diễn tại hội nghị GTC cách tích hợp công nghệ AI siêu nhanh của Groq vào nền tảng CUDA hiện có.
CUDA là nền tảng điện toán song song và bộ công cụ lập trình do Nvidia phát triển, cho phép các nhà phát triển sử dụng GPU để thực hiện các phép tính phức tạp thay vì chỉ dựa vào CPU (bộ xử lý trung tâm).
Ban đầu, GPU được thiết kế chủ yếu để xử lý đồ họa. Thế nhưng, CUDA cho phép các lập trình viên khai thác sức mạnh tính toán rất lớn của GPU để giải quyết nhiều bài toán khác như AI, học máy, mô phỏng khoa học, phân tích dữ liệu lớn và xử lý hình ảnh. Nhờ CUDA, một chương trình có thể chia nhỏ công việc thành hàng nghìn tác vụ và xử lý chúng đồng thời trên nhiều lõi của GPU, giúp tăng tốc độ tính toán lên rất nhiều so với CPU truyền thống.
CUDA cũng cung cấp các thư viện, công cụ phát triển và giao diện lập trình để các nhà phát triển dễ dàng xây dựng phần mềm chạy trên GPU của Nvidia. Tuy nhiên, phần mềm viết bằng CUDA thường chỉ chạy tối ưu trên GPU Nvidia, khiến nhiều ứng dụng AI và tính toán hiệu năng cao phụ thuộc vào hệ sinh thái phần cứng của hãng này. Đây là một trong những yếu tố quan trọng giúp Nvidia duy trì vị thế thống trị trong lĩnh vực hạ tầng AI.
William McGonigle, nhà phân tích tại Third Bridge, kỳ vọng Jensen Huang sẽ giới thiệu dòng máy chủ mới kết hợp chip Groq với công nghệ mạng Nvidia để tạo ra sản phẩm vừa nhanh vừa tiết kiệm chi phí.
Third Bridge là công ty nghiên cứu và cung cấp thông tin thị trường có trụ sở tại London (thủ đô Anh), chuyên phục vụ nhà đầu tư và các tổ chức tài chính.
Một loại chip khác đang trở thành mối đe dọa cạnh tranh ngày càng lớn với Nvidia là CPU - vốn lâu nay được phát triển bởi Intel và AMD.
Dù bị GPU Nvidia lấn át những năm gần đây, CPU đang “trở lại tâm điểm chú ý”, theo William McGonigle. Ông dự đoán Nvidia sẽ trình diễn các máy chủ chỉ sử dụng CPU Grace của hãng, điều mà Jensen Huang đã nhắc đến trong cuộc họp công bố kết quả kinh doanh gần đây.
“Với sự trỗi dậy của AI, nút thắt cổ chai hiện nằm ở cấp độ điều phối tác tử, vốn được thực hiện bởi CPU”, William McGonigle nói.
Các nhà phân tích cũng kỳ vọng Nvidia sẽ giải thích rõ hơn lý do đầu tư 2 tỉ USD vào mỗi công ty Lumentum và Coherent. Cả hai đều sản xuất laser để truyền thông tin giữa các chip dưới dạng chùm tia sáng.
Việc sử dụng các tia laser này trong công nghệ gọi là co-packaged optics (quang học đồng đóng gói), có thể giúp tăng tốc kết nối giữa các chip Nvidia tại những trung tâm dữ liệu khổng lồ. Tuy nhiên hiện nay, các linh kiện này vẫn chưa được sản xuất với số lượng đủ lớn để theo kịp lượng chip mà Nvidia bán ra mỗi năm.
Nhà phân tích Jacob Bourne cho rằng Nvidia nhiều khả năng sẽ mô tả co-packaged optics như một giải pháp quan trọng giúp kết nối các cụm máy chủ AI khổng lồ hiệu quả hơn. Tuy nhiên, thách thức lớn là phải giảm chi phí đủ thấp để công nghệ này có thể được triển khai trên quy mô lớn.