Google tách riêng chip huấn luyện và suy luận AI, đấu với Nvidia
Sau nhiều năm sản xuất chip vừa huấn luyện mô hình AI vừa xử lý công việc suy luận, Google đang tách riêng hai nhiệm vụ này trong nỗ lực cạnh tranh với Nvidia.
Google hôm 22/4 cho biết sẽ thực hiện thay đổi này với thế hệ thứ 8 của TPU (tensor processing unit) do hãng phát triển. Cả hai loại chip AI này sẽ được cung cấp cuối năm 2026.
“Với sự trỗi dậy của các tác tử AI, chúng tôi nhận thấy cộng đồng sẽ hưởng lợi từ các chip được chuyên biệt hóa riêng cho nhu cầu huấn luyện và triển khai”, ông Amin Vahdat, Phó chủ tịch cấp cao kiêm giám đốc công nghệ AI và hạ tầng của Google, cho biết.
TPU là loại chip do Google phát triển từ năm 2015, được thiết kế chuyên phục vụ các tác vụ liên quan đến AI. Nhờ được tối ưu cho một nhiệm vụ, TPU có thể huấn luyện và vận hành các mô hình AI lớn nhanh hơn, hiệu quả hơn và tiết kiệm điện hơn so với nhiều loại chip truyền thống.
Vào tháng 3, Nvidia đã giới thiệu các dòng chip sắp ra mắt có khả năng giúp các mô hình AI phản hồi nhanh chóng trước câu hỏi của người dùng, nhờ công nghệ có được trong thương vụ với công ty khởi nghiệp chip Groq.
Tháng 12/2025, Nvidia chi khoảng 20 tỉ USD để mua tài sản và giấy cấp phép công nghệ của Groq, đồng thời tuyển dụng nhiều lãnh đạo của công ty này. Đây là thương vụ lớn nhất trong lịch sử Nvidia.
Groq chuyên phát triển chip để tăng tốc xử lý AI, đặc biệt là phần suy luận. Nếu Nvidia nổi tiếng với GPU (bộ xử lý đồ họa) dùng để huấn luyện AI, thì Groq tập trung vào việc giúp AI trả lời nhanh hơn sau khi đã được huấn luyện. Điểm khác biệt là Groq tự phát triển một loại chip riêng gọi là LPU (Language Processing Unit), tối ưu cho các tác vụ AI như tạo văn bản, viết mã…
Groq được thành lập bởi những người tạo ra TPU của Google. Groq 3 LPU được xây dựng để nâng cao công nghệ này, với một lõi được thiết kế để xử lý suy luận AI với độ trễ thấp, hoạt động bổ trợ cho GPU.

Google tiên phong phát triển chip AI tùy chỉnh
Google là khách hàng lớn của Nvidia, nhưng đồng thời cũng cung cấp TPU như một lựa chọn thay thế cho các doanh nghiệp sử dụng dịch vụ đám mây của mình.
Phần lớn hãng công nghệ hàng đầu thế giới đang theo đuổi việc phát triển chip tùy chỉnh cho AI nhằm tối ưu hiệu suất và phục vụ các trường hợp sử dụng chuyên biệt.
Apple đã tích hợp Neural Engine (bộ xử lý AI chuyên dụng) vào chip iPhone do hãng tự thiết kế trong nhiều năm qua. Microsoft công bố chip AI thế hệ thứ hai vào tháng 1. Tuần trước, Meta cho biết đang hợp tác với Broadcom để phát triển nhiều phiên bản chip AI.
Google là một trong những công ty tiên phong trong xu hướng này. Năm 2015, Google bắt đầu sử dụng các chip tự thiết kế để chạy mô hình AI và cho khách hàng đám mây thuê từ 2018. Amazon Web Services công bố chip Inferentia để xử lý yêu cầu AI vào năm 2018 và ra mắt chip Trainium cho huấn luyện AI từ 2020.
Vào tháng 9/2025, các nhà phân tích của hãng dịch vụ tài chính DA Davidson ước tính rằng mảng TPU, cùng với bộ phận Google DeepMind, có thể được định giá khoảng 900 tỉ USD.
TPU 8i có thể vận hành đồng thời hàng triệu tác tử AI
Chưa có hãng công nghệ nào có thể thay thế Nvidia trên thị trường chip AI. Google thậm chí cũng không so sánh trực tiếp hiệu năng chip AI mới của mình với các GPU Nvidia. Google chỉ cho biết TPU 8t, chip huấn luyện AI mới, đạt hiệu năng cao gấp 2,8 lần so với TPU thế hệ thứ 7 là Ironwood (ra mắt tháng 11/2025) dù cùng mức giá. Trong khi đó, chip suy luận mới là TPU 8i có hiệu năng tốt hơn 80%.
Tháng trước, Nvidia thông báo LPU Groq 3 sắp ra mắt của họ sẽ sử dụng lượng lớn SRAM (bộ nhớ truy cập ngẫu nhiên tĩnh). Đây là loại bộ nhớ được sử dụng bởi Cerebras, nhà sản xuất chip AI đã nộp đơn xin niêm yết cổ phiếu vào đầu tháng 4. TPU 8i, chip suy luận mới của Google, cũng sử dụng SRAM. Mỗi TPU 8i chứa 384 MB SRAM, gấp 3 lần so với Ironwood.
“Kiến trúc này được thiết kế để cung cấp thông lượng lớn và độ trễ thấp cần thiết nhằm vận hành đồng thời hàng triệu tác tử AI với chi phí hiệu quả”, ông Sundar Pichai, Giám đốc điều hành Alphabet (công ty mẹ Google), viết trong một bài blog.
Việc ứng dụng TPU của Google đang tăng tốc. Công ty tài chính Citadel Securities đã xây dựng phần mềm nghiên cứu định lượng dựa trên TPU và tất cả 17 phòng thí nghiệm quốc gia thuộc Bộ Năng lượng Mỹ đều sử dụng phần mềm cộng tác khoa học AI được xây dựng trên các chip AI này, Google cho biết.
Hồi tháng 10/2025, Anthropic ký thỏa thuận trị giá hàng chục tỉ USD với Google. Theo đó, Anthropic sẽ được tiếp cận tới 1 triệu TPU của gã khổng lồ công nghệ Mỹ.
Thỏa thuận này dự kiến mang lại hơn 1 gigawatt năng lực tính toán vào năm 2026, để vận hành và huấn luyện mô hình AI Claude. Việc mở rộng quy mô TPU giúp Anthropic tăng tốc đáng kể cả hai khâu quan trọng là huấn luyện và suy luận, trong bối cảnh nhu cầu sử dụng AI doanh nghiệp đang bùng nổ.
Đây còn là bước đi chiến lược giúp Anthropic xây dựng nền tảng hạ tầng dài hạn. Google nhấn mạnh rằng TPU có lợi thế về hiệu năng và chi phí, cho phép xử lý các tác vụ học máy ở quy mô lớn hiệu quả hơn so với nhiều giải pháp truyền thống. Điều này đặc biệt quan trọng khi chi phí tính toán đang trở thành yếu tố quyết định trong cuộc đua AI.
Thỏa thuận đó cũng củng cố vị thế của Google như đối thủ đáng gờm của Nvidia trong lĩnh vực phần cứng AI, đồng thời đưa Anthropic trở thành một trong những khách hàng sử dụng TPU lớn nhất thế giới. Về phía Anthropic, việc đặt trước lượng lớn năng lực tính toán giúp công ty đảm bảo đủ tài nguyên để phát triển các mô hình AI thế hệ mới khi nguồn cung chip toàn cầu vẫn còn hạn chế.
Hôm 6/4, Broadcom cho biết sẽ sản xuất các phiên bản TPU trong tương lai cho Google. Ngoài ra, Broadcom còn ký một thỏa thuận bom tấn mở rộng với Anthropic, qua đó cho phép công ty khởi nghiệp AI này tiếp cận khoảng 3,5 gigawatt năng lực tính toán dựa trên các TPU của Google.