AI & Blockchain

Cuộc đua AI sắp tới không còn là 'Ai to hơn' mà là 'Ai tiết kiệm hơn'

Bùi Tú • 24/12/2025 12:20

Trong suốt hai năm qua, thung lũng Silicon và các trung tâm công nghệ toàn cầu đã bị cuốn vào một cuộc đua AI quay cuồng mang tên "quy mô".

Cuộc đua AI chuyển sang ai tiết kiệm và thông minh hơn

Các gã khổng lồ công nghệ đua nhau xây dựng những mô hình ngôn ngữ lớn nhất, mua sắm nhiều chip đồ họa (GPU) nhất và vẽ ra những trung tâm dữ liệu tiêu thụ điện năng ngang ngửa một thành phố. Tuy nhiên, theo Chris Kelly, cựu Giám đốc Quyền bảo mật (CPO) của Facebook, bữa tiệc xa hoa của sự hoang phí này đang đi đến hồi kết. Nhận định trên chương trình "Squawk Box" của CNBC vào 23.12 vừa qua, ông Kelly khẳng định rằng trục xoay tiếp theo của ngành công nghiệp AI sẽ không còn nằm ở việc mở rộng quy mô bất chấp, mà là cuộc đua sống còn về hiệu suất (efficiency) và tối ưu hóa chi phí.

Khi những hóa đơn năng lượng bắt đầu chạm ngưỡng không tưởng và lưới điện quốc gia phát tín hiệu cảnh báo đỏ. Người chiến thắng sẽ không phải là kẻ chi tiền mạnh tay nhất, mà là kẻ biết cách mô phỏng sự tinh gọn của bộ não con người – cỗ máy tư duy vĩ đại chỉ vận hành với vỏn vẹn 20 watt điện.

Từ những "quái vật" Gigawatt đến bài học từ bộ não 20 Watt

Bối cảnh hiện tại của hạ tầng AI được ví như một cơn sốt vàng, nơi những chiếc xẻng và cuốc chim chính là các trung tâm dữ liệu (data center) khổng lồ. Số liệu từ S&P Global cho thấy chỉ trong năm 2025, thị trường trung tâm dữ liệu đã chứng kiến các thương vụ hạ tầng trị giá hơn 61 tỷ USD. Các "hyperscalers" (những gã khổng lồ điện toán đám mây) đang lao vào một cuộc chạy đua xây dựng điên cuồng trên toàn cầu. Điển hình nhất là OpenAI, với những cam kết đầu tư lên tới 1,4 nghìn tỷ USD trong vài năm tới, bao gồm các quan hệ đối tác chiến lược với "vua chip" Nvidia và các ông lớn hạ tầng như Oracle hay Coreweave.

Tuy nhiên, sự phình to này đang chạm đến giới hạn vật lý của nó - năng lượng. Chris Kelly đã đưa ra một so sánh đầy hình tượng nhưng cũng rất thực tế: "Chúng ta vận hành bộ não của mình chỉ với 20 watt năng lượng. Chúng ta không cần những trung tâm điện năng hàng gigawatt để tư duy và suy luận". Lời cảnh báo này được đưa ra trong bối cảnh Nvidia và OpenAI vừa công bố một dự án vào tháng 9 bao gồm các trung tâm dữ liệu có công suất ít nhất 10 gigawatt. Để hình dung, 10 gigawatt tương đương với mức tiêu thụ điện năng hàng năm của 8 triệu hộ gia đình Mỹ, hoặc bằng nhu cầu điện năng cao điểm vào mùa hè của cả thành phố New York trong năm 2024.

Việc xây dựng những "con quái vật" tiêu thụ năng lượng này đang đặt một áp lực khủng khiếp lên lưới điện vốn đã căng thẳng của Hoa Kỳ. Không chỉ là vấn đề môi trường, đây là vấn đề về tính khả thi kinh tế. Nếu chi phí điện năng tiếp tục tăng cao, biên lợi nhuận của các mô hình AI sẽ bị bào mòn đến mức không thể duy trì. Kelly nhận định rằng chìa khóa của giai đoạn tiếp theo nằm ở việc "hợp lý hóa" (streamline) các quy trình xây dựng tốn kém này.

Các công ty công nghệ buộc phải tìm ra cách để AI "học" và "suy luận" với ít năng lượng hơn. Những đột phá về thuật toán nén dữ liệu, chip chuyên dụng tiết kiệm điện (ASIC) hay các phương pháp làm mát trung tâm dữ liệu tiên tiến sẽ trở thành "chén thánh" mới. Doanh nghiệp nào giải được bài toán giảm chi phí vận hành trung tâm dữ liệu sẽ nổi lên như những người chiến thắng thực sự, thay vì những kẻ chỉ biết đốt tiền để mua thị phần.

"Hiệu ứng DeepSeek" và áp lực từ bên kia bán cầu

Động lực thúc đẩy sự chuyển dịch sang hiệu suất không chỉ đến từ áp lực năng lượng nội tại, mà còn đến từ một cú sốc ngoại sinh mang tên "Trung Quốc". Chris Kelly dự báo sẽ có "một số lượng lớn người chơi Trung Quốc xuất hiện và chiếm lĩnh vị thế", đặc biệt là sau khi một startup bí ẩn có tên DeepSeek làm rung chuyển thung lũng Silicon.

Vào tháng 12.2024, DeepSeek đã tung ra một mô hình ngôn ngữ lớn (LLM) mã nguồn mở, miễn phí với tuyên bố gây sốc: chi phí huấn luyện mô hình này chỉ dưới 6 triệu USD. Con số này thấp hơn đáng kể, thậm chí chỉ bằng một phần nhỏ so với hàng trăm triệu USD mà các đối thủ Mỹ như Google hay OpenAI phải bỏ ra để huấn luyện các mô hình có năng lực tương đương (như GPT-4 hay Gemini). Sự xuất hiện của DeepSeek đã chứng minh rằng người ta không nhất thiết phải cần đến hàng chục nghìn GPU H100 đắt đỏ nhất để tạo ra trí tuệ nhân tạo đỉnh cao, nếu họ có những thuật toán tối ưu và kiến trúc mô hình thông minh hơn (như kiến trúc Mixture-of-Experts).

Cú hích từ Trung Quốc càng trở nên mạnh mẽ hơn sau quyết định gần đây của Tổng thống Donald Trump về việc phê duyệt bán dòng chip H200 tiên tiến của Nvidia cho quốc gia này. Mặc dù động thái này có thể gây tranh cãi về mặt an ninh quốc gia, nhưng dưới góc nhìn thương mại, nó sẽ cung cấp thêm hỏa lực cho các công ty AI Trung Quốc. Kelly nhận định rằng các mô hình mã nguồn mở, đặc biệt là từ Trung Quốc, sẽ dân chủ hóa quyền truy cập vào "các cấp độ tính toán cơ bản". Điều này sẽ tạo ra một áp lực giảm giá khủng khiếp lên các dịch vụ AI của Mỹ.

Khi các mô hình "giá rẻ nhưng chất lượng cao" tràn ngập thị trường, các công ty Mỹ không thể tiếp tục duy trì mô hình kinh doanh dựa trên chi phí hạ tầng đắt đỏ. Họ buộc phải quay trở lại bài toán hiệu suất mà Kelly đã đề cập. Cuộc chiến AI đang chuyển từ giai đoạn "Ai có mô hình thông minh nhất?" sang "Ai cung cấp trí tuệ đó với chi phí rẻ nhất?". Kỷ nguyên của sự hoang phí đã qua, và năm 2026 sẽ là năm của sự tinh gọn, nơi AI tác nhân (agentic AI) và AI tạo sinh phải chứng minh được hiệu quả kinh tế trên từng watt điện tiêu thụ.

Bùi Tú