Một số gã khổng lồ internet Trung Quốc thực hiện các đơn đặt hàng trị giá 5 tỉ USD để mua số lượng lớn bộ xử lý đồ họa (GPU) Nvidia A800, rất cần thiết để xây dựng các hệ thống generative AI, theo trang Financial Times.
Baidu, ByteDance (chủ sở hữu của TikTok), Tencent và Alibaba đã thực hiện các đơn đặt hàng trị giá tổng cộng 1 tỉ USD để mua khoảng 100.000 GPU A800 từ Nvidia (Mỹ) và giao trong năm nay, Financial Times đưa tin, trích dẫn nhiều người quen thuộc với vấn đề này.
Ngoài ra, các công ty Trung Quốc cũng mua thêm số lượng lớn GPU Nvidia trị giá 4 tỉ USD, sẽ được giao vào năm 2024, theo Financial Times.
Người phát ngôn Nvidia sẽ không giải thích chi tiết về thông tin của Financial Times nhưng nói rằng "các công ty internet tiêu dùng và nhà cung cấp đám mây đầu tư hàng tỉ USD vào các thành phần của trung tâm dữ liệu mỗi năm, thường đặt hàng trước nhiều tháng".
Baidu, ByteDance, Tencent và Alibaba không trả lời câu hỏi của Reuters về chuyện này.
Financial Times công bố thông tin trên khi Tổng thống Biden vừa ký sắc lệnh hành pháp cấm một số khoản đầu tư của Mỹ vào công nghệ nhạy cảm ở Trung Quốc và yêu cầu chính phủ thông báo về việc tài trợ trong các lĩnh vực công nghệ khác.
Sắc lệnh này cho phép Bộ trưởng Tài chính Mỹ có quyền cấm hoặc hạn chế các khoản đầu tư của Mỹ vào các thực thể Trung Quốc trong ba lĩnh vực: Bán dẫn và vi điện tử, công nghệ thông tin lượng tử và một số hệ thống trí tuệ nhân tạo cụ thể.
Vào tháng 10.2022, chính quyền Biden đã ban hành một bộ quy tắc sâu rộng để đóng băng ngành công nghiệp bán dẫn Trung Quốc, trong khi Mỹ rót hàng tỉ USD trợ cấp cho ngành công nghiệp chip nước này.
Chính phủ Mỹ được cho đang xem xét hạn chế quyền truy cập của các công ty Trung Quốc vào các dịch vụ điện toán đám mây Mỹ, điều này sẽ ngăn Amazon Web Services và Microsoft sử dụng sức mạnh chip AI tiên tiến để mang lại lợi ích cho khách hàng đại lục, theo tờ The Wall Street Journal.
Mỹ được cho cũng đang xem xét động thái đưa GPU Nvidia A800 vào lệnh cấm xuất khẩu, The Wall Street Journal đưa tin.
Trước đó, Nvidia nỗ lực bán A800, phiên bản giảm hiệu suất của hai GPU chủ lực A100 và H100, cho Trung Quốc để tuân thủ các hạn chế từ Mỹ và duy trì việc cung ứng cho khách hàng ở quốc gia châu Á, nơi các dự án phát triển AI mới nở rộ để tạo ra các dịch vụ tương tự ChatGPT của OpenAI.
Vào tháng 8.2022, Bộ Thương mại Mỹ đã áp đặt lệnh cấm Nvidia và AMD bán một số chip tiên tiến cho Trung Quốc. Nvidia được hướng dẫn ngừng bán GPU A100 và H100, trong khi AMD bị ngăn xuất khẩu chip MI250 sang Trung Quốc. Điều này khiến cho ngành công nghiệp AI của Trung Quốc phải tìm mua nguồn cung hạn chế các loại chip tiên tiến từ Nvidia, công ty gần như độc quyền về GPU được sử dụng để huấn luyện hệ thống AI.
Nhu cầu lớn từ Trung Quốc đã tạo ra một thị trường ngầm buôn lậu các GPU, chẳng hạn Nvidia A100 và H100.
Theo trang web của Nvidia, A100 cung cấp sức mạnh cho các trung tâm dữ liệu hàng đầu thế giới được sử dụng cho AI, phân tích dữ liệu và các ứng dụng điện toán hiệu suất cao.
Nếu Mỹ thắt chặt quy tắc xuất khẩu, Nvidia sẽ bị ảnh hưởng nặng nề. Vị thế vững chắc trên thị trường chip AI đã giúp vốn hóa thị trường của Nvidia lên hơn 1.000 tỉ USD. Trung Quốc mang lại khoảng 1/5 doanh thu cho Nvidia vào năm 2022.
Vào tháng 6, Giám đốc tài chính Nvidia cho biết rằng các hạn chế xuất khẩu chip AI sang Trung Quốc "sẽ dẫn đến việc ngành công nghiệp Mỹ mất cơ hội vĩnh viễn", dù công ty dự kiến sẽ không có tác động vật chất ngay lập tức.
Lý do chính quyền Biden xem xét cấm xuất khẩu H800 sang Trung Quốc
Các chuyên gia trong ngành nói với Reuters rằng H800 có thể mất thời gian lâu hơn từ 10 - 30% để thực hiện một số tác vụ AI và giá có khả năng đắt gấp đôi chip nhanh nhất của Nvidia tại Mỹ (A100 và H100).
Ngay cả những GPU Nvidia bị giảm hiệu suất cũng là sự cải tiến cho các công ty Trung Quốc. Tencent, một trong những hãng công nghệ lớn nhất Trung Quốc, ước tính rằng các hệ thống sử dụng Nvidia H800 sẽ giảm hơn một nửa thời gian đào tạo AI lớn nhất của họ, từ 11 ngày xuống còn 4 ngày.
Các cuộc đối thoại giữa chính phủ và ngành công nghiệp tiết lộ thách thức của Mỹ để làm Trung Quốc chậm tiến độ trong lĩnh vực công nghệ cao mà không gây thiệt hại cho các công ty Mỹ.
Một phần chiến lược của chính quyền Biden khi đặt ra các quy định là tránh cho người Trung Quốc bị sốc đến mức bỏ các chip Mỹ hoàn toàn và tăng gấp đôi nỗ lực phát triển chip của chính họ.
"Chính quyền Biden phải vạch ra ranh giới ở đâu đó. Bất cứ nơi nào được vạch ra, họ sẽ gặp phải thách thức là làm thế nào để không gây đảo lộn ngay lập tức, nhưng cũng phải làm suy giảm năng lực của Trung Quốc theo thời gian", theo một giám đốc ngành chip yêu cầu giấu tên.
Các hạn chế xuất khẩu có hai phần. Đầu tiên đặt giới hạn cho khả năng tính toán các con số cực kỳ chính xác của chip - biện pháp được thiết kế để hạn chế các siêu máy tính có thể được sử dụng trong nghiên cứu quân sự. Các nguồn tin trong ngành công nghiệp chip cho biết đó là một biện pháp hiệu quả. Song, việc tính toán các con số cực kỳ chính xác ít liên quan hơn trong công việc AI như các mô hình ngôn ngữ lớn, trong đó việc chip xử lý khối lượng lớn dữ liệu lại quan trọng hơn.
Nvidia đang bán H800 cho các hãng công nghệ lớn nhất Trung Quốc như Tencent, Alibaba và Baidu để sử dụng trong công việc như vậy, dù vẫn chưa vận chuyển chip này với số lượng lớn.
Theo Nvidia, Trung Quốc là khách hàng quan trọng với công nghệ của Mỹ.
"Các biện pháp kiểm soát xuất khẩu hồi tháng 10.2022 của Mỹ yêu cầu chúng tôi tạo ra các sản phẩm có khoảng cách ngày càng lớn giữa hai thị trường. Chúng tôi tuân thủ quy định trong khi cung cấp các sản phẩm cạnh tranh nhất có thể ở mỗi thị trường", Nvidia cho hay.
Bill Dally, nhà khoa học chính của Nvidia, nói rằng “khoảng cách này sẽ tăng nhanh theo thời gian khi các yêu cầu đào tạo AI tiếp tục tăng gấp đôi sau mỗi 6 đến 12 tháng”.
Giới hạn thứ hai của Mỹ là về tốc độ truyền giữa chip với chip, điều này ảnh hưởng đến AI. Các mô hình đằng sau các công nghệ như ChatGPT quá lớn để vừa với một chip. Thay vào đó, chúng phải được trải rộng trên nhiều chip, thường là hàng ngàn chip cùng lúc, tất cả đều cần giao tiếp với nhau.
Nvidia chưa tiết lộ chi tiết hiệu suất của chip H800 chỉ dành cho Trung Quốc, nhưng một bảng thông số kỹ thuật mà Reuters đã xem cho thấy tốc độ giữa chip với chip là 400 gigabyte/giây, thấp hơn một nửa so với tốc độ tối đa 900 gigabyte/giây của chip Nvidia H100 hàng đầu có sẵn bên ngoài Trung Quốc.
Một số người trong ngành công nghiệp AI tin rằng tốc độ như vậy vẫn còn cao. Naveen Rao, Giám đốc điều hành công ty khởi nghiệp MosaicML (Mỹ) chuyên hỗ trợ các mô hình AI chạy tốt hơn trên phần cứng hạn chế, ước tính hệ thống dùng Nvidia H800 sẽ bị chậm từ 10 - 30%.
"Có nhiều cách để vượt qua những điều này bằng thuật toán. Tôi không thấy đây là một ranh giới trong khoảng thời gian rất dài, chẳng hạn 10 năm", Naveen Rao nói.
Tiền bạc sẽ giải quyết được vấn đề. GPU Nvidia H800 tại Trung Quốc mất gấp đôi thời gian để hoàn thành tác vụ huấn luyện AI so với H100 ở Mỹ, nhưng vẫn có thể hoàn thành công việc.
“Khi đó, bạn phải chi 20 triệu USD thay vì 10 triệu USD để huấn luyện AI. Điều đó có tệ không? Có. Thế nhưng, việc này không phải là vấn đề với Alibaba hay Baidu", một nguồn tin trong ngành (yêu cầu giấu tên) cho hay.
Hơn nữa, các nhà nghiên cứu AI đang cố gắng thu gọn các hệ thống khổng lồ mà họ đã xây dựng để cắt giảm chi phí huấn luyện các sản phẩm tương tự ChatGPT và các quy trình khác. Những thứ đó sẽ yêu cầu ít chip hơn, giảm giao tiếp giữa chip với chip và giảm tác động của việc Mỹ giới hạn tốc độ.