Nhịp đập khoa học

Lý do Trung Quốc vẫn chạy sau Mỹ trong cuộc đua AI do ChatGPT khởi xướng

Sơn Vân • 10/12/2023 11:57

Từ những năm 2010 trở đi, Trung Quốc đã cạnh tranh với Mỹ về trí tuệ nhân tạo (AI) và vượt trội ở vài lĩnh vực, chẳng hạn nhận dạng khuôn mặt. Năm 2017, Trung Quốc đã công bố “Kế hoạch phát triển trí tuệ nhân tạo thế hệ tiếp theo”, đặt ra mục tiêu cuối cùng là trở thành nước dẫn đầu toàn cầu về AI vào 2030.

Tuy nhiên, thế giới đã thay đổi vào tháng 11.2022 với việc OpenAI (công ty khởi nghiệp có trụ sở tại thành phố San Francisco, Mỹ) ra mắt ChatGPT, chatbot AI dựa trên mô hình ngôn ngữ lớn GPT-3.5. OpenAI đã được gã khổng lồ công nghệ Microsoft (Mỹ) tài trợ hơn 10 tỉ USD.

Mô hình ngôn ngữ lớn là các thuật toán AI học sâu có thể nhận dạng, tóm tắt, dịch, dự đoán và tạo nội dung bằng cách sử dụng các tập dữ liệu rất lớn.

Trong khi ChatGPT thúc đẩy các hãng công nghệ Trung Quốc đua nhau phát triển chatbot AI để cạnh tranh, từ Ernie Bot của Baidu đến Tongyi Qianwen của Alibaba, thì lĩnh vực này vẫn do các công ty Mỹ dẫn đầu, với OpenAI gần đây đã phát hành mô hình ngôn ngữ lớn GPT-4 Turbo và Google tạo dấu ấn với Gemini.

Trung Quốc đạt được những bước tiến, điển hình là Baidu ra mắt chatbot AI vào tháng 3 và hiện cung cấp gói chuyên nghiệp cho phép người dùng truy cập Ernie Bot 4.0 với giá 59,9 nhân dân tệ (8,18 USD) mỗi tháng, song vẫn còn những rào cản.

Thị trường đông đúc với hơn 100 mô hình ngôn ngữ lớn của Trung Quốc bị hạn chế khả năng tiếp cận chip AI tiên tiến, quy định nghiêm ngặt, kiểm duyệt các chủ đề nhạy cảm, chi phí phát triển cao và thị trường công nghệ phân mảnh.

Su Lian Jye, nhà phân tích chính của công ty nghiên cứu Omdia, chia sẻ với trang SCMP: “Trung Quốc phải đối mặt với nhiều thách thức trong việc phát triển mô hình ngôn ngữ lớn khi khoảng cách công nghệ ngày càng lớn với phương Tây do sự ra đời của GPT-4 Turbo và Gemini. Các giới hạn về sức mạnh tính toán do lệnh cấm chip và chất lượng dữ liệu hạn chế từ internet dựa trên tiếng Quan Thoại so với thế giới nói tiếng Anh, cũng có thể là những trở ngại”.

Một số người cho rằng nỗ lực tăng tốc AI của Trung Quốc đã được thúc đẩy vào năm 2017 khi AlphaGo, chương trình máy tính từ DeepMind của Google, đánh bại kỳ thủ cờ vây hàng đầu thế giới Ke Jie với tỷ số 3-0. Cờ vây đã được chơi ở Trung Quốc từ thời nhà Chu cổ đại. Bây giờ, cường quốc châu Á này một lần nữa phải chạy đua với thời gian.

ly-do-trung-quoc-van-chay-sau-my-trong-cuoc-dua-ai-do-chatgpt-khoi-xuong.jpg — Sự xuất hiện của ChatGPT thúc đẩy các hãng công nghệ Trung Quốc đua nhau phát triển các chatbot AI - Ảnh: SCMP

Thách thức lớn nhất với Trung Quốc thiếu khả năng tiếp cận các bộ xử lý đồ họa (GPU) tiên tiến từ Nvidia do lệnh trừng phạt thương mại của Mỹ.

Những GPU này, gồm cả Nvidia H100 có giá khoảng 30.000 USD mỗi cái, được coi là trái tim của các mô hình ngôn ngữ lớn mới nhất, phần lớn quyết định sức mạnh của mô hình và Microsoft, Meta Platforms, Google, Amazon, Oracle đều đầu tư mạnh vào đó.

Tuy nhiên, các hãng công nghệ Trung Quốc có nguồn vốn dồi dào đang phải đối mặt với việc hạn chế mua GPU Nvidia. Năm ngoái, chính phủ Mỹ đã cập nhật các quy tắc kiểm soát xuất khẩu để chặn Trung Quốc mua các chip tiên tiến của Nvidia như H100 và A100 vì lý do an ninh quốc gia.

Nvidia (hãng chip có giá trị nhất thế giới, đặt trụ sở tại bang California, Mỹ) đã cố gắng giảm bớt căng thẳng khi sản xuất A800 và H800 (biến thể chậm hơn của A100 và H100) cho khách hàng Trung Quốc, tạo cơ hội để những công ty như Tencent và ByteDance tích trữ. Trung Quốc đóng góp hơn 22% doanh thu của Nvidia, chỉ sau Đài Loan và Mỹ.

Song đến tháng 10, chính phủ Mỹ lại thắt chặt kiểm soát xuất khẩu chip AI, khiến Nvidia không thể bán A800, H800 cho Trung Quốc và đe dọa sẽ cấm mọi giải pháp thay thế trong tương lai.

Phát biểu tại Diễn đàn Quốc phòng Reagan ở bang California hồi đầu tháng này, Bộ trưởng Thương mại Mỹ - Gina Raimondo cho biết: “Nếu bạn thiết kế lại một chip xung quanh một đường cắt cụ thể cho phép Trung Quốc thực hiện AI, tôi sẽ kiểm soát nó ngay vào ngày hôm sau".

ly-do-trung-quoc-van-chay-sau-my-trong-cuoc-dua-ai-do-chatgpt-khoi-xuong1.jpg — Thách thức lớn nhất với Trung Quốc là thiếu khả năng tiếp cận các GPU tiên tiến từ Nvidia do lệnh trừng phạt thương mại của Mỹ - Ảnh: SCMP

Wang Shuyi, giáo sư tập trung vào AI và học máy tại Đại học Sư phạm Thiên Tân, nói sức mạnh tính toán không đủ là một trong những trở ngại chính với việc phát triển mô hình AI ở Trung Quốc.

“Trung Quốc sẽ ngày càng khó tiếp cận được chip tiên tiến. Ngay cả với các công ty Trung Quốc có tiền nhưng không có sức mạnh tính toán, họ sẽ không thể sử dụng đầy đủ các nguồn dữ liệu chất lượng cao”, Wang Shuyi nói.

Với việc các công ty trong nước vẫn còn tụt hậu trong lĩnh vực sản xuất chip, Trung Quốc sẽ khó có thể sớm vượt qua những hạn chế này.

Dù đang phát triển mô hình ngôn ngữ lớn Tongyi Qianwen, được coi là một trong những phản ứng tốt nhất của Trung Quốc với GPT-4, Alibaba gần đây đã quyết định hoãn việc tách đơn vị đám mây, viện dẫn những bất ổn do các hạn chế xuất khẩu mở rộng của Mỹ với chip tiên tiến.

Vào tháng trước, gã khổng lồ game và truyền thông xã hội Tencent cũng cảnh báo rằng những hạn chế của Mỹ với việc bán chip tiên tiến sang Trung Quốc cuối cùng sẽ ảnh hưởng đến các dịch vụ đám mây của họ, dù hãng có một kho dự trữ lớn chip Nvidia AI.

“Những công ty bị ảnh hưởng nặng nề nhất là các hãng công nghệ lớn đã đặt mua chip AI trị giá hàng tỉ USD mà Nvidia không thể giao được, điều này sẽ ảnh hưởng đến khả năng cung cấp dịch vụ của họ thông qua đám mây trong tương lai”, theo Chen Yu, đối tác tại hãng đầu tư mạo hiểm Yunqi Partners, người hỗ trợ cho công ty khởi nghiệp về AI MiniMax.

Baidu, Alibaba, Tencent và ByteDance được dự đoán mua 125.000 GPU Nvidia H100 (chiếm 20% tổng số lô hàng H100 trong năm 2023), theo dữ liệu từ Omdia.

Tuy nhiên, Chen Yu chỉ ra rằng các công ty khởi nghiệp Trung Quốc có một số biện pháp bảo vệ vì có thể tận dụng khả năng tính toán của các dịch vụ đám mây công cộng toàn cầu mà không bị hạn chế.

Dù vậy, các lệnh trừng phạt của Mỹ đã tác động mạnh đến Trung Quốc. Khi các công ty Mỹ từ OpenAI đến Nvidia giành được sự chú ý nhờ vai trò trong việc đưa generative AI (AI tạo sinh) ra thế giới, một số ngôi sao AI sáng giá nhất Trung Quốc từ vài năm trước, chẳng hạn SenseTime, phải vật lộn để kiếm được lợi nhuận dưới sự hạn chế của chính quyền Biden.

Một doanh nhân AI giấu tên tại thành phố Hàng Châu (Trung Quốc) cho biết: “Một số công ty, gồm cả iFlyTek, đang hợp tác với Huawei để tìm các giải pháp nhằm vượt qua các giới hạn về chip, nhưng nỗ lực của họ vẫn bị cản trở do thiếu hệ sinh thái đào tạo AI trưởng thành, chẳng hạn CUDA của Nvidia”.

Trong khi đó, các mô hình ngôn ngữ lớn nước ngoài như dòng GPT của OpenAI và Google Gemini vẫn chưa có sẵn trực tiếp tại Trung Quốc do các yêu cầu quy định nghiêm ngặt.

Cục Quản lý Không gian mạng Trung Quốc, cơ quan quản lý internet của Trung Quốc, đã triển khai các quy định mạnh mẽ về AI (có hiệu lực từ ngày 15.8) yêu cầu đánh giá mô hình ngôn ngữ lớn và giám sát sự phát triển của chúng, gồm cả dữ liệu đầu vào và đầu ra. Ví dụ Baidu đã phải chạy Ernie Bot ở “chế độ dùng thử” trong nhiều tháng trước khi được chấp thuận sử dụng rộng rãi.

Sự khác biệt về cấu trúc ngôn ngữ giữa tiếng Anh và tiếng Quan Thoại cũng như sự nhạy cảm xung quanh các vấn đề chính trị (các chatbot AI ở Trung Quốc thường trả lời các câu hỏi tế nhị trong các bài kiểm tra của người dùng) cũng đồng nghĩa có sự phân chia rõ ràng giữa thị trường trong nước với thị trường toàn cầu.

Ví dụ chatbot Google Bard có mặt ở “230 quốc gia và vùng lãnh thổ” và chỉ vắng mặt ở một số nơi như Trung Quốc đại lục, Hồng Kông, Iran và Triều Tiên, theo thông tin của công ty.

Các công ty Trung Quốc cũng có nguy cơ hao tốn tiền bạc và công sức. Tính đến tháng 7, 130 mô hình ngôn ngữ lớn đã được các công ty và viện nghiên cứu Trung Quốc tung ra thị trường, dẫn đến cái được gọi là “cuộc chiến giữa hàng trăm mô hình ngôn ngữ lớn”.

Robin Li Yanhong, đồng sáng lập và Giám đốc điều hành gã khổng lồ tìm kiếm Baidu, nói vào tháng trước rằng việc ra mắt nhiều mô hình ngôn ngữ lớn để cạnh tranh ở Trung Quốc là “sự lãng phí tài nguyên rất lớn” và các công ty nên tập trung nhiều hơn vào các ứng dụng AI.

Luo Yuchen, Giám đốc điều hành hãng Shenzhen Yantu Intelligence and Innovation, cho biết: “Hiện tại, không có nền tảng nào nổi lên chiếm ưu thế về mặt công nghệ hoặc quy mô thị trường”. Tuy nhiên, Luo Yuchen nói thêm rằng việc phát triển mô hình ngôn ngữ lớn nên tiếp tục vì ngay cả GPT-4 cũng có thể không đủ tốt để giúp các công ty giải quyết các công việc hàng ngày do con người xử lý.

Wang Xiaochuan, Giám đốc điều hành công ty khởi nghiệp AI Baichuan, phát biểu tại một diễn đàn công nghệ của Tencent vào tuần trước tại Bắc Kinh (thủ đô Trung Quốc) rằng nhiều công ty nên hạn chế đào tạo mô hình AI riêng và “thay vào đó hãy tập trung nỗ lực tìm kiếm các sản phẩm AI có tính thương mại, có thể mở rộng bằng cách khai thác những mô hình AI hiện có thông qua dịch vụ đám mây”.

Trong khi đó, Baidu và Alibaba dường như đã vạch ra con đường khác nhau để phát triển AI.

Alibaba Cloud đã cung cấp mô hình AI Qwen-72B nguồn mở cho mục đích nghiên cứu và thương mại trên nền tảng học máy Hugging Face và cộng đồng mã nguồn mở ModelScope của riêng họ. Điều này diễn ra sau động thái Meta Platforms mở mã nguồn mô hình Llama2 vào tháng 7.

Alibaba Cloud cho biết cộng đồng nguồn mở rất quan trọng cho việc phát triển các mô hình và ứng dụng dựa trên AI. Alibaba Cloud đã cung cấp bốn biến thể mô hình ngôn ngữ lớn Tongyi Qianwen độc quyền của mình cho các cộng đồng nguồn mở kể từ tháng 8.

Ngược lại, Baidu đã nói rằng mô hình ngôn ngữ lớn Ernie của họ sẽ vẫn độc quyền. Shen Dou, người đứng đầu Nhóm đám mây AI của Baidu, đã chỉ ra rằng mô hình ngôn ngữ lớn nền tảng nguồn mở có thể gặp khó khăn do “thiếu các vòng phản hồi hiệu quả” và chi phí nâng cấp lớn.

AI chắc chắn là công việc kinh doanh tốn kém. Việc xây dựng và đào tạo mô hình ngôn ngữ lớn đòi hỏi hàng ngàn chip AI tiên tiến để xử lý lượng dữ liệu khổng lồ, chưa tính đến tiền lương của các kỹ sư được đào tạo bài bản.

Ví dụ mô hình Llama của Meta Platforms đã sử dụng 2.048 GPU Nvidia A100 để đào tạo trên 1.400 tỉ mã thông tin và mất khoảng 21 ngày, theo trang CNBC.

Rõ ràng là Trung Quốc đang gặp khó khăn trong việc tìm nguồn cung ứng chip và sức mạnh tính toán tiên tiến, nhưng nước này có quyền truy cập vào kho dữ liệu khổng lồ và hàng loạt ứng dụng thị trường. Đây là hai lợi thế được Chủ tịch Trung Quốc - Tập Cận Bình nêu bật của cách đây 5 năm. Ngoài ra, Trung Quốc còn có vô số doanh nhân đầy tài năng.

Ví dụ Lee Kai-fu (Lý Khai Phục), nhà đầu tư mạo hiểm nổi tiếng và cựu Chủ tịch Google Trung Quốc, đã biến công ty khởi nghiệp AI 01.AI của mình thành một dự án kinh doanh trị giá 1 tỉ USD chỉ trong vòng 8 tháng, bất chấp một số tranh cãi về việc sử dụng cấu trúc mô hình ngôn ngữ lớn Llama của Meta Platforms.

Các hãng lớn Trung Quốc đặt mục tiêu kiếm tiền từ công nghệ dưới hình thức này hay hình thức khác.

Nhà phân tích Su Lian Jye nói: “Dù mở hay đóng, AI về cơ bản vẫn là công cụ thúc đẩy hoạt động kinh doanh trên nền tảng đám mây trong mắt các nhà cung cấp dịch vụ đám mây. Các nhà cung cấp dịch vụ đám mây này, dù là Tencent hay Huawei, cuối cùng đều có ý định kiếm tiền từ việc cho nhà phát triển AI thuê khả năng lưu trữ và tính toán dựa trên nền tảng của họ”.