Trung Quốc công bố kế hoạch hành động dữ liệu 3 năm để thúc đẩy tăng trưởng kinh tế qua công nghệ

Nhịp đập khoa học - Ngày đăng : 11:32, 06/01/2024

Cơ quan quản lý dữ liệu mới được Trung Quốc thành lập đã công bố kế hoạch hành động 3 năm nhằm sử dụng kho thông tin khổng lồ của đất nước để thúc đẩy nền kinh tế.
Nhịp đập khoa học

Trung Quốc công bố kế hoạch hành động dữ liệu 3 năm để thúc đẩy tăng trưởng kinh tế qua công nghệ

Sơn Vân 06/01/2024 11:32

Cơ quan quản lý dữ liệu mới được Trung Quốc thành lập đã công bố kế hoạch hành động 3 năm nhằm sử dụng kho thông tin khổng lồ của đất nước để thúc đẩy nền kinh tế.

Theo kế hoạch do Cơ quan Quản lý Dữ liệu Quốc gia (NDA) công bố hôm 5.1.2024, Trung Quốc đặt mục tiêu xây dựng hơn 300 kịch bản ứng dụng đại diện vào năm 2026, phát triển ngành công nghiệp dữ liệu 20% mỗi năm và tăng cường khối lượng giao dịch dữ liệu.

NDA cho biết sáng kiến này nhằm mục đích “nuôi dưỡng” một động lực mới cho sự phát triển kinh tế Trung Quốc, tận dụng các lợi thế của đất nước gồm thị trường quy mô lớn, nguồn tài nguyên dữ liệu và trường hợp sử dụng dồi dào.

Kế hoạch của NDA liên quan đến việc huy động nguồn lực dữ liệu để hỗ trợ phát triển các mô hình ngôn ngữ lớn của Trung Quốc.

Là các thuật toán AI học sâu có thể nhận dạng, tóm tắt, dịch, dự đoán và tạo nội dung bằng cách sử dụng các tập dữ liệu rất lớn, mô hình ngôn ngữ lớn được OpenAI sử dụng để làm nền tảng cho chatbot trí tuệ nhân tạo (AI) ChatGPT. Kế hoạch này cũng sẽ tăng cường nỗ lực để những tổ chức nghiên cứu và doanh nghiệp hàng đầu xây dựng cơ sở dữ liệu trong ngành nhằm tạo ra bộ dữ liệu chất lượng cao để đào tạo các mô hình AI.

Kế hoạch chi tiết đó được đưa ra vào thời điểm nền kinh tế kỹ thuật số Trung Quốc, vốn đã phát triển nhanh chóng những năm gần đây, vẫn phải đối mặt với những thách thức gồm chất lượng thấp của nguồn cung dữ liệu, cơ chế lưu thông kém và tiềm năng ứng dụng chưa được khai thác.

NDA được giới thiệu vào tháng 3.2023 khi Trung Quốc tăng cường nỗ lực quản lý kho dữ liệu ngày càng tăng của đất nước bị phân tán trên các lĩnh vực và ngành công nghiệp khác nhau. Mục tiêu là giải phóng giá trị kinh tế, đồng thời đảm bảo an ninh và quyền riêng tư.

Trong khi Cục Quản lý Không gian mạng Trung Quốc (cơ quan giám sát internet của đất nước) đã đưa ra luật và quy định quản lý bảo mật dữ liệu, nước này không có cơ quan chính phủ giám sát các chính sách phát triển dữ liệu cho đến khi thành lập NDA.

Chính thức bắt đầu hoạt động từ tháng 10.2023, NDA được giao nhiệm vụ “điều phối và thúc đẩy xây dựng cơ sở hạ tầng dữ liệu, điều phối việc tích hợp, chia sẻ, phát triển và sử dụng tài nguyên dữ liệu” trên toàn bộ nền kinh tế và xã hội Trung Quốc, theo thông báo của cơ quan này hồi tháng 3.2023.

NDA, được thành lập dưới sự chỉ đạo của Ủy ban Cải cách và Phát triển Quốc gia (cơ quan hoạch định kinh tế hàng đầu của Trung Quốc), đứng đầu là ông Liu Liehong.

Ông Liu Liehong là cựu Chủ tịch China Unicom (nhà mạng viễn thông do nhà nước quản lý) và là chuyên gia công nghệ thông tin có kinh nghiệm.

Kế hoạch ba năm sẽ “hướng dẫn và khuyến khích” các loại vốn tư nhân khác nhau đầu tư vào ngành dữ liệu và hỗ trợ các nhà môi giới dữ liệu huy động vốn bằng cách niêm yết công khai (IPO).

NDA cũng chỉ ra 12 ngành cần sử dụng dữ liệu tốt hơn, trong đó có sản xuất, nông nghiệp, thương mại, vận tải, tài chính và CNTT.

Các chiến lược dữ liệu mới của Trung Quốc được đưa ra khi nước này đang tìm cách bắt kịp Mỹ trong việc phát triển AI, dù phải đối mặt với hàng loạt thách thức, gồm cả việc hạn chế quyền tiếp cận các chip tiên tiến.

capture.jpg
Du khách bắt tay với robot hình người trong Triển lãm Kinh tế Kỹ thuật số Quốc tế Trung Quốc 2023 tại tỉnh Hà Bắc - Ảnh: Tân Hoa Xã

Từ những năm 2010 trở đi, Trung Quốc đã cạnh tranh với Mỹ về AI và vượt trội ở vài lĩnh vực, chẳng hạn nhận dạng khuôn mặt. Năm 2017, Trung Quốc đã công bố “Kế hoạch phát triển trí tuệ nhân tạo thế hệ tiếp theo”, đặt ra mục tiêu cuối cùng là trở thành nước dẫn đầu toàn cầu về AI vào 2030.

Tuy nhiên, thế giới đã thay đổi vào tháng 11.2022 với việc OpenAI (công ty khởi nghiệp có trụ sở tại thành phố San Francisco, Mỹ) ra mắt ChatGPT, chatbot AI dựa trên mô hình ngôn ngữ lớn GPT-3.5. OpenAI đã được gã khổng lồ công nghệ Microsoft (Mỹ) tài trợ hơn 10 tỉ USD.

Trong khi ChatGPT thúc đẩy các hãng công nghệ Trung Quốc đua nhau phát triển chatbot AI để cạnh tranh, từ Ernie Bot của Baidu đến Tongyi Qianwen của Alibaba, thì lĩnh vực này vẫn do các công ty Mỹ dẫn đầu, với OpenAI gần đây đã phát hành mô hình ngôn ngữ lớn GPT-4 Turbo và Google tạo dấu ấn với Gemini.

Trung Quốc đạt được những bước tiến, điển hình là Baidu ra mắt chatbot AI vào tháng 3 và hiện cung cấp gói chuyên nghiệp cho phép người dùng truy cập Ernie Bot 4.0 với giá 59,9 nhân dân tệ (8,18 USD) mỗi tháng, song vẫn còn những rào cản.

Thị trường đông đúc với hơn 100 mô hình ngôn ngữ lớn của Trung Quốc bị hạn chế khả năng tiếp cận chip AI tiên tiến, quy định nghiêm ngặt, kiểm duyệt các chủ đề nhạy cảm, chi phí phát triển cao và thị trường công nghệ phân mảnh.

Su Lian Jye, nhà phân tích chính của công ty nghiên cứu Omdia, chia sẻ với trang SCMP: “Trung Quốc phải đối mặt với nhiều thách thức trong việc phát triển mô hình ngôn ngữ lớn khi khoảng cách công nghệ ngày càng lớn với phương Tây do sự ra đời của GPT-4 Turbo và Gemini. Các giới hạn về sức mạnh tính toán do lệnh cấm chip và chất lượng dữ liệu hạn chế từ internet dựa trên tiếng Quan Thoại so với thế giới nói tiếng Anh, cũng có thể là những trở ngại”.

Một số người cho rằng nỗ lực tăng tốc AI của Trung Quốc đã được thúc đẩy vào năm 2017 khi AlphaGo, chương trình máy tính từ DeepMind của Google, đánh bại kỳ thủ cờ vây hàng đầu thế giới Ke Jie với tỷ số 3-0. Cờ vây đã được chơi ở Trung Quốc từ thời nhà Chu cổ đại. Bây giờ, cường quốc châu Á này một lần nữa phải chạy đua với thời gian.

Thách thức lớn nhất với Trung Quốc thiếu khả năng tiếp cận các bộ xử lý đồ họa (GPU) tiên tiến từ Nvidia do lệnh trừng phạt thương mại của Mỹ. Nvidia là hãng chip có giá trị nhất thế giới, đặt trụ sở tại bang California, Mỹ.

Những GPU này, gồm cả Nvidia H100 có giá khoảng 30.000 USD mỗi cái, được coi là trái tim của các mô hình ngôn ngữ lớn mới nhất, phần lớn quyết định sức mạnh của mô hình và Microsoft, Meta Platforms, Google, Amazon, Oracle đều đầu tư mạnh vào đó.

Tuy nhiên, các hãng công nghệ Trung Quốc có nguồn vốn dồi dào đang phải đối mặt với việc hạn chế mua GPU Nvidia. Năm 2022, chính phủ Mỹ đã cập nhật các quy tắc kiểm soát xuất khẩu để chặn Trung Quốc mua các chip tiên tiến của Nvidia như H100 và A100 vì lý do an ninh quốc gia.

Nvidia đã cố gắng giảm bớt căng thẳng khi sản xuất A800 và H800 (biến thể chậm hơn của A100 và H100) cho khách hàng Trung Quốc, tạo cơ hội để những công ty như Tencent và ByteDance tích trữ. Trung Quốc đóng góp hơn 22% doanh thu của Nvidia, chỉ sau Đài Loan và Mỹ.

Song đến tháng 10.2023, chính phủ Mỹ lại thắt chặt kiểm soát xuất khẩu chip AI, khiến Nvidia không thể bán A800, H800 cho Trung Quốc và đe dọa sẽ cấm mọi giải pháp thay thế trong tương lai.

Wang Shuyi, giáo sư tập trung vào AI và học máy tại Đại học Sư phạm Thiên Tân, nói sức mạnh tính toán không đủ là một trong những trở ngại chính với việc phát triển mô hình AI ở Trung Quốc.

“Trung Quốc sẽ ngày càng khó tiếp cận được chip tiên tiến. Ngay cả với các công ty Trung Quốc có tiền nhưng không có sức mạnh tính toán, họ sẽ không thể sử dụng đầy đủ các nguồn dữ liệu chất lượng cao”, Wang Shuyi nói.

Với việc các công ty trong nước vẫn còn tụt hậu trong lĩnh vực sản xuất chip, Trung Quốc sẽ khó có thể sớm vượt qua những hạn chế này.

Dù đang phát triển mô hình ngôn ngữ lớn Tongyi Qianwen, được coi là một trong những phản ứng tốt nhất của Trung Quốc với GPT-4, Alibaba gần đây đã quyết định hoãn việc tách đơn vị đám mây, viện dẫn những bất ổn do các hạn chế xuất khẩu mở rộng của Mỹ với chip tiên tiến.

Vào tháng 11.2023, gã khổng lồ game và truyền thông xã hội Tencent cũng cảnh báo rằng những hạn chế của Mỹ với việc bán chip tiên tiến sang Trung Quốc cuối cùng sẽ ảnh hưởng đến các dịch vụ đám mây của họ, dù hãng có một kho dự trữ lớn chip Nvidia AI.

“Những công ty bị ảnh hưởng nặng nề nhất là các hãng công nghệ lớn đã đặt mua chip AI trị giá hàng tỉ USD mà Nvidia không thể giao được, điều này sẽ ảnh hưởng đến khả năng cung cấp dịch vụ của họ thông qua đám mây trong tương lai”, theo Chen Yu, đối tác tại hãng đầu tư mạo hiểm Yunqi Partners, người hỗ trợ cho công ty khởi nghiệp về AI MiniMax.

Baidu, Alibaba, Tencent và ByteDance được dự đoán mua 125.000 GPU Nvidia H100 (chiếm 20% tổng số lô hàng H100 trong năm 2023), theo dữ liệu từ Omdia.

Tuy nhiên, Chen Yu chỉ ra rằng các công ty khởi nghiệp Trung Quốc có một số biện pháp bảo vệ vì có thể tận dụng khả năng tính toán của các dịch vụ đám mây công cộng toàn cầu mà không bị hạn chế.

Dù vậy, các lệnh trừng phạt của Mỹ đã tác động mạnh đến Trung Quốc. Khi các công ty Mỹ từ OpenAI đến Nvidia giành được sự chú ý nhờ vai trò trong việc đưa generative AI (AI tạo sinh) ra thế giới, một số ngôi sao AI sáng giá nhất Trung Quốc từ vài năm trước, chẳng hạn SenseTime, phải vật lộn để kiếm được lợi nhuận dưới sự hạn chế của chính quyền Biden.

Một doanh nhân AI giấu tên tại thành phố Hàng Châu (Trung Quốc) cho biết: “Một số công ty, gồm cả iFlyTek, đang hợp tác với Huawei để tìm các giải pháp nhằm vượt qua các giới hạn về chip, nhưng nỗ lực của họ vẫn bị cản trở do thiếu hệ sinh thái đào tạo AI trưởng thành, chẳng hạn CUDA của Nvidia”.

Trong khi đó, các mô hình ngôn ngữ lớn nước ngoài như dòng GPT của OpenAI và Google Gemini vẫn chưa có sẵn trực tiếp tại Trung Quốc do các yêu cầu quy định nghiêm ngặt.

Cục Quản lý Không gian mạng Trung Quốc, cơ quan quản lý internet của Trung Quốc, đã triển khai các quy định mạnh mẽ về AI (có hiệu lực từ ngày 15.8.2023) yêu cầu đánh giá mô hình ngôn ngữ lớn và giám sát sự phát triển của chúng, gồm cả dữ liệu đầu vào và đầu ra. Ví dụ Baidu đã phải chạy Ernie Bot ở “chế độ dùng thử” trong nhiều tháng trước khi được chấp thuận sử dụng rộng rãi.

Các công ty Trung Quốc cũng có nguy cơ hao tốn tiền bạc và công sức. Tính đến tháng 7, 130 mô hình ngôn ngữ lớn đã được các công ty và viện nghiên cứu Trung Quốc tung ra thị trường, dẫn đến cái được gọi là “cuộc chiến giữa hàng trăm mô hình ngôn ngữ lớn”.

Robin Li Yanhong, đồng sáng lập và Giám đốc điều hành gã khổng lồ tìm kiếm Baidu, nói vào tháng trước rằng việc ra mắt nhiều mô hình ngôn ngữ lớn để cạnh tranh ở Trung Quốc là “sự lãng phí tài nguyên rất lớn” và các công ty nên tập trung nhiều hơn vào các ứng dụng AI.

Sơn Vân