Trung Quốc đang lãng phí phần lớn nguồn tài nguyên dữ liệu khổng lồ của mình do khả năng lưu trữ và xử lý bị tụt hậu so với việc tạo dữ liệu. Một cuộc khảo sát mới đây cho thấy chưa đến 3% dữ liệu được tạo ra ở Trung Quốc vào năm ngoái được lưu trữ và xử lý.
Những phát hiện của Báo cáo Khảo sát Tài nguyên Dữ liệu Quốc gia 2023 (cuộc khảo sát tài nguyên dữ liệu toàn quốc đầu tiên của chính quyền Trung Quốc) được công bố tại hội nghị thượng đỉnh về kinh tế kỹ thuật số ở thành phố Phúc Châu, tỉnh Phúc Kiến.
Theo cuộc khảo sát, Trung Quốc đã tạo ra 32,85 ZB (zettabyte) dữ liệu vào năm ngoái do sự phát triển nhanh chóng 5G, công nghệ AI và sự sẵn có rộng rãi của các thiết bị thông minh. 1 ZB tương đương với 1 tỉ TB (terrabyte).
Song trong khi dữ liệu được tạo ra tăng 22% thì việc lưu trữ chỉ tăng 0,95 ZB vào năm ngoái (chưa đến 3% lượng dữ liệu được tạo ra trong cùng kỳ), cuộc khảo sát cho biết.
Cuộc khảo sát thừa nhận tỷ lệ chuyển đổi lưu trữ và tạo dữ liệu của Trung Quốc vẫn còn thấp, còn “giá trị tiềm năng của dữ liệu cần được khám phá thêm”.
Cuộc khảo sát cũng lưu ý rằng việc sử dụng dữ liệu được lưu trữ vẫn ở mức thấp: Gần 40% dữ liệu được các công ty lưu trữ vào năm ngoái không được đọc hoặc sử dụng lại sau khi được lưu trữ.
Báo cáo cho biết: “Sự thiếu hụt về khả năng xử lý dữ liệu dẫn đến việc đánh giá thấp và gặp khó khăn trong việc phát hiện, tái sử dụng lượng lớn dữ liệu”.
Theo giáo sư Andy Chun từ Trường Kinh doanh thuộc Đại học Thành phố Hồng Kông, con số 3% về lưu trữ dữ liệu của Trung Quốc phù hợp với các biện pháp toàn cầu cho thấy chỉ một phần dữ liệu tạo ra được bảo quản. Theo cổng thống kê Statista (Đức), chỉ 2% dữ liệu được tạo và tiêu thụ vào năm 2020 được lưu trữ để sử dụng vào năm 2021.
“Nhiều lý do cho việc lưu giữ có chọn lọc này, trong đó quyền riêng tư và bảo mật dữ liệu là điều tối quan trọng. Hầu hết các quốc gia đều thực thi các quy định hạn chế lưu trữ dữ liệu ở mức cần thiết cho các mục đích được xác định, yêu cầu xóa dữ liệu đó khi nó không còn phục vụ các mục đích này nữa. Lưu trữ lượng lớn dữ liệu không chỉ mang lại các lỗ hổng bảo mật mà còn đòi hỏi chi phí và thách thức công nghệ đáng kể. Cơ sở hạ tầng cần thiết để lưu trữ khối lượng dữ liệu thời gian thực như vậy đòi hỏi phải có những tiến bộ liên tục trong các giải pháp lưu trữ, có thể rất tốn kém”, Andy Chun, cố vấn của Nhóm Chuyên gia AI của Hiệp hội Máy tính Hồng Kông, nhận xét.
Andy Chun dự đoán tỷ lệ lưu giữ dữ liệu của Trung Quốc sẽ sớm tăng lên đáng kể, được thúc đẩy bởi sự áp dụng các công nghệ AI tạo sinh trên khắp thế giới.
Ông cho biết đầu ra thành công của AI phụ thuộc vào cả khối lượng và chất lượng dữ liệu nền tảng, đồng thời nói thêm rằng khi xu hướng hướng tới các ứng dụng AI tạo sinh được cá nhân hóa nhiều hơn thì khả năng dữ liệu cá nhân sẽ được giữ lại nhiều hơn để đào tạo các mô hình AI.
“Để thích ứng với sự tăng trưởng này, Trung Quốc nên chuyển hướng đầu tư vào việc phát triển các công nghệ lưu trữ, nhằm mục đích nâng cao năng lực và giảm chi phí. Mục tiêu chiến lược này có thể hỗ trợ nhu cầu ngày càng tăng của AI, đồng thời thúc đẩy đổi mới trong toàn ngành”, Andy Chun cho hay.
Báo cáo Khảo sát Tài nguyên Dữ liệu Quốc gia năm 2023 cũng kêu gọi các doanh nghiệp lớn Trung Quốc đầu tư vào chuyển đổi kỹ thuật số. Khoảng 22% công ty được khảo sát cho biết họ vẫn chưa có hệ thống quản lý dữ liệu. Trong số những doanh nghiệp đã trải qua quá trình chuyển đổi kỹ thuật số, chỉ có 8% tái sử dụng dữ liệu của họ và đạt được giá trị gia tăng từ đó.
Cuộc khảo sát cho biết: “Vẫn còn một chặng đường dài để khám phá toàn bộ giá trị của dữ liệu”. Thế nhưng, cuộc khảo sát cũng lưu ý rằng nhu cầu về các sản phẩm dữ liệu chất lượng của Trung Quốc vẫn rất mạnh, với nhu cầu gấp 1,75 lần nguồn cung, theo kết quả khảo sát liên quan đến các trung tâm trao đổi dữ liệu ở nước này.
Andy Chun nói rằng dù không có cuộc khảo sát nào có thể so sánh được ở Mỹ, nhưng dựa trên dân số, ông suy ra lượng dữ liệu tạo ra ở Mỹ ít hơn đáng kể so với ở Trung Quốc.
Nhu cầu về sức mạnh tính toán để đào tạo mô hình AI lớn dự kiến sẽ vẫn cao, và nhu cầu về sức mạnh tính toán từ các tổ chức khoa học, vấn đề chính phủ, tài chính và ngành khác cũng tăng lên. Báo cáo khuyến nghị Trung Quốc đẩy nhanh việc xây dựng hệ thống điện toán tích hợp trên toàn quốc để đáp ứng nhu cầu.
Báo cáo Khảo sát Tài nguyên Dữ liệu Quốc gia dự đoán việc tạo ra dữ liệu của Trung Quốc sẽ tăng hơn 25% vào năm 2024, nhờ ứng dụng quy mô lớn các công nghệ mới như truyền thông vệ tinh, ô tô tự lái và AI tạo sinh.
Jiang Yan, Giám đốc Trung tâm Nghiên cứu Phát triển An ninh Thông tin Công nghiệp Quốc gia (người phụ trách cuộc khảo sát), nói Trung Quốc có lợi thế về quy mô ban đầu với tài nguyên dữ liệu của mình.
“Tuy nhiên, cần phải làm nhiều việc hơn nữa để giải phóng tiềm năng của dữ liệu khổng lồ, vì việc quản lý và sử dụng tài nguyên dữ liệu của Trung Quốc đang ở giai đoạn đầu”, Jiang Yan nói với tờ Daily Economic News.
Andy Chun cảnh báo rằng việc mở rộng lưu trữ dữ liệu cá nhân “phải được quản lý cẩn thận, tuân thủ thận trọng các quy định về quyền riêng tư, tiêu chuẩn đạo đức và các giao thức bảo vệ dữ liệu mạnh mẽ”. Ông nói thêm rằng để tăng trưởng dữ liệu bền vững, Trung Quốc phải tham gia đầu tư chiến lược vượt ra ngoài việc chỉ tăng cường năng lực lưu trữ.
Việc thúc đẩy các hoạt động quản lý dữ liệu ưu tiên chất lượng, bảo mật và quản trị là điều cần thiết.
Ông nói: “Cách tiếp cận toàn diện như vậy rất quan trọng để tận dụng tối đa khả năng của AI tạo sinh, đảm bảo rằng các nguyên tắc về AI có trách nhiệm được duy trì”.