Các công ty Trung Quốc gặp thách thức kiểm duyệt, chi phí, dữ liệu để tạo chatbot như ChatGPT

Thế giới số - Ngày đăng : 14:02, 20/02/2023

Trở lại làm việc sau kỳ nghỉ Tết Nguyên đán kéo dài một tuần, các chuyên gia công nghệ Trung Quốc xôn xao vì chatbot AI mới từ OpenAI, công ty khởi nghiệp có trụ sở tại thành phố San Francisco (Mỹ) được Microsoft đầu tư hàng tỉ USD.

ChatGPT có thể hiểu các câu hỏi phức tạp và đưa ra các câu trả lời bằng văn bản giống con người một cách đáng ngạc nhiên.

Chatbot này được xây dựng dựa trên các mô hình ngôn ngữ lớn GPT-3 của OpenAI, được tinh chỉnh bằng cả kỹ thuật học có giám sát và học tăng cường.

Nhiều người dùng ở Trung Quốc đã sử dụng mạng riêng ảo (VPN) vượt qua giới hạn để tạo tài khoản OpenAI và cố gắng sử dụng ChatGPT theo nhiều cách khác nhau, gồm cả với tư cách là nhà phê bình phim, cố vấn nghề nghiệp, tư vấn đầu tư, sức khỏe và thậm chí giải mã giấc mơ.

Chính phủ Trung Quốc cũng đã chú ý đến ChatGPT. Một sách trắng gần đây được xuất bản bởi Văn phòng công nghệ Bắc Kinh, thành phố có nhiều công ty khởi nghiệp AI nhất Trung Quốc, cam kết hỗ trợ các công ty địa phương phát triển các đối thủ của ChatGPT.

Song, điều này nói thì dễ hơn làm, do sự khác biệt trong cấu trúc của ngôn ngữ tiếng Anh với tiếng Trung, áp lực chi phí, tính sẵn có của bộ dữ liệu và cuối cùng nhưng không kém phần quan trọng là vấn đề kiểm duyệt nghiêm ngặt ở Trung Quốc.

Trung Quốc luôn kiểm soát chặt chẽ luồng thảo luận chính trị, xã hội trong nước và thời gian gần đây mạnh tay ngăn chặn nội dung trực tuyến được coi là không phù hợp, từ cá cược, khiêu dâm đến bạo lực trong game và cả nội dung cổ vũ những ý tưởng không phù hợp với các giá trị truyền thống của nước này.

Great firewall (tường lửa vĩ đại) từ lâu đã ngăn cư dân mạng Trung Quốc truy cập các trang web phổ biến của phương Tây như Google và Facebook. Thế nhưng, các chatbot AI đặt ra thách thức mới.

cong-ty-trung-quoc-doi-mat-thach-thuc-ve-kiem-duyet-chi-phi-du-lieu-de-phat-trien-chatbot-nhu-chatgpt.jpg — Các nhà phân tích cho biết việc phát triển một đối thủ với ChatGPT ở Trung Quốc sẽ rất khó khăn - Ảnh: dpa

Dahlia Peterson, nhà phân tích nghiên cứu tại Trung tâm An ninh và Công nghệ mới nổi (CSET) của Đại học Georgetown, cho biết: “Việc kiểm duyệt chắc chắn có thể cản trở khả năng của Trung Quốc trong việc phát triển một dịch vụ địa phương tương đương với ChatGPT”.

“Ngay cả khi các công ty AI Trung Quốc có thể truy cập, sử dụng dữ liệu toàn cầu và tài nguyên nghiên cứu để đào tạo các mô hình AI của họ, chính quyền Trung Quốc cũng không cho phép họ sử dụng bất kỳ tài liệu nào được coi là nhạy cảm về chính trị trong các câu trả lời”, bà Dahlia Petersonnói thêm.

Ngay cả khi đối thủ của ChatGPT ở Trung Quốc được phát triển, việc kiểm soát chặt chẽ nội dung từ chính quyền cũng có thể hạn chế quá trình thương mại hóa nó.

Hanna Dohmen, nhà phân tích của CSET, nhận định: “Những hạn chế, quy định nội dung và kiểm duyệt quá mức có thể cản trở quá trình thương mại hóa và đổi mới hơn nữa những công nghệ như vậy”.

Tuy nhiên, Jeffrey Ding, trợ lý giáo sư khoa học chính trị tại Đại học George Washington, chỉ ra rằng sự phát triển ChatGPT của OpenAI cũng kéo theo một hình thức “kiểm duyệt”.

“ChatGPT đã được đào tạo để không thảo luận về các chủ đề nhạy cảm, gồm cả các vấn đề chính trị và tôn giáo. Có khả năng các công ty AI Trung Quốc sẽ áp dụng các chiến thuật tương tự để đào tạo các phiên bản ChatGPT của riêng họ”, Jeffrey Ding cho biết khi trả lời các câu hỏi từ trang SCMP.

SCMP đã hỏi ChatGPT về những suy nghĩ của riêng mình về kiểm duyệt.

“Kiểm duyệt là một vấn đề tiềm ẩn có thể ảnh hưởng đến sự phát triển của các dịch vụ như ChatGPT ở các quốc gia như Trung Quốc. Các chính phủ có thể lo ngại về khả năng các hệ thống AI tạo ra nội dung được coi là nhạy cảm hoặc không thể chấp nhận được về mặt chính trị. Cuối cùng, mức độ kiểm duyệt ảnh hưởng đến sự phát triển của các dịch vụ giống ChatGPT sẽ phụ thuộc vào nhiều yếu tố, bao gồm các chính sách và quy định của chính phủ, cũng như những đổi mới và tiến bộ công nghệ”, ChatGPT trả lời.

Đặc điểm độc đáo của ngôn ngữ Trung Quốc là một thách thức khác để phát triển đối thủ cạnh tranh với ChatGPT.

Xu Liang, người sáng lập Yuanyu Intelligent (công ty khởi nghiệp có trụ sở tại thành phố Hàng Châu, tỉnh Chiết Giang, Trung Quốc), cho biết việc đào tạo một chatbot AI bằng tiếng Trung cũng khó khăn vì hệ sinh thái nguồn mở của nước này không phát triển và rộng khắp như ở phương Tây.

Việc đào tạo ChatGPT được thực hiện nhờ một loạt công cụ được đóng góp bởi các cộng đồng nguồn mở, gồm cả mô hình học sâu Transformer cùng nhiều công cụ khác.

Yuanyu Intelligent đã ra mắt ChatYuan, dịch vụ lấy cảm hứng từ ChatGPT dưới dạng một ứng dụng nhỏ trên WeChat của Tencent vào tháng 1, quảng cáo đây là AI thế hệ đầu tiên được đào tạo trước bởi các mô hình tiếng Trung. Tuy nhiên, các hạn chế của Trung Quốc với thảo luận trực tuyến đã giới hạn các bộ dữ liệu mà các nhà khoa học sử dụng để đào tạo các mô hình trò chuyện AI. Xu Liang cho biết ChatYuan chỉ có thể đáp ứng tối đa 70% yêu cầu của người dùng, trong khi ChatGPT có khả năng hoàn thành 90% nhiệm vụ được đặt ra.

ChatYuan được xây dựng trên các mô hình lớn với hơn 10 tỉ tham số bằng tiếng Trung và có kế hoạch tung ra một phiên bản với hơn 100 tỉ tham số, Xu Liang nói. Để so sánh, GPT-3 của OpenAI có 175 tỉ tham số.

Tuân thủ là một vấn đề khác. Ứng dụng nhỏ của ChatYuan đã bị đình chỉ tuần trước sau khi các nhà chức trách cho biết những sản phẩm như vậy cần được xem xét kỹ lưỡng hơn về nội dung của chúng.

“Ở Trung Quốc khác với nước ngoài, chúng tôi cần nhiều lớp lọc và xử lý hơn về mặt đánh giá văn bản”, Xu Liang nói. Ông cho biết người điều hành sẽ được đưa vào để khắc phục sự cố.

Cũng có những lo ngại về chi phí vận hành các dịch vụ giống như ChatGPT.

cong-ty-trung-quoc-doi-mat-thach-thuc-ve-kiem-duyet-chi-phi-du-lieu-de-phat-trien-chatbot-nhu-chatgpt1.jpg — Một người dùng dùng thử Xiaoice, chatbot của Microsoft tại Trung Quốc vào năm 2018 - Ảnh: Handout

Li Di, Giám đốc điều hành Xiaoice, công ty con của Microsoft ở Trung Quốc đã phát triển một trợ lý nói chuyện cùng tên gần 10 năm trước. Li Di lưu ý trong cuộc phỏng vấn gần đây với phương tiện truyền thông địa phương rằng, dù mỗi truy vấn ChatGPT chỉ tốn vài xu Mỹ, nhưng sẽ tốn hàng triệu USD mỗi ngày cho công ty của ông để vận hành một dịch vụ tương tự.

Li Di nói: “Việc thuê một người để xử lý các truy vấn có thể tốn ít chi phí hơn”. Bản thân Xiaoice đã bị gỡ xuống khỏi ứng dụng nhắn tin QQ của Tencent vào năm 2017 sau khi người dùng đưa ra phản hồi chỉ trích chính phủ Trung Quốc. Sau đó, Xiaoice đã bị kiểm duyệt.

“Sẽ cần thời gian với các công ty Trung Quốc để xây dựng một mô hình như vậy, OpenAI cũng đã dành nhiều thời gian để phát triển ChatGPT. Thật khó để nói liệu các công ty Trung Quốc có thể phát triển thứ gì đó tương tự hay không”, theo Wong Kam-fai, giáo sư tại Đại học Trung văn Hồng Kông, chuyên về xử lý ngôn ngữ tự nhiên.

OpenAI không thiếu tiền mặt. Được thành lập vào năm 2015, OpenAI đã huy động được tổng số vốn là 11 tỉ USD, theo dịch vụ cơ sở dữ liệu doanh nghiệp khởi nghiệp Crunchbase.

Màn ra mắt gây chú ý của ChatGPT cũng thúc đẩy hàng loạt đối thủ bơm tiền vào các chatbot AI, bao gồm Google, Microsoft, Alibaba và Baidu (hãng điều hành công cụ tìm kiếm lớn nhất Trung Quốc và đầu tư rất nhiều vào AI).

Thật không may, đã có kẻ sử dụng ChatGPT để phạm tội và lan truyền tin đồn thất thiệt gióng lên hồi chuông cảnh báo với chính quyền địa phương.

Hôm 16.2, cảnh sát Bắc Kinh (thủ đô Trung Quốc) khuyên người dân cảnh giác với tin đồn do ChatGPT tạo ra. Đây là một trong những bình luận đầu tiên mà bộ máy an ninh Trung Quốc đưa ra về chatbot AI.

“ChatGPT thú vị và đã lan truyền gần đây, nhưng hãy cẩn thận rằng những kẻ xấu có thể sử dụng điều này để phạm tội và lan truyền tin đồn. Các viện nghiên cứu đã thử nghiệm và phát hiện ra rằng khi được hỏi những câu hỏi liên quan đến âm mưu và gây hiểu lầm, ChatGPT có thể nhanh chóng tạo ra thông tin hấp dẫn mà không trích dẫn nguồn”, một bài đăng trên tài khoản WeChat chính thức của Cục Công an thành phố Bắc Kinh cho biết.

Bài đăng không đưa ra bất kỳ ví dụ cụ thể nào về những tin đồn mà cảnh sát lo ngại.

Sơn Vân