“Tôi không tự hào về việc mình làm, các đồng nghiệp của tôi cũng không, nhưng đó là cuộc sống ở Trung Quốc ngày nay”. Li An, tên giả của một cựu nhân viên không muốn nêu tên của ByteDance – công ty công nghệ sở hữu ứng dụng video TikTok, tóm tắt câu chuyện của mình như vậy với phóng viên Shen Lu của báo Protocol.

Tự thú của người đã góp phần xây dựng cỗ máy kiểm duyệt cho ByteDance ở Trung Quốc

Đ.K.X | 28/02/2021, 11:20

“Tôi không tự hào về việc mình làm, các đồng nghiệp của tôi cũng không, nhưng đó là cuộc sống ở Trung Quốc ngày nay”. Li An, tên giả của một cựu nhân viên không muốn nêu tên của ByteDance – công ty công nghệ sở hữu ứng dụng video TikTok, tóm tắt câu chuyện của mình như vậy với phóng viên Shen Lu của báo Protocol.

Li An kể:

“Đó là cái đêm bác sĩ Lý Văn Lượng vật vã trút hơi thở cuối cùng trong phòng cấp cứu của Bệnh viện Trung tâm Vũ Hán. Như nhiều người Trung Quốc (TQ) lướt web khác, tôi thức để cập nhật liên tục trang Weibo của mình nhằm nắm thông tin mới nhất về tình hình sức khỏe của ông. Bác sĩ Lý là một bác sĩ nhãn khoa đã báo động sớm về sự bùng phát của dịch COVID-19. Chẳng bao lâu sau ông phải đối mặt với sự đe dọa của nhà nước và rồi bị nhiễm virus. Khi ông qua đời vào sáng sớm ngày ngày 7.2.2020, tôi nằm trong số nhiều cư dân mạng Trung Quốc bày tỏ sự đau buồn và phẫn nộ trên Weibo để rồi sau đó thấy tài khoản của mình bị hủy.

Tôi cảm thấy có tội hơn là tức giận. Lúc đó tôi làm nhân viên kỹ thuật tại ByteDance, giúp phát triển các công cụ và nền tảng để điều phối nội dung. Nói cách khác, tôi đã giúp xây dựng hệ thống kiểm duyệt những tài khoản như của tôi. Tôi đã giúp vào việc tự chôn chính mình trong nấm mồ không gian mạng không ngừng mở rộng của Trung Quốc.

Tôi không nhận được chỉ thị gì rõ ràng về vụ bác sĩ Lý Văn Lượng nhưng Weibo chắc chắn không phải là công ty công nghệ duy nhất của Trung Quốc liên tục xóa bỏ các post và tài khoản của người dùng đêm hôm ấy. Tôi biết đội quân điều phối nội dung của ByteDance đang sử dụng những công cụ và thuật toán mà tôi góp phần phát triển để xóa bỏ nội dung, thay đổi câu chuyện kể và ký ức về những khổ đau và chấn thương gây ra cho người dân TQ trong cơn bùng phát dịch COVID-19. Tôi không thể không cảm thấy mỗi ngày mình giống như cái bánh răng trong một cỗ máy ác độc khổng lồ.

ByteDance là một trong những kỳ lân lớn nhất của TQ và là nhà sáng tạo ứng dụng chia sẻ video ngắn TikTok, phiên bản gốc Trung Quốc của nó là Douyin và ứng dụng thu thập tin tức Toutiao. Năm ngoái, khi ByteDance trở thành trung tâm của cuộc tranh cãi Mỹ-Trung về việc tập đoàn này chia sẻ dữ liệu với Bắc Kinh, tập đoàn này đã cắt quyền của các kỹ sư trong nước được tiếp cận với các sản phẩm ở hải ngoại, bao gồm cả TikTok. TikTok vạch kế hoạch tung ra hai Trung tâm Minh bạch ở Los Angeles và Washington, D.C., nhằm phô diễn cách điều phối nội dung của nó. Nhưng ở Trung Quốc, cách điều phối nội dung phần lớn nằm trong bóng tối.

Tôi nằm trong đội công nghệ trung tâm, có nhiệm vụ hỗ trợ đội phụ trách tính Tin cậy và An toàn vốn nằm trong bộ phận dữ liệu cốt lõi của ByteDance. Bộ phận dữ liệu có nhiệm vụ chủ yếu là phát triển công nghệ cho các nền tảng video ngắn. Đầu năm 2020 các công nghệ mà chúng tôi tạo ra hỗ trợ cho việc điều phối nội dung của toàn bộ công ty ở trong và ngoài TQ, bao gồm cả Douyin ở trong nước và phiên bản quốc tế của nó là TikTok. Khoảng 50 nhân viên làm việc trong đội sản phẩm và từ 100-150 kỹ sư làm việc trong đội kỹ thuật. Thêm vào đó ByteDance sử dụng khoảng 20.000 điều phối viên nội dung để giám sát nội dung ở TQ. Họ làm việc trong các cơ sở ở Thiên Tân, Thành Đô (thuộc Tứ Xuyên), Diên An (tỉnh Sơn Đông), và các thành phố khác. Một số là nhân viên của ByteDance, số khác là nhà thầu.

Công việc của tôi là dùng công nghệ để làm cho công việc của những điều phối viên nội dung cấp thấp có hiệu quả hơn. Chẳng hạn chúng tôi tạo ra một công cụ cho phép họ ném một video clip vào cơ sở dữ liệu của chúng tôi và tìm kiếm nội dung tương tự.

Khi tôi còn làm ở ByteDance, chúng tôi nhận được nhiều yêu cầu từ các cơ sở là phát triển một thuật toán có thể tự động phát hiện một người dùng ứng dụng Douyin nói tiếng Duy Ngô Nhĩ và cắt ngang phiên livestream của họ. Các điều phối viên nội dung đã yêu cầu điều đó vì họ không hiểu thứ tiếng ấy. Những streamers nói tiếng dân tộc thiểu số hoặc thổ ngữ mà người nói tiếng phổ thông không hiểu sẽ nhận được cảnh báo hãy chuyển qua tiếng phổ thông. Nếu họ không tuân theo, các điều phối viên sẽ cắt ngang phiên livestream theo cách thủ công, bất kể nội dung thực sự là gì. Nhưng khi đó là tiếng Duy Ngô Nhĩ thì một thuật toán sẽ tự động cắt ngang, các điều phối viên không phải chịu trách nhiệm về nội dung bị mất - những nội dung mà nhà cầm quyền có thể đánh giá là “xúi giục ly khai” hoặc “khủng bố”.

Sự thật là diễn ngôn chính trị chiếm một phần rất nhỏ trong nội dung bị xóa bỏ. Cư dân mạng TQ rất rành tự kiểm duyệt và biết điều gì không nên nói. Các nền tảng của ByteDance – Douyin, Toutiao, Xigua và Huoshan – chủ yếu là những ứng dụng giải trí. Chúng tôi chủ yếu kiểm duyệt những nội dung mà chính quyền TQ cho là có rủi ro về đạo đức: nội dung dâm ô, chuyện trò tục tĩu, hình ảnh khỏa thân, chửi thề cũng như livestream bán hàng không được phép và những nội dung vi phạm bản quyền.

Nhưng diễn ngôn chính trị vẫn là mối đe dọa lớn. Điều mà các nền tảng với nội dung do người dùng TQ tạo ra lo sợ nhất là thất bại trong việc xóa bỏ các nội dung chính trị nhạy cảm khiến công ty sau đó bị chính quyền soi xét nặng nề. Đó là vấn đề sinh tử. Thỉnh thoảng hệ thống kiểm soát nội dung của ByteDance sụp trong vài phút, gây căng thẳng thần kinh vì chúng tôi chẳng thể biết tai họa chính trị nào có thể xảy đến trong khoảng thời gian đó. Là một kỳ lân trẻ tuổi, ByteDance không có những mối quan hệ mạnh với chính quyền như các ông lớn công nghệ khác, do đó lúc nào cũng như đu dây.

Đội ngũ mà tôi là thành viên, những người làm chính sách điều phối nội dung, cùng với đạo quân khoảng 20.000 điều phối viên nội dung đã giúp cho ByteDance tránh được những tác động chính trị nghiêm trọng và đưa đến thành công về thương mại. Thuật toán mạnh của ByteDance chẳng những có thể đưa ra những tiên đoán chính xác và khuyến cáo về nội dung với người dùng – một trong những điều khiến ByteDance nổi tiếng nhất với thế giới – mà còn có thể giúp các điều phối viên nhanh chóng kiểm duyệt nội dung. Không có nhiều công ty công nghệ TQ dành nhiều nguồn lực cho việc kiểm soát nội dung như thế. Những nền tảng khác cũng với nội dung do người dùng tạo ra không thể nào sánh được với ByteDance.

Nhiều đồng nghiệp của tôi cảm thấy không thoải mái về việc chúng tôi đang làm. Một số trong họ đã học báo chí ở đại học. Số khác tốt nghiệp những đại học hàng đầu. Họ được giáo dục tốt và có khuynh hướng tự do. Chúng tôi thỉnh thoảng nói chuyện cởi mở về việc chúng tôi đã giúp cho việc kiểm duyệt như thế nào. Nhưng tất cả đều cảm thấy chẳng thể làm gì.

Tất nhiên một chút ánh sáng lý tưởng vẫn còn le lói. Có lẽ tôi đã ngây thơ khi từng nghĩ rằng nếu tôi cố gắng hơn một chút, có thể tôi đã “nâng được mũi súng lên cao hơn một phân”, như người ta nói ở TQ, để một chút ngôn luận tự do lọt qua. Nhưng cuối cùng tôi nhận ra thực sự ảnh hưởng của mình hạn chế đến mức nào.

hinhanh1.gif
Bên ngoài trụ sở ByteDance ở Bắc Kinh 

Nói đến sự kiểm duyệt hàng ngày, Cục quản lý không gian mạng Trung Quốc thường xuyên đưa ra chỉ thị cho Trung tâm Chất lượng Nội dung của ByteDance là bộ phận giám sát hoạt động điều phối trong nội bộ công ty, có khi hơn 100 chỉ thị một ngày. Sau đó họ giao nhiệm vụ cho các đội khác nhau áp dụng những chỉ đạo cụ thể đối với những diễn ngôn đang diễn ra và cả những nội dung trong quá khứ cần phải tìm để xác định có được phép tồn tại hay không.

Trong các show livestream, các clip âm thanh phải được tự động chuyển thành văn bản, qua đó cho phép các thuật toán so sánh nội dung văn bản với một danh sách dài và thường xuyên được cập nhật những từ, thời gian, tên , cũng như các mô hình Xử lý Ngôn ngữ Tự nhiên. Các thuật toán sau đó sẽ phân tích xem nội dung có rủi ro đến mức phải giám sát cá nhân hay không.

Nếu người dùng nhắc đến một từ ngữ nhạy cảm, một điều phối viên nội dung sẽ nhận được video clip gốc kèm theo bản ghi cho thấy từ ngữ đó xuất hiện ở đâu. Nếu điều phối viên đánh gía rằng từ ngữ đó là nhạy cảm hoặc không phù hợp, họ sẽ cắt ngang phiên livestream đang diễn ra và tạm ngưng hoặc ngay cả hủy bỏ tài khoản. Quanh những ngày lễ nhạy cảm về chính trị như ngày 1.10 (quốc khánh TQ), 1.7 (thành lập đảng Cộng sản TQ) hoặc những ngày kỷ niệm chính trị lớn như các cuộc biểu tình năm 1989 và cuộc đàn áp Thiên An Môn, Trung tâm Chất lượng Nội dung sẽ tạo ra một danh sách đặc biệt các từ ngữ nhạy cảm để các điều phối viên sử dụng. Những người có ảnh hưởng (influencers) thì được hưởng một sự đối xử đặc biệt nào đó – có những điều phối viên nội dung được cắt cử đặc biệt nhằm giám sát các kênh của một số influencers nào đó để tránh trường hợp nội dung phát hoặc tài khoản của họ bị xóa bỏ do nhầm lẫn. Một số nhân vật cực kỳ có ảnh hưởng với công chúng, cơ quan truyền thông nhà nước, cơ quan chính quyền thì nằm trong một danh sách trắng do ByteDance xây dựng, được miễn kiểm duyệt.

Đồng nghiệp trong đội của tôi không tiếp xúc trực tiếp với các điều phối viên nội dung hoặc các nhà quản lý internet. Trung tâm Chất lượng Nội dung đưa ra các hướng dẫn điều phối và làm việc trực tiếp với những người đứng đầu các cơ sở để thực hiện. Sau những sự kiện lớn hoặc những lễ kỷ niệm nhạy cảm, các đồng nghiệp phụ trách vận hành sẽ thông báo với mọi người điều gì làm được, điều gì còn phải cải tiến. Chúng tôi dự các cuộc họp đó để xem có thể làm gì nhằm hỗ trợ tốt hơn cho công tác kiểm duyệt.

Vai trò của chúng tôi là đảm bảo rằng các điều phối viên nội dung cấp thấp có thể phát hiện càng sớm càng tốt nội dung “có hại và nguy hiểm”, hệt như mò kim đáy bể. Và chúng tôi được giao nhiệm vụ cải tiến hiệu quả kiểm duyệt. Có nghĩa là sử dụng càng ít người càng tốt để phát hiện càng nhiều nội dung có khả năng vi phạm tiêu chuẩn cộng đồng của ByteDance càng tốt. Tôi không nhớ có vụ việc phản ứng chính trị nào lớn từ phía chính quyền TQ trong thời gian tôi làm tại ByteDance, có nghĩa là chúng tôi làm tốt công việc của mình.

Đó chắc chắn không phải là một công việc mà tôi kể cho bạn bè và gia đình một cách tự hào. Khi họ hỏi tôi làm gì ở ByteDance, tôi thường trả lời rằng mình xóa bỏ các post của người dùng. Một số bạn bè bảo tôi: “Giờ tôi đã biết ai rút ruột tài khoản của mình”. Những công cụ mà tôi góp phần tạo ra cũng có thể giúp đấu tranh chống lại những mối nguy như tin giả. Nhưng ở TQ một chức năng hàng đầu của những công nghệ này là kiểm duyệt ngôn luận và xóa bỏ ký ức tập thể về những sự kiện lớn, bất kể chức năng này được sử dụng thường xuyên hay không.

Bác sĩ Lý cảnh báo bạn bè và đồng nghiệp về một con virus chưa được biết đến, đang xâm nhập các bệnh viện ở Vũ Hán và bị trừng phạt vì điều đó. Trong nhiều tuần, chúng ta không biết chuyện gì đang thực sự xảy ra vì nhà chức trách che đậy tính nghiêm trọng của cuộc khủng hoảng. Khoảng thời gian này năm ngoái, nhiều công ty công nghệ TQ đang tích cực hủy các post, video, nhật ký, hình ảnh được xem là không thuộc “ký ức tập thể đúng đắn” mà chính phủ TQ đưa ra sau đó. Hãy thử tưởng tượng: nếu có nền tảng mạng xã hội nào bác bỏ được các chỉ thị kiểm duyệt của chính phủ và giữ lại được những cảnh báo của bác sĩ Lý và những người báo động khác, có lẽ hàng triệu sinh mạng đã được cứu".

 

Bài liên quan
Trung Quốc chạy đua tích trữ chip từ Mỹ trước khi ông Trump tăng cường lệnh trừng phạt
Khi lệnh hạn chế công nghệ từ Mỹ có thể gia tăng trong nhiệm kỳ thứ hai của ông Trump, lượng mạch tích hợp Mỹ được nhập khẩu vào Trung Quốc đã tăng vọt.

(0) Bình luận
Nổi bật Một thế giới
Temu, Shein... 'đổ bộ' Việt Nam, chuyển đổi số cấp thiết hơn bao giờ hết
13 giờ trước Khoa học - công nghệ
Chuyển đổi số trong linh vực bán buôn, bán lẻ đang cấp thiết hơn bao giờ hết khi các sàn thương mại điện tử như Temu, Shein... "đổ bộ" thị trường Việt Nam.
Đừng bỏ lỡ
Mới nhất
POWERED BY ONECMS - A PRODUCT OF NEKO
Tự thú của người đã góp phần xây dựng cỗ máy kiểm duyệt cho ByteDance ở Trung Quốc