Giọng nói trong kỷ nguyên AI: Tiếng người là tài sản, cũng là cạm bẫy
Luật AI đã có hiệu lực, nhưng khi giọng nói bị nhân bản để kiếm tiền và lừa đảo, ai còn giữ quyền kiểm soát?
Công nghệ nhân bản giọng nói đang mở ra một thị trường mới. Tiếng nói con người có thể được số hóa, nhân bản và khai thác như một tài sản số. Đến tháng 3.2026, câu hỏi không còn là công nghệ làm được gì. Câu hỏi là ai làm chủ giọng nói khi nó đã bị tách khỏi chính người tạo ra nó.
Tại Việt Nam, mô hình “chợ giọng nói AI” đã xuất hiện. Người dùng có thể số hóa giọng nói, đưa bản sao giọng lên thư viện và nhận chia sẻ doanh thu theo sản lượng sử dụng. Cơ chế ấy cho thấy giọng nói được quy đổi thành lưu lượng, doanh thu và quyền khai thác. Nó đã trở thành hàng hóa trong nền kinh tế nội dung số.

Vấn đề là giọng nói không phải một tệp dữ liệu vô danh. Nó gắn với định danh, với uy tín và với một con người cụ thể. Khi thứ ấy bị tách khỏi chủ thể và đi vào lưu thông, câu chuyện không chỉ là lợi nhuận. Câu chuyện là quyền sở hữu, quyền kiểm soát và giới hạn khai thác.
Giá trị kinh tế của giọng nói không mới. Trước khi có AI, thị trường đã trả tiền cho chất giọng, kỹ thuật đọc và độ tin cậy của người làm nghề. Trần Thiên Trung, một voice talent ở Bình Thuận, từng cho biết anh nhận 3 đến 3,5 triệu đồng cho 30 giây đọc quảng cáo, còn lồng tiếng video ở mức 2,5 đến 3 nghìn đồng mỗi từ. Trước thời AI, giọng nói đã là tài sản. Nhưng đó là tài sản gắn liền với người sở hữu nó. Muốn khai thác, người đó phải có mặt.
AI làm thay đổi đúng ở điểm này. Nó biến một năng lực sống thành một đối tượng có thể lưu kho, tái sử dụng và nhân bản ở quy mô lớn. Người có giọng nói không chỉ bán sức lao động tại thời điểm mình lên tiếng. Họ còn có thể bán quyền khai thác một bản sao giọng nói hoạt động thay mình. Đây là lời hứa hấp dẫn nhất của các nền tảng AI voice. Nhưng cũng từ đây, người được hứa hẹn có thêm nguồn thu lại trở thành người dễ bị thay thế nhất.

Đó là mâu thuẫn lớn nhất của thời đại AI. Giọng nói càng có giá trị kinh tế thì càng dễ bị tách khỏi giá trị nhân thân. Bên khai thác nhìn thấy doanh thu. Người sở hữu nhìn thấy nguy cơ bị sao chép, bị thay thế, thậm chí bị đẩy ra khỏi thị trường bằng chính bản sao công nghệ của mình. Với giọng nói, điều bị thay thế không chỉ là một công đoạn sản xuất. Điều bị thay thế là phần có thể nghe thấy của một con người.
Khi AI bước vào lĩnh vực này, câu chuyện lập tức vượt khỏi phạm vi kinh tế. Tháng 1.2026, Mỹ Tâm phải cảnh báo về các video dùng AI để giả mạo hình ảnh và giọng nói của cô nhằm quảng cáo sản phẩm trái phép. Trước đó, Ngô Thanh Vân cũng lên tiếng vì nhiều nội dung dùng hình ảnh, tên tuổi và giọng nói AI của cô để bịa đặt và quảng cáo bất chấp. Hai vụ việc này cho thấy khi giọng nói bị đánh cắp, thứ bị xâm phạm không chỉ là âm thanh. Đó là tín nhiệm công chúng, là uy tín cá nhân, là quyền kiểm soát đối với chính căn tính của mình.

Ở đây, giọng nói bộc lộ hai mặt. Một mặt, nó là tài sản có thể khai thác. Mặt khác, nó là dữ liệu định danh có thể bị lợi dụng. Một lời quảng cáo, một cuộc gọi khẩn cấp, một đoạn xin tiền hay một phát ngôn tưởng như quen thuộc đều có thể trở thành công cụ thao túng nếu giọng nói không còn là bằng chứng chắc chắn cho sự hiện diện của con người.
Giọng nói vì thế không thể bị xem như một tệp dữ liệu bình thường. Luật Căn cước đã xác định giọng nói là thông tin sinh trắc học. Từ ngày 1.1.2026, Luật Bảo vệ dữ liệu cá nhân có hiệu lực, đặt dữ liệu sinh trắc học vào khuôn khổ bảo vệ chặt hơn. Nghị định 13/2023 cũng ghi rõ chủ thể dữ liệu có quyền rút lại sự đồng ý, quyền xóa hoặc yêu cầu xóa dữ liệu cá nhân. Với các mô hình khai thác giọng nói bằng AI, câu hỏi không chỉ là chia doanh thu thế nào. Câu hỏi là người dùng rút giọng ra sao, xóa dữ liệu bằng cách nào và ai chịu trách nhiệm nếu bản sao vẫn tiếp tục bị khai thác sau khi chủ thể đã rút lại sự đồng ý.

Luật Trí tuệ nhân tạo có hiệu lực từ ngày 1.3.2026 siết thêm một vòng trách nhiệm. Nội dung âm thanh, hình ảnh, video do AI tạo ra hoặc chỉnh sửa phải được gắn nhãn nhận diện rõ ràng khi cung cấp ra công chúng. Không có minh bạch, thị trường giọng nói số sẽ nhanh trượt từ đổi mới sang lừa đảo và thao túng.
Trách nhiệm cũng không thể chỉ đặt lên người làm nội dung. Nền tảng phân phối, đơn vị quảng cáo và doanh nghiệp cung cấp hạ tầng AI phải bị kéo vào cùng một chuỗi nghĩa vụ. Nội dung giả không tự đi vào công chúng. Nó luôn đi qua một hệ thống trung gian đang kiếm tiền từ lượt xem, lượt phân phối và hành vi người dùng.
Các cơ quan thuộc Bộ Công an đã cảnh báo về thủ đoạn giả mạo khuôn mặt, giọng nói người thân để vay tiền, lừa chuyển khoản hoặc giả danh cơ quan chức năng. Công nghệ nhân bản giọng nói vì thế không chỉ tạo thêm công cụ sản xuất nội dung. Nó còn mở ra một phương thức lừa đảo mới. Trong môi trường ấy, giọng nói vừa là tài sản có thể sinh lợi, vừa là cửa ngõ của chiếm đoạt niềm tin.
Vấn đề lúc này nằm ở chế độ sở hữu và bảo vệ. Một hợp đồng khai thác giọng nói trong năm 2026 không thể chỉ nói về tỷ lệ chia doanh thu. Nó phải xác lập rõ quyền nhân thân, quyền rút lui, quyền yêu cầu xóa dữ liệu, giới hạn ngữ cảnh sử dụng, nghĩa vụ gắn nhãn và trách nhiệm bồi thường nếu bản sao giọng nói bị dùng sai mục đích.
Khi tiếng nói đã có thể phát sinh giá trị kinh tế mà không cần sự hiện diện trực tiếp của chủ thể, luật và thị trường buộc phải trả lời ai được quyết định số phận của tiếng nói ấy. Nếu câu trả lời nghiêng hết về phía nền tảng và bên khai thác, con người sẽ mất quyền đối với chính phần giọng nói mang dấu ấn của mình. Nếu không siết chặt khung bảo vệ, tài sản số hôm nay sẽ nhanh biến thành cạm bẫy của ngày mai.

