Sử dụng công nghệ AI trong âm nhạc để làm sống lại giọng người đã khuất

Văn hóa - Đời sống - Ngày đăng : 16:50, 26/01/2021

Hàn Quốc đã sử dụng trí tuệ nhân tạo (AI) để đưa giọng hát của những ca sĩ đã khuất đến với công chúng thời nay. Song việc này lại dấy lên nhiều lo ngại về mặt đạo đức và vấn đề bản quyền.

Lần đầu tiên trong 25 năm, giọng hát đặc biệt của ngôi sao Hàn Quốc Kim Kwang-seok sẽ được phát trên sóng truyền hình quốc gia và hát một bài hát mới.

Đó là một điều bất ngờ vì ca sĩ nổi tiếng này đã qua đời.

Đài truyền hình quốc gia SBS có kế hoạch sử dụng trí tuệ nhân tạo (AI) để làm sống lại giọng hát của ca sĩ Kim Kwang-seok trong một chương trình mới "Competition of the Century: AI vs Human", sẽ phát sóng vào cuối tuần này.

Đây không phải là lần đầu tiên AI được sử dụng để hồi sinh giọng hát của một ca sĩ nổi tiếng ở Hàn Quốc.

Vào tháng 12 năm ngoái, kênh âm nhạc Mnet đã phát sóng "One More Time", một chương trình sử dụng AI và ảnh ba chiều của các nghệ sĩ quá cố để tri ân thành tựu âm nhạc của họ.

Vào đêm giao thừa, các siêu sao K-Pop BTS đã biểu diễn trực tuyến với phiên bản AI của ca sĩ Shin Hae-chul, người đã qua đời sau cuộc phẫu thuật vào năm 2014.

Các buổi biểu diễn AI gần đây đã khiến người hâm mộ phấn khích trước công nghệ này, nhưng những người khác lại đưa ra lo ngại về vấn đề đạo đức và pháp lý của việc làm sống lại giọng nói của người đã khuất. Việc tạo ra các tác phẩm mới - hay những giọng nói được hồi sinh - bởi AI cũng làm nảy sinh vấn đề về bản quyền. Ai mới được coi là chủ sở hữu? Người tạo ra chương trình AI hay là chính hệ thống AI?

Ca sĩ huyền thoại của Hàn Quốc
Vào năm 1996, Kim Kwang-seok qua đời khi ông chỉ mới 31 tuổi và đang ở trên đỉnh cao của sự nghiệp với một loạt các bản hit bao gồm A Letter From a Private, Song of My Life và In the Wilderness.

Cái chết của nam ca sĩ gây sốc đến mức một số người không chấp nhận thực tế là ngôi sao của họ đã tự sát, thay vào đó, họ chọn ách tin vào các thuyết âm mưu rằng ca sĩ đã bị sát hại.

Nhiều thập kỷ sau, người hâm mộ vẫn tụ tập trên một con phố mang tên ông, gần ngôi nhà thời thơ ấu củaông ở thành phố Daegu, mặc dù lễ tưởng niệm năm nay chủ yếu được tổ chức trực tuyến do đại dịch coronavirus.

210122002141-01-ai-singing-show-south-korea-super-169.jpg — Khách du lịch có thể ghé thăm con phố tri ân Kim Kwang-seok ở thành phố Daegu.

Những bức tranh tường của nghệ sĩ xuất hiện trên khắp đường phố, nơi khách du lịch ngồi trên những chiếc ghế dài hình cây đàn guitar và lắng nghe các nhạc sĩ chơi lại những bản hit hay nhất của anh ấy.

Vì vậy, khi đài truyền hình quốc gia SBS thông báo rằng họ đang sử dụng AI để tái tạo giọng hát của Kim trong một chương trình mới sẽ phát sóng trong tháng này đã khiến người hâm mộ "phát sốt".

Đoạn clip quảng cáo dài một phút của Kim hát I miss You, một bản ballad do Kim Bum-soo phát hành năm 2002, đã được xem hơn 145.000 lần trên YouTube kể từ tháng 12. Và một video đã được xem hơn 750.000 lần kể từ khi được đăng vào ngày 6.1.

Kim Jou-yeon, một người hâm mộ Kim hơn 30 năm, cho biết: “Giọng hát được tái tạo nghe rất giống anh ấy, cứ như thể Kim đã ghi âm nó khi còn sống vậy”.

Nó thậm chí còn gây ấn tượng với một người hâm mộ trẻ tuổi như Park Hye-Hyun, người chỉ mới hai tuổi khi Kim qua đời. "Một trong những mong muốn của tôi là được nghe nhiều bài hát hơn bằng giọng hát của Kim ... Tôi đã rơi nước mắt", cô nói.

Chương trình được lấy cảm hứng từ một trận đấu cờ vây giữa người và AI

Nhà sản xuất SBS Nam Sang-moon cho biết, ý tưởng về một cuộc thi đấu giữa AI với con người đã đến với ông sau khi xem nhà vô địch thế giới Lee Se-dol đối đầu với chương trình AI của Hàn Quốc HanDol trong trò chơi chiến thuật cờ vây vào năm 2019.

Đáng ngạc nhiên là Lee đã thắng một trong ba trận đấu.

Một tháng trước đó, Lee tuyên bố nghỉ thi đấu cờ vây chuyên nghiệp, nói rằng AI là "một thực thể không thể bị đánh bại."

160310125920-google-go-computer-human-game-super-169.jpg — Nhà vô địch cờ vây thế giới Lee Se-dol đối đầu với chương trình AlphaGo của Google vào năm 2016.

Trận đấu của Lee với HanDol khiến Nam nhớ lại trận đấu trước đó của Lee với AlphaGo, một chương trình AI do Google DeepMind phát triển, vào năm 2016. Lần đó, AlphaGo đã thắng 4/5 ván đấu và sau đó Lee nói rằng anh đã "đánh giá sai" khả năng chơi của cỗ máy.

Nhà sản xuất SBS Nam Sang-moon cho biết trong một cuộc phỏng vấn qua điện thoại: “Trận đấu Lee-AlphaGo là một cú sốc lớn và theo sau đó là một sự quan tâm rất lớn đến AI, thứ vẫn đang được phát triển ở đâu đó, nhưng chúng ta vẫn chưa quen với nó”.

Ông Nam cảm thấy công chúng Hàn Quốc đã sẵn sàng để biết đến AI và bắt đầu tạo ra một chuỗi cuộc thi đối đầu AI bao gồm sáu phần, bao gồm cả màn trình diễn AI của Kim Kwang-seok quá cố.

Tái tạo một giọng hát Kim Kwang-seok

Công ty âm thanh AI đứng đằng sau giọng hát được tái sinh của Kim Kwang-seok là Supertone, một công ty startup Hàn Quốc được thành lập vào năm 2020 chuyên cung cấp các giải pháp âm thanh AI cho người sáng tạo nội dung, theo lời Choi Hee-doo, đồng sáng lập và Giám đốc điều hành.

Choi nói lý giải về việc sử dụng AI cho việc ghi âm: "Ví dụ, những ngày này nhóm BTS thực sự rất bận và sẽ thật đáng tiếc nếu họ không thể tham gia vào chương trình nào đó do thiếu thời gian. Vì vậy, nếu BTS sử dụng công nghệ của chúng tôi khi làm game điện tử, audio book hoặc lồng tiếng cho hoạt hình chẳng hạn, họ không nhất thiết phải trực tiếp đi ghi âm".

Công nghệ Tổng hợp giọng hát (SVS) của Supertone học giọng bằng cách nghe nhiều bài hát với các nốt nhạc và lời bài hát tương ứng, Choi giải thích.

Hệ thống đã học 100 bài hát của 20 ca sĩ trước khi được đưa 10 bài hát của Kim Kwang-seok để học. Choi cho biết hiện giờ nó đã biết rõ giọng hát của ông ấy, đủ để bắt chước phong cách và cách phát âm độc đáo của ca sĩ.

Trong chương trình của đài SBS, "AI của Kim Kwang-seok sẽ hát song ca với một người. Chúng tôi đã hồi sinh Kim Kwang-seok để thể hiện khả năng của AI", Nam Sang-moon, nhà sản xuất của chương trình cho biết.

Thay vào đó, Ock Joo-hyun, cựu ca sĩ kiêm trưởng nhóm nhạc nữ Fin.K.L, sẽ đảm nhận việc hát song ca với AI. Cũng giống như hệ thống AI đã học được giọng nói của Kim, nó cũng sẽ được đào tạo để bắt chước ông ấy.

Trong khi một số người có thể coi cuộc cạnh tranh giữa ca sĩ AI và con người là một thứ vui vô hại thì những người khác cảnh báo công nghệ này đặt ra các mối đe dọa cần được giải quyết bằng các hướng dẫn và quy định nghiêm ngặt hơn.

210122002307-02-ai-singing-show-south-korea-super-169.jpg — Ock Joo-hyun, ca sĩ nổi danh của nhóm nhạc Fin.K.L

Những nguy hại tiềm ẩn của AI

Hàn Quốc, quốc gia am hiểu về công nghệ được coi là đi đầu trong công nghệ AI, nhưng có nhiều lời kêu gọi phải có nhiều quy định hơn.

Trong vòng vài ngày kể từ khi đưa ra bản kiến nghị vào tuần trước, hơn 376.000 người đã ký tên để kêu gọi các hình phạt cứng rắn hơn đối với những người tạo ra các video deepfake, đặc biệt là những người sử dụng khuôn mặt của những nghệ sĩ nổi tiếng nữ để làm nội dung khiêu dâm.

Các nhà nghiên cứu Deeptrace có trụ sở tại Amsterdam đã thống kê hơn 14.000 video deepfake trực tuyến vào năm 2019 và phát hiện ra rằng hầu hết trong số đó (96%) có nội dung khiêu dâm qua deepfake sử dụng hình ảnh của các nữ minh tinh, nhiều người đến từ Hàn Quốc.

Việc sao chép giọng nói của ai đó cũng gây ra những rủi ro nghiêm trọng, đặc biệt nếu âm thanh giả được sử dụng trong các chiến dịch thông tin sai lệch và gian lận. Vào năm 2019, những kẻ lừa đảo đã thuyết phục một giám đốc điều hành chuyển hàng trăm nghìn đô la tiền mặt vào một tài khoản, bằng cách giả giọng nói sếp của người đó bằng phần mềm âm thanh.

Vijay Balasubramaniyan, CEO và đồng sáng lập của Pindrop, nói với CNN vào năm ngoái: "Mỗi năm, chúng tôi chứng kiến thiệt hại khoảng 470 triệu USD do gian lận, bao gồm từ chuyển khoản ngân hàng và lừa đảo qua điện thoại. Quy mô lừa đảo rất lớn".

Trên toàn thế giới, các quốc gia và tổ chức đang kêu gọi cải cách luật pháp, hướng dẫn đạo đức và các thỏa thuận xã hội để ngăn chặn việc lạm dụng AI.

UNESCO đang làm việc với 193 quốc gia thành viên để thiết lập nền tảng đạo đức cho việc điều chỉnh công nghệ. Tháng 9 năm ngoái, UNESCO đã phát hành bản thảo "Khuyến nghị về Đạo đức của Trí tuệ Nhân tạo". Báo cáo cuối cùng dự kiến sẽ được trình lên Đại hội đồng của UNESCO vào năm nay.

Vào tháng 12, Bộ Khoa học và Thông tin, Công nghệ Truyền thông Hàn Quốc đã phát hành "Hướng dẫn đạo đức AI quốc gia", một tài liệu đưa ra các tiêu chuẩn cơ bản cho những người phát triển và đem vào ứng dụng công nghệ AI. Trong đó nói rằng AI nên được "phát triển và sử dụng phù hợp với mục đích và ý định của nó như một công cụ cho cuộc sống con người, và quá trình đó cũng phải có đạo đức."

Cùng tháng, Bộ đã công bố lộ trình cho luật AI, đề xuất mở rộng quyền sở hữu trí tuệ của Hàn Quốc ngoài các tác phẩm do con người tạo ra cho các nhà đầu tư và nhà phát minh đứng sau các sáng tạo AI.

Giám đốc Công nghệ Heo Hoon của Supertone cho biết ông ủng hộ làm ra luật pháp để điều tiết ngành công nghiệp này. Ông cho biết để giảm thiểu những rủi ro hiện tại, công ty không đưa công nghệ ra trực tiếp với công chúng, ưu tiên làm việc với các doanh nghiệp có chung tiêu chuẩn đạo đức với công ty.

Ông Heo nói: “Chúng tôi biết đến khả năng rằng công nghệ của chúng tôi sẽ bị sử dụng sai mục đích khi đến tay công chúng. Tôi nghĩ rằng việc làm sống lại giọng nói của những người đã khuất sẽ mang lại phản ứng trái chiều, hy vọng điều đó sẽ bắt đầu một cuộc tranh luận xã hội và chắc chắn sẽ dẫn đến hành pháp".

Công ty đã xây dựng một mức độ bảo vệ cho các bản ghi âm của mình bằng cách đánh dấu âm thanh là do AI của họ tạo ra, mặc dù người nghe bình thường khó có thể nhận biết được.

Ông Heo cho biết: “Chúng tôi có công nghệ watermarking, có nghĩa là một thông tin được cài vào âm thanh, không thể nghe thấy được, nhưng theo dõi được nơi nó được tạo ra và cách nó được phân phối ra thị trường”.

Câu hỏi về quyền sở hữu

Việc sử dụng AI để tạo ra các tác phẩm tạo ra vấn đề về quyền sở hữu. Nếu AI sáng tạo ra các tác phẩm, liệu chương trình giữ bản quyền, hay nó thuộc về lập trình viên?

Luật sư Ko Hwan-Kyoung, một chuyên gia về AI và bảo vệ dữ liệu, cho biết vấn đề này cần được giải quyết khi AI ngày càng trở nên tiên tiến hơn.

"Điều thú vị về AI là nó đang phát triển đến một cấp độ mà nó có thể viết và soạn thảo bằng cách nghiên cứu các dữ liệu", Ko Hwan-kyoung nói.

Năm ngoái, ca sĩ Hayeon đã phát hành Eyes on You, một đĩa đơn do chương trình AI sáng tác. Các nhà sản xuất con người sau đó đã tinh chỉnh bài hát, theo lời hãng thu âm của cô, Enterarts.

Ở những nơi khác, AI đã được sử dụng để tạo ra tin tức, sách và thậm chí cả nghệ thuật. Thông thường, người sáng tạo được coi là sở hữu tác phẩm, nhưng trong trường hợp AI thì điều đó không được rõ ràng.

"Liệu chúng ta có thừa nhận AI là thực thể hợp pháp với tư cách pháp nhân như con người và cấp bản quyền hay không?" luật sư Ko Hwan-kyoung hỏi. "Chúng ta cần làm luật để đảm bảo an toàn cho con người mà không cản trở quá mức đến sự phát triển của công nghệ AI".

Về trường hợp của Kim Kwang-seok, nhà sản xuất Nam Sang-moon cho biết SBS đã được sự đồng ý của gia đình Kim để tái tạo giọng nói của anh trước khi tiến hành chương trình.

SBS đã trả một khoản phí cho gia đình anh ấy để góp giọng trong chương trình, giống như họ đã làm với các thành viên khác, ông Nam nói. Các phần của chương trình sẽ được xuất bản trên YouTube sau khi phát sóng, nhưng cả SBS và Supertone đều không có kế hoạch phát hành bài hát của Kim dưới dạng đĩa đơn.

"Chúng tôi đã đồng ý không chính thức phát hành các bài hát được giới thiệu trong chương trình", Supertone nói.

Vì vậy, hiện tại, người hâm mộ của Kim sẽ phải chấp nhận với việc chơi các bài hát cũ được thu âm bởi chính ca sĩ từ 20 năm về trước.

Hoàng Phương