Hotline quảng cáo: 096 2445664 Hotline nội dung: 0934.999945

Nhịp đập khoa học

Voice Engine tạo bản sao giọng nói con người giống đến kỳ lạ, OpenAI chưa triển khai rộng rãi vì sợ rủi ro

Sơn Vân • 30/03/2024 08:35

Theo OpenAI, Voice Engine sử dụng đoạn âm thanh giọng nói chỉ 15 giây của người thật để tạo ra bản sao giọng giống đến kỳ lạ.

Hôm 29.3, OpenAI đã phát hành bản xem trước Voice Engine, công cụ trí tuệ nhân tạo (AI) tạo giọng nói số mà họ cho biết có thể tạo ra giọng nói nghe tự nhiên dựa trên mẫu âm thanh 15 giây.

Đây là sản phẩm mới nhất của OpenAI, công ty khởi nghiệp ở thành phố San Francisco (Mỹ) đứng sau chatbot nổi tiếng ChatGPT, trình tạo hình ảnh DALL-E và mô hình chuyển văn bản thành video Sora.

Thông qua một bài đăng trên blog, OpenAI cho biết đã thử nghiệm Voice Engine trong hàng loạt các ứng dụng như hỗ trợ đọc cho trẻ em, dịch ngôn ngữ và phục hồi giọng nói cho bệnh nhân ung thư.

Một số người dùng mạng xã hội đã phản ứng bằng cách nêu bật các hành vi sử dụng sai mục đích có thể xảy ra, gồm cả hành vi gian lận tiềm ẩn bằng bắt chước giọng nói trái phép (deepfake).

OpenAI cho biết đang tạm dừng việc phát hành Voice Engine rộng rãi hơn vì có khả năng bị lạm dụng, đặc biệt là trong năm bầu cử.

"Chúng tôi nhận ra rằng việc tạo ra giọng nói giống với con người mang lại những rủi ro nghiêm trọng, đặc biệt là trong một năm bầu cử. Chúng tôi đang hợp tác với các đối tác ở Mỹ và quốc tế từ các cơ quan chính phủ, truyền thông, giải trí, giáo dục, xã hội dân sự và xa hơn nữa để đảm bảo rằng đang kết hợp phản hồi của họ trong quá trình xây dựng", OpenAI viết trong bài đăng trên blog.

OpenAI tiết lộ phát triển Voice Engine lần đầu tiên vào cuối năm 2022 và bí mật sử dụng nó trong các sản phẩm khác. Công ty đang sử dụng Voice Engine để cung cấp các tính năng "đọc to" của ChatGPT, cũng như API chuyển văn bản thành giọng nói của công ty.

Cuối năm 2023, OpenAI bắt đầu mở rộng công cụ AI này ra bên ngoài, hợp tác với "một nhóm nhỏ các đối tác đáng tin cậy" để thử nghiệm Voice Engine cho các nội dung như tài liệu giáo dục dành cho trẻ em, dịch ngôn ngữ và phục hồi giọng nói trong y tế.

OpenAI nhấn mạnh rằng các đối tác của họ phải tuân theo chính sách nghiêm ngặt để sử dụng Voice Engine, chẳng hạn nhận được sự đồng ý của mọi cá nhân bị bắt chước giọng nói và thông báo cho người nghe rằng giọng nói được tạo ra bởi AI.

“Chúng tôi đang thực hiện một cách tiếp cận thận trọng và sáng suốt để phát hành Voice Engine rộng rãi hơn do nguy cơ lạm dụng giọng nói tổng hợp. Chúng tôi hy vọng sẽ bắt đầu một cuộc đối thoại về việc triển khai có trách nhiệm các giọng nói tổng hợp và cách xã hội có thể thích ứng với những khả năng mới này. Dựa trên những cuộc trò chuyện này và kết quả của các cuộc thử nghiệm quy mô nhỏ, chúng tôi sẽ đưa ra quyết định sáng suốt hơn về việc có nên triển khai Voice Engine trên quy mô lớn hay không và như thế nào”, OpenAI nhấn mạnh trong bài viết.

voice-engine-tao-ban-sao-giong-noi-con-nguoi-giong-den-ky-la-openai-chua-dam-trien-khai-rong-vi-so-rui-ro.jpeg — Voice Engine có thể tạo ra giọng nói nghe tự nhiên dựa trên mẫu âm thanh 15 giây - Ảnh: Internet

Dù vẫn chưa chắc chắn liệu có phát hành Voice Engine rộng rãi cho công chúng hay không, OpenAI đã thúc đẩy các nhà hoạch định chính sách và nhà phát triển thực hiện các bước để ngăn chặn việc sử dụng sai công nghệ này.

Ví dụ, OpenAI đề xuất lập một "danh sách giọng nói không được phép" để ngăn chặn việc bắt chước giọng nói của những người nổi tiếng, chẳng hạn chính trị gia hoặc người nổi tiếng mà không được sự đồng ý của họ.

Công ty cũng khuyến nghị các ngân hàng ngừng sử dụng xác thực bảo mật dựa trên giọng nói và những nhà nghiên cứu phát triển các kỹ thuật để theo dõi xem giọng nói là thật hay giả.

Vào tháng 1, cuộc gọi tự động (robocall) sử dụng âm thanh giả của Tổng thống Mỹ - Joe Biden đã lan truyền tới bang New Hampshire, kêu gọi các cử tri ủng hộ đảng Dân chủ ở nhà và không đi bỏ phiếu để lựa chọn ứng cử viên Tổng thống Mỹ của đảng này.

Nội dung cuộc gọi được ghi âm sẵn này kêu gọi người dân ở New Hampshire "để dành" lá phiếu cho đến cuộc bầu cử Tổng thống Mỹ vào tháng 11.2024 và rằng việc họ đi bỏ phiếu ngày 23.1 tại bang này sẽ chỉ giúp cho nỗ lực của đảng Cộng hòa để đưa ông Donald Trump quay trở lại Nhà Trắng một lần nữa.

Nội dung ghi âm còn kêu gọi cử tri ở New Hampshire ghi tên Tổng thống Joe Biden trên các lá phiếu sẽ được phát ra trong cuộc bầu cử sơ bộ tại bang này.

Bà Julie Chavez Rodriguez (người quản lý chiến dịch tranh cử của ông Biden) cho biết các cuộc gọi tự động đã phát đi "thông tin sai lệch", đồng thời cũng coi đây là nỗ lực nhằm phá rối cuộc bầu cử sơ bộ.

Tổng thống Biden không có tên trên lá phiếu trong cuộc bầu cử sơ bộ ngày 23.1 tại New Hampshire. Lý do vì đảng Dân chủ đã thay đổi lịch trình tiến hành các cuộc bầu cử sơ bộ trong năm 2024, theo đó South Carolina được đưa lên thành bang tiến hành bầu cử sơ bộ đầu tiên của đảng Dân chủ, thay vì tổ chức tại New Hampshire như truyền thống.

Ông John Formella, người đứng đầu cơ quan tư pháp New Hampshire, cho rằng đây là hành động trái pháp luật nhằm cản trở cuộc bầu cử sơ bộ tại bang và gây sức ép đối với cử tri nơi đây.

John Formella nói đơn vị giám sát luật bầu cử của New Hampshire đã tiến hành điều tra vụ việc. Hiện chưa thể xác định số lượng cuộc gọi như vậy được phát tán tại bang này. Tuy nhiên, bà Kathy Sullivan, cựu Chủ tịch nhánh đảng Dân chủ tại New Hampshire, nói nhiều người đã kể lại việc nhận được cuộc gọi tự động sử dụng AI để giả mạo giọng nói của Tổng thống Biden.

Kathy Sullivan nói cuộc gọi như vậy đã tự động kết nối với điện thoại di động cá nhân mà không được sự cho phép của bà.

Tại Mỹ, robocall thường là những cuộc gọi được ghi âm sẵn tới những số điện thoại cố định, điện thoại di động, thậm chí đến cả những số điện thoại hỗ trợ khẩn cấp, với mục đích chính là thu hồi nợ tín dụng hoặc tiếp thị quảng cáo.

Sau sự việc đó, Ủy ban Truyền thông Liên bang Mỹ (FCC) đã bỏ phiếu nhất trí cấm các cuộc gọi tự động được tạo bởi AI mà không có sự đồng ý từ người nhận.

OpenAI, Microsoft, Meta và 17 hãng công nghệ ký hiệp định chống AI can thiệp vào bầu cử toàn cầu

Giữa tháng 2, một nhóm gồm 20 hãng công nghệ đã đồng ý hợp tác để ngăn chặn nội dung lừa đảo do AI tạo ra can thiệp vào các cuộc bầu cử trên toàn cầu trong năm 2024.

Sự phát triển nhanh chóng của AI tạo sinh (có thể tạo ra văn bản, hình ảnh và video trong vài giây dựa trên gợi ý của người dùng) đã làm gia tăng lo ngại rằng công nghệ này có thể được sử dụng để tác động đến các cuộc bầu cử lớn trong năm 2024, khi hơn một nửa dân số thế giới chuẩn bị đi bầu cử.

Theo Reuters, các bên đã ký kết hiệp định công nghệ, được công bố tại Hội nghị An ninh Munich (Đức), gồm cả các công ty đang xây dựng các mô hình AI tạo sinh được sử dụng để tạo nội dung như OpenAI, Microsoft và Adobe. Các bên ký kết khác là những nền tảng truyền thông xã hội sẽ phải đối mặt với thách thức loại bỏ nội dung có hại khỏi trang web của họ, chẳng hạn Meta Platforms, TikTok và X (trước đây gọi là Twitter).

Thỏa thuận gồm các cam kết hợp tác phát triển công cụ phát hiện hình ảnh, video và âm thanh gây hiểu lầm do AI tạo ra, tạo các chiến dịch nâng cao nhận thức của cộng đồng nhằm hướng dẫn cử tri về nội dung lừa đảo và thực hiện hành động với nội dung đó trên dịch vụ của họ.

Các hãng cho biết công nghệ để xác định nội dung do AI tạo hoặc xác nhận nguồn gốc của nó có thể gồm cả hình mờ hoặc nhúng siêu dữ liệu.

Hiệp định không nêu rõ thời gian thực hiện các cam kết hoặc cách mỗi công ty sẽ thực hiện chúng.

Nick Clegg, Chủ tịch phụ trách các vấn đề toàn cầu của Meta Platforms, nhận xét: “Điều tôi nghĩ là hữu ích ở đây là sự đa dạng của các công ty tham gia ký kết hiệp định. Việc các nền tảng riêng lẻ phát triển các chính sách phát hiện, nguồn gốc, dán nhãn, đánh dấu bản quyền... là điều tốt, nhưng nếu không có một cam kết rộng hơn để thực hiện chúng theo cách liên kết hoạt động chung, thì chúng ta sẽ bị mắc kẹt với mớ hỗn độn các cam kết khác nhau”.

Theo Dana Rao, Giám đốc Ủy thác của Adobe, bất chấp sự phổ biến của công cụ tạo văn bản như ChatGPT, các hãng công nghệ sẽ tập trung vào việc ngăn chặn tác hại của ảnh, video và âm thanh AI, một phần vì người dân có xu hướng hoài nghi hơn với văn bản.

Ông nói: “Có một sự kết nối cảm xúc với âm thanh, video và hình ảnh. Bộ não của bạn được lập trình để tin vào loại phương tiện truyền thông đó".

Bài liên quan

Nhiều nhân viên lo sợ Microsoft trở thành một bộ phận CNTT của OpenAI

Một số người trong nội bộ Microsoft lo ngại chiến lược trí tuệ nhân tạo (AI) của công ty quá tập trung vào quan hệ đối tác với OpenAI.

Đọc tiếp

Rộ tin OpenAI dùng số lượng lớn video YouTube để đào tạo Sora, vượt qua các giới hạn của Google

‘Sora đang phá hủy con người, tước đi sự sáng tạo của chúng tôi’

Sam Altman thuyết phục Hollywood rằng Sora sẽ không phá hủy ngành kinh doanh điện ảnh

(0) Bình luận

Xếp theo:

Đọc thêm Nhịp đập khoa học

Nổi bật Một thế giới

Hồi ức thanh niên xung phong trên tuyến đường 1C huyền thoại

8 giờ trước Văn hóa

Vào khoảng năm 1967, đường Hồ Chí Minh trên biển chi viện cho đồng bằng Tây Nam Bộ bị địch phát hiện và đánh phá dữ dội. Khi đường biển khó đi, buộc phải có con đường khác mở ra ngay để không bị gián đoạn chi viện. Đoàn 195 của Quân khu 9 ra đời cùng với lực lượng TNXP Tây Nam Bộ, đảm đương nhiệm vụ vận chuyển vũ khí từ các kho ở biên giới Campuchia và miền Đông Nam Bộ về trữ, cất giấu rồi phân phối lại cho các lực lượng vũ trang của quân khu và các tỉnh miền Tây.

Liên hiệp Các hội KH-KT Việt Nam góp ý cần sớm hoàn thiện quy chuẩn kỹ thuật quốc gia về kỹ thuật điện

Việc xây dựng và ban hành Quy chuẩn kỹ thuật quốc gia về kỹ thuật điện - hệ thống lưới điện...
Động đất mạnh hơn 7 độ richter ở Myanmar, Việt Nam cũng cảm nhận rung lắc

Một trận động đất mạnh hơn 7 độ richter ở Myanmar khiến nhiều nơi ở Hà Nội rung lắc.
Được đầu tư hàng chục tỉ USD, vì sao AI vẫn bị nghi ngờ không thể 'như người'?

Một khảo sát mới đây cho thấy phần lớn các nhà khoa học trong lĩnh vực trí tuệ nhân tạo (AI)...

Đừng bỏ lỡ

Tập đoàn SCG với tham vọng lọt top dẫn đầu ngành xây dựng

9 phút trước Kinh tế - đầu tư - dự án

Với tổng giá trị hợp đồng thi công đã ký hơn 40 nghìn tỉ đồng giai đoạn 2025-2026 cùng chiến lược sáp nhập vào Sunshine Group, Công ty cổ phần Tập đoàn Xây dựng SCG (HNX: SCG) hướng tới mục tiêu tăng trưởng đột phá, mở rộng thị phần và thuộc top doanh nghiệp dẫn đầu ngành xây dựng Việt Nam.
Long An và Vingroup hợp tác chuyển đổi xanh, chuyển đổi số và phát triển bền vững

14 phút trước Kinh tế - đầu tư - dự án

Ngày 28.3, UBND tỉnh Long An và Tập đoàn Vingroup đã ký kết biên bản ghi nhớ hợp tác toàn diện nhằm thúc đẩy chuyển đổi xanh, chuyển đổi số, góp phần hiện thực hóa các mục tiêu phát triển bền vững giai đoạn 2025 - 2030 và hưởng ứng cam kết của Chính phủ đạt mức phát thải ròng bằng 0 vào năm 2050.
Mỹ ngừng đóng góp tài chính cho WTO

14 phút trước Quốc tế

Reuters dẫn nhiều nguồn tin tiết lộ trong bối cảnh chính quyền Tổng thống Donald Trump cắt giảm chi tiêu công, Mỹ đã ngừng đóng góp tài chính cho Tổ chức Thương mại thế giới (WTO).
An Giang: Bắt giữ nghi phạm bạo hành con riêng của người tình đến chết

24 phút trước Sự kiện

Trưa 28.3, Phòng Cảnh sát hình sự Công an tỉnh An Giang cho biết đơn vị đang tạm giữ hình sự đối với Lê Văn Trường (SN 1991, ngụ khóm Long Thạnh A, phường Long Thạnh, thị xã Tân Châu, tỉnh An Giang) để tiếp tục điều tra về hành vi “giết người”.
Bị cáo Trương Mỹ Lan nói ‘chưa bao giờ nghĩ đến việc lừa đảo ai’

34 phút trước Sự kiện

Trả lời thẩm vấn tại tòa, bị cáo Trương Mỹ Lan cho biết bản thân một đời sống vì chữ tín, “chưa bao giờ nghĩ đến việc lừa đảo hay chiếm đoạt tài sản của ai”.

Mới nhất

Liên hiệp Các hội KH-KT Việt Nam góp ý cần sớm hoàn thiện quy chuẩn kỹ thuật quốc gia về kỹ thuật điện

một giờ trước Khoa học - công nghệ

Việc xây dựng và ban hành Quy chuẩn kỹ thuật quốc gia về kỹ thuật điện - hệ thống lưới điện là bước đi quan trọng nhằm đảm bảo tính an toàn, đồng bộ, hiệu quả cho hệ thống điện trong bối cảnh chuyển dịch năng lượng và phát triển hạ tầng lưới điện hiện đại.
Động đất mạnh hơn 7 độ richter ở Myanmar, Việt Nam cũng cảm nhận rung lắc

một giờ trước Khoa học - công nghệ

Một trận động đất mạnh hơn 7 độ richter ở Myanmar khiến nhiều nơi ở Hà Nội rung lắc.
Thanh niên TP.HCM kiến nghị nhiều nội dung với lãnh đạo thành phố

1 giờ trước Sự kiện

Ngày 28.3, UBND TP.HCM tổ chức hội nghị đối thoại giữa lãnh đạo TP với thanh niên năm 2025.
Vua Charles III gặp tác dụng phụ từ điều trị ung thư

3 giờ trước Quốc tế

CNN dẫn lời Điện Buckingham thông báo vua Charles III vào ngày 27.3 phải nằm viện theo dõi do bị tác dụng phụ từ đợt ung thư theo lịch trình.
Quan hệ Mỹ - Ukraine: Hạ nhiệt tạm thời, thách thức dài hạn

3 giờ trước Góc nhìn

Cuộc gặp gây tranh cãi giữa Tổng thống Ukraine Volodymyr Zelensky và Tổng thống Mỹ Donald Trump tại Nhà Trắng hồi tháng trước dường như đã lắng xuống.

Xem thêm

Cơ quan chủ quản: Hội Thông tin Khoa học và Công nghệ Việt Nam.

ĐC: 24 Lý Thường Kiệt, Hàng Bài, Hoàn Kiếm, Hà Nội.

ĐT: 024.38256203

Hotline nội dung : 0934999945

Tổng biên tập: Hoàng Đại Thanh

Tổng Thư ký Tòa soạn: Nguyễn Đình Mười

Giấy phép số 77/GP-BTTTT do Bộ Thông tin và Truyền thông cấp ngày 26 tháng 2 năm 2020.

Tòa nhà SIMCO Sông Đà, Tiểu KĐT mới Vạn Phúc, Phường Vạn Phúc, Quận Hà Đông, TP. Hà Nội

ĐT: 0984708866

TPHCM: 345/134 Trần Hưng Đạo, phường Cầu Kho, Quận 1

ĐT: 028.38389241

Email: toasoan@1thegioi.vn

Hotline quảng cáo: 096 2445664

Email quảng cáo: sales@1thegioi.vn

Báo giá quảng cáo:

Công ty Cổ phần Truyền thông Một Thế Giới

Voice Engine tạo bản sao giọng nói con người giống đến kỳ lạ, OpenAI chưa triển khai rộng rãi vì sợ rủi ro

Nhiều nhân viên lo sợ Microsoft trở thành một bộ phận CNTT của OpenAI

Voice Engine

bản sao giọng nói con người

OpenAI

Rộ tin OpenAI dùng số lượng lớn video YouTube để đào tạo Sora, vượt qua các giới hạn của Google

‘Sora đang phá hủy con người, tước đi sự sáng tạo của chúng tôi’

Sam Altman thuyết phục Hollywood rằng Sora sẽ không phá hủy ngành kinh doanh điện ảnh

Rộ tin OpenAI dùng số lượng lớn video YouTube để đào tạo Sora, vượt qua các giới hạn của Google

‘Sora đang phá hủy con người, tước đi sự sáng tạo của chúng tôi’

Sam Altman thuyết phục Hollywood rằng Sora sẽ không phá hủy ngành kinh doanh điện ảnh

Sam Altman thuyết phục Hollywood rằng Sora sẽ không phá hủy ngành kinh doanh điện ảnh

Thị trường di động sẽ đóng góp cho nền kinh tế 1.100 tỉ USD vào 2030, Trung Quốc đầu tư mạnh vào 5.5G và 6G

Hướng dẫn nông dân sử dụng thuốc bảo vệ thực vật an toàn, hiệu quả

Tài sản số “vàng thau lẫn lộn”, cần khung pháp lý

Trung Quốc dẫn đầu cuộc đua năng lượng xanh với giá lắp đặt tua-bin gió bằng 1/5 so với Mỹ

Khu công nghiệp phát triển bền vững: Chặng đường còn xa

Hồi ức thanh niên xung phong trên tuyến đường 1C huyền thoại

Liên hiệp Các hội KH-KT Việt Nam góp ý cần sớm hoàn thiện quy chuẩn kỹ thuật quốc gia về kỹ thuật điện

Động đất mạnh hơn 7 độ richter ở Myanmar, Việt Nam cũng cảm nhận rung lắc

Được đầu tư hàng chục tỉ USD, vì sao AI vẫn bị nghi ngờ không thể 'như người'?

Tập đoàn SCG với tham vọng lọt top dẫn đầu ngành xây dựng

Long An và Vingroup hợp tác chuyển đổi xanh, chuyển đổi số và phát triển bền vững

Mỹ ngừng đóng góp tài chính cho WTO

An Giang: Bắt giữ nghi phạm bạo hành con riêng của người tình đến chết

Bị cáo Trương Mỹ Lan nói ‘chưa bao giờ nghĩ đến việc lừa đảo ai’

Liên hiệp Các hội KH-KT Việt Nam góp ý cần sớm hoàn thiện quy chuẩn kỹ thuật quốc gia về kỹ thuật điện

Động đất mạnh hơn 7 độ richter ở Myanmar, Việt Nam cũng cảm nhận rung lắc

Thanh niên TP.HCM kiến nghị nhiều nội dung với lãnh đạo thành phố

Vua Charles III gặp tác dụng phụ từ điều trị ung thư

Quan hệ Mỹ - Ukraine: Hạ nhiệt tạm thời, thách thức dài hạn

'Bóng ma' dưới tuyết: Cuộc đối đầu lặng lẽ giữa đặc nhiệm Ukraine và chiến binh Triều Tiên tại Kursk

Các nhà đầu tư vào ByteDance hiện tại dẫn đầu cuộc đua mua lại TikTok ở Mỹ

AI bùng nổ thúc đẩy các khoản vay kỷ lục cho trung tâm dữ liệu ở Đông Nam Á

Cựu Chủ tịch Google Trung Quốc đặt cược tương lai 01.AI vào DeepSeek và mã nguồn mở

Lý do Trung Quốc đang dẫn trước Mỹ, châu Âu trong cuộc đua phát triển 6G