Hotline quảng cáo: 096 2445664 Hotline nội dung: 0934.999945

Nhịp đập khoa học

Chế độ giọng nói nâng cao của ChatGPT có thể giả giọng giống nhiều người dùng đáng kinh ngạc

Sơn Vân • 14/10/2024 10:40

Tính năng Advanced Voice Mode (chế độ giọng nói nâng cao) của ChatGPT gây ngạc nhiên cho nhiều người dùng.

Khi nghĩ đến giọng nói được lập trình bởi trí tuệ nhân tạo (AI), bạn có thể hình dung ra điều gì đó nghe như robot, gượng gạo, với nhịp điệu không thể nắm bắt được các điểm nhấn, tốc độ và cảm xúc cần thiết để nghe giống con người. Song đây là năm 2024 và những robot này đã được nâng cấp đáng kể. Giờ đây, chúng có thể bắt chước giọng nói, giọng địa phương và ngữ điệu ở mức gần như đáng kinh ngạc, tùy theo cách nhìn của bạn.

Tính năng Advanced Voice Mode (ra mắt với hầu hết người dùng ChatGPT tuần trước) là phiên bản âm thanh của ChatGPT ban đầu, sử dụng AI để phản hồi các câu lệnh văn bản theo cách trò chuyện. Advanced Voice Mode hoạt động theo cách tương tự như ChatGPT ban đầu, nhưng sử dụng âm thanh. Người dùng chỉ cần nói vào ứng dụng và giọng nói của ChatGPT sẽ tự động phản hồi. Bạn có thể chọn 1 trong 9 giọng nói. Sau đó, thông qua lời nhắc trong cuộc trò chuyện và văn bản, bạn sẽ dạy những giọng đó nói theo cách mà mình thích.

Advanced Voice Mode hoạt động đủ tốt để OpenAI, công ty tạo ra ChatGPT, phát hành báo cáo an toàn cảnh báo rằng con người có thể trở nên phụ thuộc cảm xúc vào tính năng này.

che-do-giong-noi-nang-cao-cua-chatgpt-co-the-gia-giong-nhieu-nguoi-dung-giong-dang-kinh-ngac.jpg — Advanced Voice Mode của ChatGPT có thể bắt chước giọng nói, giọng địa phương và ngữ điệu ở mức gần như đáng kinh ngạc - Ảnh: Getty Images

“Advanced Voice Mode nhận dạng cả từ ngữ bạn đang nói và ngữ điệu trong giọng bạn, nhưng cũng dựa trên ngữ cảnh những từ mà bạn dùng để phản hồi theo cách hợp lý nhất. ChatGPT luôn là mô hình dự đoán, phải không? Vì vậy, ChatGPT chỉ dự đoán câu trả lời có khả năng đúng nhất dựa trên thông tin đầu vào mà bạn cung cấp, và giờ đây nó làm điều đó với âm thanh”, Celia Quillian (nữ chuyên gia về AI) giải thích.

Tính năng mới khiến nhiều người dùng TikTok đăng video khoe khả năng của Advanced Voice Mode, gồm cả việc nói bằng tiếng lóng, phương ngữ và thậm chí là giọng địa phương. Kết quả thường bất ngờ và hài hước.

Khi Morissa Schwartz, nữ doanh nhân gốc New Jersey (một bang ở Mỹ), yêu cầu ChatGPT bắt chước giọng của mình, ứng dụng này không ngần ngại thực hiện điều đó.

“Ay, bạn khỏe không? Tôi là Morissa, đang ở bờ biển, ăn một lát bánh pizza ngon nhất. Bạn biết đấy, đây là loại pizza mà khiến bạn muốn chuyển đến đây chỉ vì đồ ăn, đừng bận tâm”, ChatGTP nói với giọng điệu được nhấn mạnh.

"Trong tai bạn, tôi thực sự nghe như vậy sao? Tôi biết mình có chút giọng Jersey, nhưng có thực sự dễ nhận ra như vậy không?", Morissa Schwartz hỏi trong video cuộc trò chuyện với ChatGPT mà cô đăng lên tài khoản TikTok cá nhân.

“Chà, cô chắc chắn có một chút phong cách Jersey. Nó có cá tính và sự ấm áp, giống như cô”, ChatGPT trả lời.

Morissa Schwartz kể rằng là người gốc New Jersey đời thứ sáu, cảm thấy ấn tượng của ChatGPT về cô là “sự bất ngờ hài hước”.

“Tôi không hề biết nó có thể bắt chước giọng nói. Vài ngày sau khi dùng Advanced Voice Mode, tôi nhận thấy nó thay đổi giọng điệu, nên thử hỏi liệu nó có thể bắt chước tôi không. Tôi rất sốc khi thấy nó làm quá tốt, như thể ‘Liệu ứng dụng này có bí mật xem hết video TikTok của tôi không?’”, Morissa Schwartz chia sẻ.

Morissa Schwartz nói thêm rằng: “Trò chuyện với chatbot trước đây giống đặt câu hỏi cho một giáo sư rất thông thái. Song giờ đây, có cảm giác như giáo sư thông thái đó là bạn thân của tôi”.

Advanced Voice Mode thường dựa vào các hình mẫu và khuôn mẫu khi cố gắng giao tiếp theo cách mà người dùng yêu cầu. Điều này có thể dẫn đến các phản hồi mà một số người dùng cảm thấy bị xúc phạm.

Khi người có tầm ảnh hưởng là Noah Miller yêu cầu Advanced Voice Mode nói theo kiểu “siêu gay”, ChatGPT đã đáp lại theo cách tương ứng: “Tất nhiên, bạn thân yêu ơi, hãy có một buổi trò chuyện tuyệt vời nào. Bạn có gì muốn nói? Chia sẻ đi”. Noah Miller cảm thấy cuộc trò chuyện đó rất buồn cười.

Dù hầu hết người dùng hiện sử dụng Advanced Voice Mode để giải trí, Celia Quillian đã thấy một số ứng dụng thực tế cho tính năng này, gồm giúp những người học âm thanh với bài tập về nhà, dịch theo thời gian thực và đóng vai trò như nhà trị liệu thay thế.

“Nghe có vẻ lạ, tôi rất ủng hộ liệu pháp tâm lý và các nhà trị liệu là con người. Nhưng nếu bạn không đủ chi phí và chỉ cần một người lắng nghe, trò chuyện với Advanced Voice Mode có thể mang lại cảm giác rất giống như bạn đang nói chuyện với người hiểu và đồng cảm với mình, biết đặt câu hỏi lại và cố gắng hiểu cảm xúc của bạn. Tôi có thể xem Advanced Voice Mode như một cách để giải quyết các vấn đề khi muốn nói thành tiếng mà không có ai khác xung quanh bạn, theo một cách rất đồng cảm”, Celia Quillian cho hay.

Dù vậy, Celia Quillian cũng thừa nhận có thể xuất hiện mặt trái khi người ta trở nên quá phụ thuộc cảm xúc vào robot, như OpenAI cảnh báo, dù Advanced Voice Mode thông minh và sống động đến đâu.

“Tôi nghĩ rằng có một nỗi sợ hãi chính đáng trong nhiều người rằng với những công cụ cảm xúc như thế này, người ta có thể bắt đầu dùng AI thay thế cho các mối quan hệ,. Điều đó đáng sợ, đúng không? Tôi đồng ý với điều đó. Tôi nghĩ rằng cần có sự cân bằng. Bạn biết đấy, chúng ta không thể quên đi tính nhân văn và các mối quan hệ với nhau trong bối cảnh sử dụng những công cụ này, nhưng chúng ta cũng có thể dùng chúng để nâng cao sự kết nối và mối quan hệ giữa chúng ta với nhau và với chính bản thân mình", Celia Quillian kết luận.

Giới hạn của Advanced Voice Mode với người dùng ChatGPT miễn phí

Từ hôm 2.10, người dùng ChatGPT miễn phí cuối cùng cũng được trải nghiệm Advanced Voice Mode.

Tính năng này vốn đã được triển khai cho người dùng trả phí ChatGPT Plus và ChatGPT Team từ vài tháng trước, ngoại trừ tại EU (Liên minh châu Âu) do các quy định khắt khe về quyền riêng tư.

Advanced Voice Mode cho phép người dùng tương tác với ChatGPT bằng giọng nói tự nhiên hơn, giống đang trò chuyện với người thật. Người dùng có thể ngắt lời, thay đổi câu hỏi, điều chỉnh câu trả lời dựa trên những gì ChatGPT vừa nói.

Điển giới hạn với người dùng ChatGPT miễn phí là chỉ được sử dụng Advanced Voice Mode 15 phút mỗi tháng. Để dùng Advanced Voice Mode không giới hạn thời gian, bạn cần nâng cấp lên ChatGPT Plus với giá 20 USD/tháng (dự kiến sẽ tăng lên 22 USD trong thời gian tới). Ngoài ra, bạn cần cập nhật ứng dụng ChatGPT lên phiên bản mới nhất để trải nghiệm Advanced Voice Mode.

OpenAI cũng thông báo Advanced Voice Mode sẽ được triển khai cho người dùng ChatGPT Enterprise, Edu và Team trên toàn cầu.

Việc cung cấp Advanced Voice Mode cho ChatGPT miễn phí là chiến lược để OpenAI thu hút thêm người dùng trả tiền nâng cấp lên bản Plus, yếu tố quan trọng trong bối cảnh công ty phải đối mặt với khoản lỗ lớn.

Những tháng qua, OpenAI triển khai ngày càng nhiều dịch vụ AI cho doanh nghiệp và người tiêu dùng. Mới đây, OpenAI đã nhận một trong những khoản đầu tư tư nhân lớn nhất từ trước đến nay, huy động được 6,6 tỉ USD với mức định giá công ty đến 157 tỉ USD.

Vòng gọi vốn này thu hút các nhà đầu tư mạo hiểm quay trở lại, gồm cả Thrive Capital và Khosla Ventures, cũng như Microsoft (nhà đầu tư lớn nhất vào OpenAI) và sự tham gia mới từ Nvidia.

Việc hoàn tất vòng gọi vốn trùng với các nỗ lực tái cấu trúc đang diễn ra của OpenAI và những thay đổi trong ban điều hành, gồm cả sự ra đi đột ngột của Mira Murati.

Altimeter Capital, Fidelity, SoftBank và MGX (công ty đầu tư do chính quyền UAE hậu thuẫn) cũng tham gia vòng gọi vốn này của OpenAI.

Sarah Friar, Giám đốc tài chính OpenAI, nói với các nhân viên hôm 2.10 rằng công ty sẽ có thể cung cấp thanh khoản cho họ thông qua đề nghị mua lại cổ phần sau khi hoàn thành huy động vốn, dù chưa có chi tiết và thời gian cụ thể, theo một nguồn tin. Đầu năm nay, OpenAI đã cho phép một số nhân viên bán cổ phần của họ theo mức định giá công ty khi đó là 86 tỉ USD.

Thrive Capital, cam kết khoảng 1,2 tỉ USD từ sự kết hợp giữa quỹ của riêng mình và một phương tiện mục đích đặc biệt dành cho các nhà đầu tư nhỏ hơn, đã đàm phán với OpenAI về tùy chọn đầu tư thêm 1 tỉ USD vào năm 2025 với mức định giá tương tự nếu công ty AI này đạt được mục tiêu doanh thu, theo các nguồn tin.

Apple không tham gia vào đợt huy động vốn lần này của OpenAI, các nguồn tin cho biết, yêu cầu được giấu tên để thảo luận về các vấn đề riêng tư.

Khoản tài trợ này được thực hiện dưới hình thức trái phiếu chuyển đổi và việc chuyển đổi thành cổ phần phụ thuộc vào sự thay đổi cấu trúc thành công thành một công ty vì lợi nhuận, sẽ không còn do hội đồng quản trị phi lợi nhuận kiểm soát, và việc xóa bỏ giới hạn lợi nhuận cho các nhà đầu tư.

Những thay đổi về nhân sự ở OpenAI không làm giảm sự nhiệt tình của hầu hết nhà đầu tư, vốn đang mong đợi sự tăng trưởng đáng kể dựa trên dự báo của Giám đốc điều hành Sam Altman.

OpenAI đang trên đà tạo ra 3,6 tỉ USD doanh thu trong năm 2024 với khoản lỗ tăng lên hơn 5 tỉ USD. Theo các nguồn tin quen thuộc với các số liệu, OpenAI dự kiến doanh thu sẽ tăng mạnh vào năm tới lên 11,6 tỉ USD.

Các nhà đầu tư cũng được đảm bảo một số biện pháp bảo vệ khi OpenAI trải qua quá trình tái cấu trúc doanh nghiệp phức tạp, sẽ cấp quyền sở hữu cổ phần cho Sam Altman. Các cuộc đàm phán vẫn đang diễn ra và chưa có mốc thời gian nào được xác định.

Nguồn tin cho biết các nhà đầu tư đã đàm phán các điều khoản cho phép họ thu hồi vốn hoặc đàm phán lại giá trị nếu những thay đổi ở OpenAI không được thực hiện trong vòng 2 năm.

Sự phát triển thần tốc của OpenAI về mức độ phổ biến sản phẩm và giá trị đã thu hút sự chú ý trên toàn cầu. Kể từ khi ra mắt ChatGPT vào tháng 11.2022, OpenAI đã thu hút được 250 triệu người dùng hoạt động hằng tuần. Mức định giá OpenAI cũng tăng từ 14 tỉ USD vào năm 2021 lên 157 tỉ USD khi doanh thu tăng từ con số 0 lên 3,6 tỉ USD, vượt xa dự đoán của chính Sam Altman trước đây.

Khi được các nhà đầu tư toàn cầu rót vào 6,6 tỉ USD, OpenAI đã yêu cầu họ đưa ra cam kết không chỉ dừng lại ở việc cung cấp vốn. Cụ thể hơn, OpenAI muốn các nhà đầu tư không tài trợ cho 5 công ty mà họ coi là đối thủ cạnh tranh trực tiếp, theo các nguồn tin của Reuters.

Trong danh sách 5 công ty đó có 3 đối thủ đang phát triển các mô hình ngôn ngữ lớn là xAI của Elon Musk, Anthropic và Safe Superintelligence (công ty mới thành lập của Ilya Sutskever, cựu giám đốc khoa học và đồng sáng lập OpenAI).

Anthropic, xAI và Safe Superintelligence đang chạy đua với OpenAI để xây dựng các mô hình ngôn ngữ lớn, nên cần hàng tỉ USD tiền tài trợ.

Hai cái tên còn lại là hai công ty ứng dụng AI, gồm startup tìm kiếm AI Perplexity và hãng tìm kiếm doanh nghiệp Glean.

Perplexity và Glean được nhắc đến trong cuộc trò chuyện của OpenAI với các nhà đầu tư, cho thấy “cha đẻ ChatGPT” có kế hoạch bán nhiều sản phẩm hơn cho các doanh nghiệp và người dùng cuối khi đưa ra dự báo tăng trưởng doanh thu đầy tham vọng lên 11,6 tỉ USD vào năm 2025 từ 3,7 tỉ USD trong 2024.

OpenAI, Perplexity và Safe Superintelligence từ chối bình luận. Anthropic và Glean không trả lời ngay lập tức. Reuters chưa thể liên lạc với xAI để đưa ra câu hỏi.

Bài liên quan

Google nghiên cứu AI có khả năng lý luận giống con người, cố gắng bám đuổi OpenAI

Google và OpenAI đang ở trong cuộc chiến khốc liệt để giành quyền thống trị trong lĩnh vực trí tuệ nhân tạo (AI).

Đọc tiếp

Giám đốc AI của Microsoft ví quan hệ đối tác với OpenAI giống 'sự ganh đua giữa hai anh em'

OpenAI tố Elon Musk quấy rối bằng vụ kiện 'lòng vị tha đối đầu lòng tham'

OpenAI, TSMC và hai động lực giúp Nvidia sắp trở lại vị trí công ty có giá trị nhất thế giới

(0) Bình luận

Xếp theo:

Đọc thêm Nhịp đập khoa học

Nổi bật Một thế giới

Tổng Bí thư Tô Lâm: Các lãnh đạo chủ chốt phải thực sự tiêu biểu về phẩm chất đạo đức, năng lực, uy tín

một giờ trước Sự kiện

Ngày 25.3, tại trụ sở Trung ương Đảng, Tiểu ban Nhân sự Đại hội 14 của Đảng đã tổ chức phiên họp thứ 4, xem xét một số nội dung sửa đổi, bổ sung dự thảo phương hướng công tác nhân sự đại hội.

Các địa phương nên làm gì để hỗ trợ những dự án đổi mới sáng tạo?

Theo Bộ trưởng Nguyễn Mạnh Hùng, một trong những việc cần làm là các địa phương nên thành lập...
ĐBQH: Dữ liệu là tài sản quý giá nhưng cũng là mục tiêu tấn công

Đại biểu quốc hội cho rằng trong bối cảnh chuyển đổi số ngày càng phát triển, dữ liệu cá nhân...
Việt Nam muốn hợp tác với Mỹ phát triển năng lượng điện hạt nhân

Hiện Mỹ là quốc gia tiên phong phát triển năng lượng hạt nhân, cũng nằm trong số ít quốc gia...

Đừng bỏ lỡ

Các startup AI Trung Quốc rẽ hướng sau cú bứt phá ngoạn mục của DeepSeek

3 phút trước Nhịp đập khoa học

Trong chưa đầy một năm, DeepSeek - một startup AI non trẻ tại Hàng Châu - đã khiến cả ngành công nghiệp trí tuệ nhân tạo Trung Quốc phải xem lại mình.
DeepSeek ra bản nâng cấp cho mô hình V3, Lý Khai Phục nói AI của Trung Quốc chỉ còn kém Mỹ 3 tháng

40 phút trước Nhịp đập khoa học

DeepSeek vừa công bố bản nâng cấp quan trọng cho mô hình ngôn ngữ lớn V3, đẩy mạnh cạnh tranh với các hãng công nghệ hàng đầu Mỹ như OpenAI và Anthropic.
Ngoại trưởng Mỹ nói một số nước đang cản trở tiến trình hòa bình tại Ukraine

một giờ trước Quốc tế

Ngoại trưởng Mỹ Marco Rubio mới đây tuyên bố rằng một số chính phủ nước ngoài (ông không nêu tên) đang làm chậm lại các nỗ lực chấm dứt chiến tranh ở Ukraine, theo RT.
Máy tính có màn hình kéo dài đến 18 inch

một giờ trước Khoa học - công nghệ

Máy tính có màn hình kéo dài đầu tiên trên thế giới là chiếc Lenovo ThinkBook Plus Gen 6 Rollable vừa ra mắt tại Triển lãm điện tử tiêu dùng (CES) 2025. Màn hình 14 inch của thiết bị dễ dàng mở rộng theo chiều dọc thành 16,7 inch chỉ bằng một nút bấm.
Bộ Y tế chỉ cách phát hiện thực phẩm đóng hộp không an toàn

một giờ trước Thông tin Y học

Thực phẩm đóng hộp là lựa chọn tiện lợi, phổ biến trong nhiều gia đình hiện nay. Tuy nhiên, nếu không được sản xuất, bảo quản đúng cách, một số loại thực phẩm này có thể tiềm ẩn nguy cơ nhiễm khuẩn, đặc biệt là vi khuẩn clostridium botulinum gây ngộ độc rất nguy hiểm.

Mới nhất

Tổng Bí thư Tô Lâm: Các lãnh đạo chủ chốt phải thực sự tiêu biểu về phẩm chất đạo đức, năng lực, uy tín

một giờ trước Sự kiện

Ngày 25.3, tại trụ sở Trung ương Đảng, Tiểu ban Nhân sự Đại hội 14 của Đảng đã tổ chức phiên họp thứ 4, xem xét một số nội dung sửa đổi, bổ sung dự thảo phương hướng công tác nhân sự đại hội.
Các địa phương nên làm gì để hỗ trợ những dự án đổi mới sáng tạo?

1 giờ trước Khoa học - công nghệ

Theo Bộ trưởng Nguyễn Mạnh Hùng, một trong những việc cần làm là các địa phương nên thành lập Quỹ đầu tư mạo hiểm để hỗ trợ các dự án ĐMST.
ĐBQH: Dữ liệu là tài sản quý giá nhưng cũng là mục tiêu tấn công

2 giờ trước Theo dòng thời sự

Đại biểu quốc hội cho rằng trong bối cảnh chuyển đổi số ngày càng phát triển, dữ liệu cá nhân và doanh nghiệp trở thành tài sản quý giá, đồng thời là mục tiêu tấn công của các mối đe dọa bên ngoài.
Việt Nam muốn hợp tác với Mỹ phát triển năng lượng điện hạt nhân

3 giờ trước Kinh tế - đầu tư - dự án

Hiện Mỹ là quốc gia tiên phong phát triển năng lượng hạt nhân, cũng nằm trong số ít quốc gia nắm giữ công nghệ lõi về hạt nhân.
Hà Nội sẽ tiên phong thực hiện các xu hướng kinh tế hiện đại

3 giờ trước Kinh tế - đầu tư - dự án

Hà Nội quyết tâm đạt mục tiêu tăng trưởng GRDP đạt 8% trở lên trong năm 2025, và phấn đấu đạt mức tăng trưởng hai con số trong giai đoạn 2026-2030.