GPT-4o có khả năng nói chuyện và trả lời theo thời gian thực như phim khoa học viễn tưởng
Nhịp đập khoa học - Ngày đăng : 07:22, 14/05/2024
GPT-4o có khả năng nói chuyện và trả lời theo thời gian thực như phim khoa học viễn tưởng
Rạng sáng hôm 14.5 (giờ Việt Nam), OpenAI thông báo phát hành mô hình trí tuệ nhân tạo (AI) mới mang tên GPT-4o, có khả năng trò chuyện bằng giọng nói thực tế và tương tác qua văn bản lẫn hình ảnh.
Đây là động thái mới nhất của OpenAI, công ty đứng sau chatbot ChatGPT và mô hình chuyển văn bản thành video Sora, nhằm dẫn đầu trong cuộc đua thống trị AI.
Tại một sự kiện phát trực tiếp, các nhà nghiên cứu của OpenAI đã trình bày các khả năng âm thanh mới cho phép người dùng nói chuyện với ChatGPT và nhận được phản hồi theo thời gian thực mà không bị chậm trễ, cũng như ngắt lời ChatGPT khi chatbot này đang nói. Đều là những đặc điểm của các cuộc trò chuyện thực tế mà các trợ lý giọng nói AI khó thực hiện được.
“Cảm giác giống như AI trong phim… Nói chuyện với máy tính chưa bao giờ thực sự tự nhiên với tôi; bây giờ thì có”, Giám đốc điều hành OpenAI - Sam Altman viết trong một bài đăng trên blog.
Dù được Microsoft hậu thuẫn, OpenAI phải đối mặt với sự cạnh tranh ngày càng tăng và áp lực mở rộng cơ sở người dùng của ChatGPT, chatbot AI phổ biến từng khiến cả thế giới phải kinh ngạc với khả năng tạo ra nội dung bằng văn bản giống con người và viết mã phần mềm hàng đầu.
Tại sự kiện phát trực tiếp, các nhà nghiên cứu của OpenAI đã trình diễn khả năng trợ lý giọng nói mới của ChatGPT. Trong một bản demo, ChatGPT đã sử dụng khả năng thị giác và giọng nói của mình để nói chuyện với nhà nghiên cứu cách giải phương trình toán học trên một tờ giấy.
Tại sự kiện trực tiếp, các nhà nghiên cứu của OpenAI đã trình diễn khả năng trợ lý giọng nói mới của ChatGPT. Trong một bản demo, ChatGPT sử dụng khả năng nhìn và giọng nói để hướng dẫn một nhà nghiên cứu giải một phương trình toán học trên tờ giấy.
Trong một bản demo khác, các nhà nghiên cứu OpenAI đã cho thấy khả năng dịch ngôn ngữ theo thời gian thực của GPT-4o. Theo thử nghiệm của phóng viên Một Thế Giới, GPT-4o có thể dịch văn bản trên hình ảnh sang ngôn ngữ mà bạn muốn, chẳng hạn tiếng Việt.
Các cuộc trình diễn của OpenAI gần giống với khoa học viễn tưởng, với ChatGPT và người đối thoại với nó có lúc nói những câu bông đùa nhau. Nhà nghiên cứu OpenAI nói với ChatGPT rằng anh có tâm trạng rất vui vì đang chứng tỏ “bạn hữu ích và tuyệt vời như thế nào”.
ChatGPT phản hồi: "Ồ dừng lại đi! Anh đang làm tôi đỏ mặt!".
Sam Altman đã đăng một từ her (cô ấy) trên tài khoản mạng xã hội X sau màn trình diễn GPT-4o, có vẻ như ám chỉ đến bộ phim cùng tên năm 2013 do Spike Jones làm đạo diễn, kể về người đàn ông yêu trợ lý AI của mình, với nữ diễn viên Scarlett Johansson lồng tiếng.
Mira Murati, Giám đốc công nghệ của OpenAI, nói tại sự kiện rằng GPT-4o sẽ được cung cấp miễn phí vì nó tiết kiệm chi phí hơn so với các mô hình AI trước đây của công ty. Bà cho biết người dùng phiên bản GPT-4o trả phí sẽ có giới hạn dung lượng lớn hơn so với người dùng miễn phí.
OpenAI cho biết GPT-4o sẽ có mặt trong ChatGPT trong vài tuần tới. Song khi truy cập trang web của ChatGPT sáng 14.5, phóng viên Một Thế Giới đã thấy thông báo mời dùng thử GPT-4o kèm thông điệp: "Bạn hiện có quyền truy cập hạn chế vào mô hình mới nhất của chúng tôi, GPT-4o. Nó thông minh hơn, hiểu được hình ảnh, có thể duyệt web và nói được nhiều ngôn ngữ hơn. Thử ngay bây giờ".
Theo thử nghiệm của phóng viên Một Thế Giới, hiện tính năng nói chuyện với ChatGPT của GPT-4o chưa khả dụng khi dùng trong trình duyệt web cho PC (máy tính cá nhân) nhưng đã có trên ứng dụng ChatGPT dành cho smartphone dù chưa hiểu câu nói bằng tiếng Việt.
Người viết thử hỏi ChatGPT rằng: "Ronaldo và Messi đang thi đấu cho CLB nào?" thì nhận được câu trả lời đúng với dữ liệu khá cập nhật kèm liên kết trích dẫn.
Tuy nhiên, khi người viết hỏi “Manchester United hiện xếp thứ mấy ở Premier League 2023/24?” thì ChatGPT trả lời không chính xác. Chatbot này phản hồi: "Tính đến tháng 5 năm 2024, Manchester United đang xếp thứ ba trên bảng xếp hạng Premier League mùa giải 2023/24, với 44 điểm sau 24 trận đấu" kèm liên kết dẫn đến 3 trang Premier League Football News, Manchester United và Sky Sports".
Trên thực tế, Manchester United hiện xếp thứ 8 ở Premier League 2023/24 sau trận thua Arsenal 0-1 ngay trên sân nhà Old Trafford hôm 12.5 ở vòng 36.
Một nỗ lực trước đó của OpenAI nhằm đưa thông tin cập nhật và thực tế vào ChatGPT để giống công cụ tìm kiếm, được gọi là ChatGPT plugin, đã ngừng hoạt động vào tháng 4, theo bài đăng của trung tâm trợ giúp trên trang web công ty khởi nghiệp này.
Ngay sau khi ra mắt vào tháng 11.2022, ChatGPT là ứng dụng tiêu dùng phát triển nhanh nhất lịch sử, đạt 100 triệu người dùng hoạt động hàng tháng chỉ sau 60 ngày, trước khi bị Threads của Meta Platforms vượt qua. Tuy nhiên, lưu lượng truy cập trên toàn thế giới vào trang web của ChatGPT đã có biến động lớn trong năm qua và hiện chỉ mới quay trở lại mức cao nhất vào tháng 5.2023, theo công ty phân tích Similarweb.
OpenAI đưa ra thông báo về GPT-4o một ngày trước khi Alphabet (công ty mẹ Google) dự kiến tổ chức hội nghị thường niên dành cho các nhà phát triển Google, nơi dự kiến sẽ giới thiệu các tính năng mới liên quan đến AI của riêng mình.
Tuần trước, Reuters đưa tin OpenAI đã lên kế hoạch công bố sản phẩm tìm kiếm được hỗ trợ bởi AI để cạnh tranh với Google, trích dẫn các nguồn tin. Thế nhưng, công ty đã quyết định trì hoãn việc công bố sản phẩm tìm kiếm AI, theo một nguồn tin quen thuộc với vấn đề này.
Sau khi OpenAI giới thiệu GPT-4o, cổ phiếu của Alphabet đã giảm 0,4% vào chiều 13.5 (giờ Mỹ), sau khi giảm gần 3% trước đó trong ngày. Cổ phiếu của Microsoft đã giảm 0,2%.