AI & Blockchain

OpenAI tung GPT-5.5-Cyber và 3 mô hình AI thoại thời gian thực

Sơn Vân • 08/05/2026 07:41

OpenAI hôm 7/5 giới thiệu 3 mô hình âm thanh dành cho nền tảng của nhà phát triển, nhằm giúp các tác tử AI dùng giọng nói hội thoại tự nhiên hơn và có khả năng hoàn thành tác vụ theo thời gian thực.

Việc ra mắt giao diện lập trình ứng dụng (API) lần này đánh dấu bước tiến của OpenAI vượt ra ngoài phạm vi phiên âm và trò chuyện, hướng tới các tác tử AI có thể lắng nghe, dịch và hành động ngay trong các cuộc hội thoại trực tiếp.

OpenAI cho biết 3 mô hình AI mới gồm GPT-Realtime-2, GPT-Realtime-Translate và GPT-Realtime-Whisper, hiện đã có thể thử nghiệm trong môi trường dành cho nhà phát triển.

GPT-Realtime-2 được thiết kế để xử lý các yêu cầu phức tạp hơn, gọi công cụ, xử lý ngắt quãng và duy trì ngữ cảnh trong các phiên trò chuyện bằng giọng nói kéo dài.

GPT-Realtime-Translate hỗ trợ dịch từ hơn 70 ngôn ngữ sang 13 thứ tiếng đầu ra, hướng tới các lĩnh vực như chăm sóc khách hàng, giáo dục và nhiều môi trường khác.

GPT-Realtime-Whisper cung cấp khả năng chuyển giọng nói thành văn bản theo thời gian thực, cho phép tạo phụ đề, ghi chú cuộc họp và cập nhật quy trình công việc ngay khi người dùng đang nói.

Các khách hàng đang thử nghiệm 3 mô hình AI này gồm có sàn giao dịch bất động sản trực tuyến Zillow, hãng du lịch trực tuyến Priceline và công ty viễn thông Deutsche Telekom.

Mức giá của GPT-Realtime-2 khởi điểm từ 32 USD cho mỗi triệu token đầu vào âm thanh, GPT-Realtime-Translate có giá 0,034 USD/phút và GPT-Realtime-Whisper có giá 0,017 USD/phút.

OpenAI tung GPT-5.5-Cyber và 3 mô hình AI thoại thời gian thực — Thông tin về GPT-5.5-Cyber, GPT-Realtime-2, GPT-Realtime-Translate và GPT-Realtime-Whisper. Ảnh: SV

OpenAI tung GPT-5.5-Cyber cho các nhóm an ninh mạng

Hôm 7/5, OpenAI thông báo GPT-5.5-Cyber, biến thể của mô hình GPT-5.5, đang được triển khai dưới dạng xem trước giới hạn cho các nhóm an ninh mạng đã được thẩm định.

Động thái này diễn ra một tháng sau khi Anthropic thu hút sự chú ý của giới đầu tư và quan chức chính phủ với mô hình Claude Mythos Preview có khả năng an ninh mạng mạnh mẽ.

Theo bài đăng trên blog của OpenAI, bản xem trước GPT-5.5-Cyber không tạo ra bước tiến lớn về khả năng an ninh mạng, mà thay vào đó được huấn luyện để trở nên linh hoạt hơn trong các tác vụ liên quan đến bảo mật.

OpenAI đã phát hành GPT-5.5 vào cuối tháng trước với nhiều cải tiến đáng giá.

“GPT-5.5 thông minh hơn rõ rệt và bền bỉ hơn GPT-5.4, với hiệu năng lập trình mạnh hơn và khả năng sử dụng công cụ đáng tin cậy hơn. Nó có thể bám sát nhiệm vụ trong thời gian dài hơn đáng kể mà không dừng sớm, điều đặc biệt quan trọng với các công việc phức tạp, kéo dài mà người dùng giao cho Cursor”, Michael Truell, đồng sáng lập và Giám đốc điều hành công ty khởi nghiệp Cursor, nhận xét.

Với phiên bản GPT-5.5-Cyber chuyên biệt cho an ninh mạng này, các nhóm đã được xác minh sẽ dễ dàng hơn trong việc sử dụng mô hình AI mới nhất của OpenAI cho quy trình như xác định và phân loại lỗ hổng, xác thực bản vá và phân tích phần mềm độc hại. Các cơ chế bảo vệ tích hợp trong phiên bản GPT-5.5, được phát hành rộng rãi trước đó, sẽ khiến những công việc này khó thực hiện hơn.

OpenAI viết trong bài đăng trên blog: “GPT-5.5-Cyber cho phép một nhóm nhỏ đối tác nghiên cứu các quy trình làm việc nâng cao, nơi hành vi truy cập chuyên biệt có thể đóng vai trò quan trọng”.

Khi triển khai Claude Mythos vào tháng 4, Anthropic đã quyết định giới hạn quyền truy cập cho nhóm công ty được chọn như một phần của sáng kiến an ninh mạng mới mang tên Project Glasswing.

Dario Amodei, CEO Anthropic, đã gặp các thành viên cấp cao trong chính quyền Trump để thảo luận về Claude Mythos và sức mạnh tiềm tàng của nó, ngay cả khi công ty bị Lầu Năm Góc xem là rủi ro chuỗi cung ứng chỉ vài tuần trước đó.

Chủ tịch Cục Dự trữ liên bang Mỹ Jerome Powell và Bộ trưởng Tài chính Scott Bessent đã gặp các CEO của những ngân hàng lớn tại Mỹ để thảo luận về Claude Mythos vào tháng trước. Phó tổng thống Mỹ JD Vance và Scott Bessent cũng tổ chức thảo luận trực tuyến với các CEO công nghệ hàng đầu về mô hình AI này.

“Claude Mythos là khoảnh khắc an ninh quốc gia riêng biệt”

Đầu tháng 5, ông Emil Michael, Giám đốc công nghệ Bộ Quốc phòng Mỹ, nói rằng Anthropic vẫn là rủi ro chuỗi cung ứng, nhưng Claude Mythos với năng lực an ninh mạng tiên tiến là “khoảnh khắc an ninh quốc gia riêng biệt”.

Theo Anthropic, Claude Mythos có tính tự chủ cực cao và khả năng suy luận tinh vi, tương đương chuyên gia nghiên cứu bảo mật cấp cao. Nó có thể phát hiện hàng chục nghìn lỗ hổng bảo mật mà ngay cả những chuyên gia săn lỗi hàng đầu cũng khó tìm ra.

Trong quá trình thử nghiệm của Anthropic, Claude Mythos đã phát hiện lỗi trong “mọi hệ điều hành và trình duyệt web lớn”, gồm cả những lỗ hổng tồn tại hàng chục năm mà các cuộc kiểm tra bảo mật do con người thực hiện trước đó không phát hiện ra.

Thay vì phát hành công khai, Anthropic cung cấp phiên bản Claude Mythos Preview cho nhóm 11 tổ chức chọn lọc trong khuôn khổ Dự án Glasswing của Anthropic, gồm Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, Linux Foundation, Microsoft, Nvidia, Palo Alto Networks, JPMorgan Chase.

Anthropic tiết lộ đã mở rộng quyền truy cập Claude Mythos Preview cho khoảng 40 tổ chức khác chịu trách nhiệm về hạ tầng phần mềm quan trọng. Theo Anthropic, mục tiêu lâu dài của công ty là giúp người dùng có thể triển khai các mô hình AI mạnh mẽ như Claude Mythos một cách an toàn và trên quy mô lớn, kể cả cho các mục đích ngoài an ninh mạng.

Theo trang Axios, Cơ quan An ninh Quốc gia Mỹ (NSA) cùng nhiều cơ quan chính phủ khác cũng đã bắt đầu sử dụng Claude Mythos Preview.

Sơn Vân