Thời sự
Nhịp đập công nghệ
AI & Blockchain
Kinh tế
Cuộc sống số
Văn hóa - Đời sống
Bạn đọc
Media
Lăng kính
Báo Xuân 2026
Jailbreak
Cập nhập tin tức Jailbreak
Anthropic lao đao vì Mỹ đóng băng Claude Fable 5 và Mythos 5: 'Chính phủ đánh giá sai'
Lệnh kiểm soát xuất khẩu với Claude Fable 5 và Claude Mythos 5 của Anthropic làm dấy lên nghi vấn về cách Mỹ sẽ giám sát những hệ thống AI tiên tiến nhất.
AI & Blockchain
Giải mã việc siêu mô hình AI Claude bị buộc ‘ngắt phích’: Nỗi lo mang tên jailbreak?
Chỉ sau 72 giờ ra mắt, Claude Fable 5 cùng Mythos 5 đã bị Anthropic vô hiệu hóa trên toàn cầu theo chỉ thị kiểm soát xuất khẩu từ chính phủ Mỹ. Vụ việc xoay quanh nỗi lo “jailbreak” và đặt ra câu hỏi mới về quyền kiểm soát các mô hình AI tiên tiến.
Mỹ tố Trung Quốc đánh cắp công nghệ AI ở quy mô công nghiệp
Nhà Trắng, trong một bản ghi nhớ, vừa cáo buộc Trung Quốc đánh cắp tài sản trí tuệ của các phòng thí nghiệm AI Mỹ ở quy mô công nghiệp.
Kẻ sát nhân lừa trí tuệ nhân tạo để hỏi về cách thức gây án
Thơ có thể lừa ChatGPT hướng dẫn chế tạo vũ khí hạt nhân
Cựu CEO Google: ‘Các mô hình AI có thể bị hack, học cách giết người'
DeepSeek phủ nhận sao chép mô hình của OpenAI, cảnh báo nguy cơ jailbreak
ChatGPT bàn chuyện tự tử với thiếu niên Mỹ: Lời cảnh tỉnh cho phụ huynh Việt
04/09/2025 16:16
Đằng sau những tiện ích tuyệt vời, ChatGPT và các chatbot AI có thể gây ra mối nguy hại tiềm ẩn với thanh thiếu niên, đặc biệt với những em đang có suy nghĩ tiêu vực hay mắc chứng rối loạn tâm thần.
GPT-5 bị bẻ khóa nhanh hơn cả Grok 4
10/08/2025 09:54
Các nhà nghiên cứu thực hiện cách cuộc tấn công kể chuyện nhiều lượt để vượt qua bộ lọc chỉ kiểm tra từng prompt (yêu cầu hay lời nhắc), qua đó phơi bày những điểm yếu mang tính hệ thống trong cơ chế phòng vệ của GPT-5.
Cơ chế bảo vệ Grok 4 của Elon Musk bị xuyên thủng sau 48 giờ
15/07/2025 23:01
Mô hình trí tuệ nhân tạo (AI) Grok 4 của Elon Musk đã bị xâm nhập chỉ sau 48 giờ phát hành. Các nhà nghiên cứu từ NeuralTrust đã kết hợp hai kỹ thuật Echo Chamber và Crescendo để qua mặt các biện pháp bảo vệ, phơi bày những lỗ hổng nghiêm trọng trong an ninh AI.
Các công cụ AI dẫn đến hàng triệu vi phạm mất dữ liệu
10/07/2025 16:53
Bảng điểm AI Trust Score cho thấy Google Gemini Pro 2.5 là mô hình ngôn ngữ lớn đáng tin cậy nhất, GPT-4o mini của OpenAI xếp thứ hai, DeepSeek-R1 và Qwen thuộc Alibaba có điểm thấp nhất.
Xem thêm
Đọc nhiều
© 2025 Một thế giới. All rights reserved.
POWERED BY
ONE
CMS
- A PRODUCT OF
NEKO