Cuộc sống số

DeepSeek thêm chế độ chuyên gia và tức thì trước khi phát hành bom tấn V4

Sơn Vân • 08/04/2026 21:14

Bản cập nhật chatbot mới nhất của DeepSeek làm dấy lên suy đoán liệu chế độ chuyên gia có liên quan đến mô hình V4 bị trì hoãn lâu nay hay không.

DeepSeek vừa triển khai chế độ Instant (tức thì) và Expert (chuyên gia) cho chatbot của mình. Đây là bản cập nhật quan trọng nhất với giao diện người dùng DeepSeek kể từ khi công ty khởi nghiệp có trụ sở tại Hàng Châu (Trung Quốc) được biết đến trên toàn cầu đầu năm 2025.

Những thay đổi này diễn ra trước khi DeepSeek ra mắt mô hình bom tấn V4 được mong đợi từ lâu, hơn một năm sau khi phiên bản R1 gây sốt.

Ra mắt vào tháng 1.2025, mô hình suy luận R1 từng gây chấn động toàn cầu vì hiệu suất ngang ngửa các sản phẩm Mỹ như của OpenAI, Google và Anthropic nhưng chi phí huấn luyện thấp hơn rất nhiều. Sự kiện này đã kích hoạt đợt bán tháo cổ phiếu công nghệ trị giá khoảng 1.000 tỉ USD trên thị trường toàn cầu. Riêng Nvidia - công ty Mỹ chuyên cung cấp chip tiên tiến đắt đỏ để huấn luyện các mô hình AI - mất gần 600 tỉ USD vốn hóa thị trường chỉ trong ngày 27.1.2025.

Hôm 8.4, DeepSeek đã thêm hai chế độ mới vào trang web và ứng dụng di động của mình, cho phép người dùng lựa chọn thiết lập phù hợp. Chế độ tức thì được thiết kế để trả lời nhanh chóng trong “các cuộc trò chuyện hàng ngày”. Chế độ chuyên gia dành cho những người gặp phải “vấn đề phức tạp”, dù đôi khi cảnh báo rằng dịch vụ có thể “bận rộn vào giờ cao điểm”.

DeepSeek thêm chế độ chuyên gia trước khi phát hành bom tấn V4 — Chế độ chuyên gia và tức thì trên giao diện chatbot DeepSeek - Ảnh chụp màn hình

Các chatbot AI khác, gồm cả Google Gemini và Doubao của ByteDance, cũng cho phép người dùng lựa chọn chế độ sử dụng khác nhau để phù hợp với nhu cầu.

Thử nghiệm chế độ chuyên gia và tức thì của DeepSeek

Chế độ chuyên gia thường cung cấp phản hồi chất lượng cao hơn, nhưng đòi hỏi nhiều tài nguyên tính toán hơn.

Tờ SCMP hôm 8.4 đã thử nghiệm chế độ chuyên gia và tức thời của DeepSeek. Khi được yêu cầu tạo hoạt ảnh JavaScript về các chữ cái rơi với hiệu ứng vật lý thực tế, chế độ tức thời đã tạo ra mã trong hơn một phút và tuân theo hướng dẫn. Trong khi đó, chế độ chuyên gia mất khoảng 40 giây để tạo ra mã nhưng không đáp ứng được yêu cầu.

Chế độ chuyên gia của DeepSeek đã loại bỏ tùy chọn tải lên file - tính năng quan trọng cho các tác vụ năng suất như xử lý dữ liệu. Chế độ tức thời vẫn giữ lại tính năng đính kèm file nhưng chỉ ở dạng văn bản.

Mô hình AI hàng đầu của OpenAI và Anthropic là dạng đa phương thức, đồng nghĩa có thể xử lý hình ảnh và video ngoài văn bản.

Những hạn chế của các tính năng mới đã làm dấy lên suy đoán trên mạng rằng chế độ chuyên gia của chatbot DeepSeek vẫn chưa được tích hợp với V4. Mô hình AI này dự kiến sẽ mang lại những cải tiến lớn, có thể gồm cả khả năng đa phương thức.

DeepSeek không phản hồi yêu cầu bình luận.

Lý do DeepSeek trì hoãn phát hành V4

DeepSeek đã thu hút nhiều sự chú ý những tháng gần đây, do từng được kỳ vọng sẽ phát hành mô hình AI tiếp theo trong dịp Tết Nguyên đán, lặp lại chiến lược đã thực hiện năm ngoái.

Tuy nhiên, sự gia tăng đột biến về quy mô của V4, mô hình AI lên hơn 1.000 tỉ tham số, đã làm trì hoãn việc phát hành, theo trang SCMP.

Tham số là các giá trị số mà mô hình AI học được và điều chỉnh trong suốt quá trình huấn luyện trên lượng lớn dữ liệu. Nó là các biến nội bộ của mô hình AI, quyết định cách xử lý thông tin đầu vào và tạo kết quả đầu ra. Mục tiêu của quá trình huấn luyện là tìm ra bộ tham số tối ưu nhất để mô hình AI có thể thực hiện nhiệm vụ (dự đoán từ tiếp theo trong câu, dịch ngôn ngữ, trả lời câu hỏi...) chính xác nhất có thể dựa trên dữ liệu đã học.

Số lượng tham số thường là chỉ số về kích thước và khả năng của mô hình AI. Mô hình AI càng có nhiều tham số thì tiềm năng học được các mẫu phức tạp hơn càng lớn, nhưng cũng đòi hỏi nhiều dữ liệu, tài nguyên tính toán để huấn luyện.

Sự quan tâm cũng tăng lên sau khi chatbot DeepSeek gặp sự cố ngừng hoạt động kéo dài 12 tiếng cuối tháng 3, làm gián đoạn dịch vụ có hàng trăm triệu người dùng.

Tính đến tháng 2, DeepSeek có hơn 355 triệu người dùng sử dụng dịch vụ AI cho nhiều tác vụ khác nhau, theo Aicpb.com - dịch vụ phân tích theo dõi mức độ phổ biến của các công cụ AI toàn cầu.

Đây không phải là lần đầu tiên dịch vụ trực tuyến của DeepSeek phải đối mặt với sự gián đoạn trên quy mô lớn. Cuối tháng 1.2025, ngay sau khi phát hành R1 và cung cấp miễn phí trên toàn cầu, DeepSeek đã bị tấn công từ chối dịch vụ phân tán (DDoS) nhằm làm quá tải máy chủ và băng thông bằng lượng truy cập internet khổng lồ. Khi đó, DeepSeek mô tả đây là “các cuộc tấn công quy mô lớn mang tính ác ý vào dịch vụ của công ty”.

Bất chấp những trở ngại, công ty này vẫn được xem là nhà phát triển mô hình AI nền tảng hàng đầu Trung Quốc, có vị thế tốt nhất để thu hẹp khoảng cách với các đối thủ Mỹ.

Công ty khởi nghiệp OpenAI và Anthropic được các nhà nghiên cứu đánh giá là hai nhà phát triển mô hình AI nền tảng hàng đầu thế giới.

Hôm 8.4, Anthropic đã công bố mô hình mới có tên Claude Mythos Preview, mà họ cho rằng quá mạnh mẽ để phát hành rộng rãi.

Theo Anthropic, Claude Mythos Preview có thể phát hiện hàng chục nghìn lỗ hổng bảo mật mà ngay cả những chuyên gia săn lỗi hàng đầu cũng khó tìm ra.

Anthropic chỉ triển khai bản xem trước Claude Mythos cho nhóm nhỏ các hãng công nghệ và an ninh mạng được lựa chọn kỹ lưỡng, do lo ngại về khả năng của mô hình này trong việc tìm kiếm và khai thác các lỗ hổng bảo mật. Công ty Mỹ lo ngại Claude Mythos có thể gây ra thiệt hại, nên chưa dám phát hành công khai cho đến khi có các biện pháp kiểm soát những khả năng nguy hiểm nhất.

Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, Nvidia và Palo Alto Networks là những tên tuổi có thể sử dụng Claude Mythos Preview trong nội bộ để vá các lỗ hổng bảo mật trong các hệ thống phần mềm quan trọng.

Theo Anthropic, Claude Mythos Preview có tính tự chủ cực cao và khả năng suy luận tinh vi, tương đương chuyên gia nghiên cứu bảo mật cấp cao.

Trong quá trình thử nghiệm của Anthropic, Claude Mythos Preview đã phát hiện lỗi trong “mọi hệ điều hành và trình duyệt web lớn”, gồm cả những lỗ hổng tồn tại hàng chục năm mà các cuộc kiểm tra bảo mật do con người thực hiện trước đó không phát hiện ra.

Trong 83,1% trường hợp, Claude Mythos Preview có thể tái tạo lỗ hổng và tạo ra bản thử nghiệm khai thác ngay từ lần đầu tiên. Nó cũng phát hiện nhiều lỗi trong nhân Linux, nền tảng của phần lớn máy chủ trên thế giới, và tự động kết hợp chúng lại để có thể chiếm quyền kiểm soát hoàn toàn hệ thống.

Trong một thử nghiệm khác, Claude Mythos Preview tìm ra một lỗ hổng tồn tại 27 năm trong OpenBSD, hệ điều hành mã nguồn mở nổi tiếng về bảo mật, cho phép hacker từ xa làm sập bất kỳ máy nào chạy hệ thống này.