Nhịp đập công nghệ

Mô hình AI đủ sức giành HCV các kỳ thi toán quốc tế

Cẩm Bình 01/12/2025 14:54

Truyền thông Trung Quốc đưa tin mô hình mã nguồn mở Math V2 mà công ty DeepSeek vừa tung ra không chỉ đánh bại mô hình độc quyền của nhiều “ông lớn” trên thế giới, mà còn nâng tầm năng lực toán học của trí tuệ nhân tạo (AI).

Theo DeepSeek, Math V2 giải thành công 5/6 bài toán của kỳ thi Olympic Toán học quốc tế (IMO) 2025, đạt 118/120 điểm của cuộc thi Toán học Putnam năm 2024 – cao hơn điểm số cao nhất mà một thí sinh con người đạt được thời điểm đó.

Mô hình còn cho kết quả tiệm cận Gemini Deep Think, vượt trội hơn hơn GPT-5 khi trải qua IMO-ProofBench (bài đánh giá chuyên dụng để xác định độ chính xác của lập luận của AI).

Screenshot 2025-12-01 110352
Kết quả IMO-ProofBench của Math V2 - Ảnh: Sina

Math V2 lợi hại ở điểm nào?

DeepSeek cho biết nỗ lực phát triển năng lực toán học cho AI hiện nay có một hạn chế lớn là quá đề cao kết quả cuối cùng chính xác, đào tạo các mô hình xem kết quả như “phần thưởng”.

Phương pháp này khiến mô hình đạt điểm số cao khi kiểm tra bằng tiêu chuẩn như AIME hay HMMT; nhưng làm vậy không giải quyết vấn đề cốt lõi: kết quả cuối cùng chính xác không đảm bảo lập luận đúng.

Hơn nữa nhiều lập luận toán học, chẳng hạn chứng minh định lý đòi hỏi suy luận từng bước nghiêm ngặt chứ không chỉ cần câu trả lời bằng số, nên phương pháp truyền thống trở nên không phù hợp.

Trước hạn chế trên, DeepSeek nhận thấy khả năng tự xác minh tính toàn diện và tính chặt chẽ của suy luận toán học vô cùng quan trọng. Vì vậy công ty xem xét cách huấn luyện một trình xác minh, chứng minh định lý dựa trên mô hình ngôn ngữ lớn (LLM) chính xác và đáng tin cậy. Sau đó họ dùng trình xác minh như mô hình “phần thưởng” huấn luyện trình chứng minh, khuyến khích nó xác định và giải quyết càng nhiều vấn đề (trong các lập luận) càng tốt trước lúc cho ra kết quả cuối cùng.

Như vậy Math V2 có đến 2 “bộ não”: 1 táo bạo ra giả thuyết, còn 1 cẩn thận kiểm chứng. Mô hình tự kiểm tra đáp án, chấm điểm quá trình giải, nếu phát hiện lỗi thì suy luận lại từ đầu cho đến khi logic hoàn toàn hợp lý – giống 1 nhà toán học thực thụ chứ không phải học sinh vội vàng ra đáp án rồi nộp bài.

Screenshot 2025-12-01 110347
Math V2 chú ý đến quá trình suy luận thay vì chỉ tập trung ra kết quả cuối cùng - Ảnh: 163.com

Bước đột phá về sức mạnh AI

Với AI, toán học chưa bao giờ chỉ là công cụ giải quyết vấn đề mà là tiêu chuẩn để kiểm tra năng lực lập luận. Bất cứ ai đạt được bước đột phá trong toán học đều tiến gần hơn đến xây dựng mô hình trí tuệ nhân tạo mạnh mẽ.

DeepSeek không ngần ngại công khai mã nguồn Math V2 trên nhiều nền tảng như Hugging Face hay GitHub, cho phép nhà nghiên cứu, lập trình viên hoặc bất cứ ai quan tâm tiếp cận, nghiên cứu - phát triển.

Khả năng giải quyết bài toán phức tạp lẫn khả năng tự xác minh của mô hình mở ra cơ hội ứng dụng AI vào khoa học cơ bản hay những lĩnh vực đòi hỏi giải quyết vấn đề hóc búa mà con người thường mất rất nhiều thời gian và công sức. Mặc dù Math V2 tập trung vào toán học, nhưng công nghệ cùng phương pháp mà nó sử dụng có thể được áp dụng cho lĩnh vực khác chẳng hạn tài chính (phân tích dữ liệu rồi đưa ra đề xuất đầu tư) hay y tế (xác định phương pháp điều trị tối ưu nhất).

Hướng phát triển của AI

Qua Math V2 có thể thấy một trong những hướng phát triển chính của AI toán học nói riêng và của các mô hình trí tuệ nhân tạo nói chung là tự học, tự cải tiến.

Thay vì chỉ dựa vào dữ liệu ban đầu, chúng sẽ học hỏi từ tác vụ thực tế rồi tự điều chỉnh thuật toán để đạt hiệu suất tốt hơn.

Khi AI ngày càng mạnh mẽ, việc đảm bảo chúng được sử dụng một cách có trách nhiệm vô cùng quan trọng, đòi hỏi con người phải xây dựng bộ quy tắc rõ ràng hơn.

Nổi bật
      Mới nhất
      Mô hình AI đủ sức giành HCV các kỳ thi toán quốc tế
      • Mặc định

      POWERED BY ONECMS - A PRODUCT OF NEKO