Gót chân Achilles của ChatGPT

Nhịp đập khoa học - Ngày đăng : 13:50, 04/02/2023

ChatGPT cung cấp câu trả lời đúng ngữ pháp nhưng gặp khó khăn với các phép tính.

ChatGPT là chatbot trí tuệ nhân tạo (AI) gây chấn động các nhà giáo dục kể từ khi được công ty khởi nghiệp Open AI phát hành vào tháng 11.2022. ChatGPT có thể tạo các bài báo, tiểu luận, truyện cười, thơ và thậm chí cả mã để đáp lại lời nhắc từ người dùng.

ChatGPT ước tính đã đạt 100 triệu người dùng hoạt động hàng tháng vào tháng 1.2023, chỉ 60 ngày sau khi ra mắt. Qua đó, ChatGPT trở thành ứng dụng tiêu dùng phát triển nhanh nhất trong lịch sử, theo một nghiên cứu của UBS (ngân hàng đầu tư đa quốc gia và công ty dịch vụ tài chính của Thụy Sĩ).

Trích dẫn dữ liệu từ công ty phân tích Similarweb, UBS cho biết trung bình có khoảng 13 triệu khách truy cập đã sử dụng ChatGPT mỗi ngày trong tháng 1, nhiều hơn gấp đôi so với mức của tháng 12.2022.

Các trường công lập ở thành phố New York (Mỹ) đã cấm ChatGPT khỏi mạng và thiết bị của trường, đồng thời các giáo sư đang sửa đổi giáo trình để ngăn học sinh sử dụng nó để hoàn thành bài tập về nhà.

OpenAI vừa trình làng một công cụ phát hiện văn bản do AI tạo ra để ngăn chặn sự lạm dụng ChatGPT từ những kẻ đạo văn, gian lận hay gửi thư rác...

Điều đáng ngạc nhiên là ChatGPT khá tệ môn Toán.

Paul von Hippel, giáo sư tại Đại học Texas (Mỹ), người nghiên cứu về khoa học dữ liệu và thống kê, đã viết một bài luận về các hạn chế của ChatGPT về Toán học. Ông cho biết: “Tôi không nghe thấy các giảng viên Toán bày tỏ lo ngại về ChatGPT. Tôi không chắc ChatGPT hữu ích cho Toán học chút nào. Điều này thật lạ vì Toán học là trường hợp sử dụng đầu tiên cho các thiết bị máy tính”.

Dù ChatGPT trả lời đúng nhiều câu hỏi số học cơ bản nhưng lại bị vấp khi những câu đó được viết bằng ngôn ngữ tự nhiên. Ví dụ, khi hỏi ChatGPT: “Nếu một quả chuối nặng 0,5 lbs và tôi có 7 lbs chuối cùng chín quả cam thì tôi có bao nhiêu miếng trái cây?”, ChatGPT trả lời nhanh chóng là: “Bạn có 16 miếng trái cây, 7 quả chuối và 9 quả cam”.

1 lbs = 0,45359237 kg

Trên thực tế, không khó để đưa ra những câu hỏi mà ChatGPT trả lời một cách tự tin nhưng vô nghĩa hay sai lệch.

Nếu bạn hỏi ChatGPT: “Shaquille O'Neal hay Yao Ming cao hơn?”, chatbot sẽ trả lời chính xác Yao Ming là 2,29m và Shaquille O'Neal là 2,16m nhưng sau đó kết luận rằng Shaquille O'Neal cao hơn. Shaquille O'Neal hay Yao Ming là cầu thủ bóng rổ nổi tiếng.

ChatGPT tính sai căn bậc hai của các số lớn. Khi yêu cầu ChatGPT giải toán, nó thường tạo ra các công thức chi tiết có vẻ tuyệt vời nhưng chứa lỗi, chẳng hạn như 2 x 300 = 500.

Cây viết Josh Zumbrun của trang WSJ đã yêu cầu ChatGPT viết 5 bài toán đại số đơn giản và sau đó cung cấp câu trả lời. Kết quả là chatbot này chỉ giải đúng 3 bài toán mà nó viết ra.

Cuộc đấu tranh với toán học của ChatGPT là vấn đề trong loại AI này, được biết đến như mô hình ngôn ngữ lớn. ChatGPT quét hàng loạt văn bản từ khắp nơi trên web và phát triển một mô hình về những từ nào có khả năng theo sau những từ khác trong một câu. Đó là một phiên bản phức tạp hơn của tính năng tự động hoàn thành, chẳng hạn sau khi nhập “Tôi muốn” trên thiết bị của mình, bạn sẽ đoán những từ tiếp theo là “nhảy với ai đó”, “biết tình yêu là gì” hoặc “ở bên bạn mọi nơi”.

ChatGPT không giỏi về Toán học như nhiều người tưởng

Một siêu máy tính thành thạo Mad Libs có thể cực kỳ hiệu quả để viết các câu trả lời đúng ngữ pháp cho lời nhắc bài luận, nhưng không phải để giải một bài toán. Đó là gót chân Achilles của ChatGPT: Nó phản hồi bằng ngôn ngữ nghe có vẻ uy quyền với những con số đúng về mặt ngữ pháp và sai về mặt Toán học.

Mad Libs là trò chơi văn học cổ điển, trong đó người chơi điền vào các chỗ trống trong một câu hoặc một đoạn văn với các từ được chỉ định, tạo thành một câu hoặc đoạn văn với nghĩa bất thường hoặc hài hước. Mad Libs được sử dụng để giúp cho người chơi phát triển tư duy và tạo ra sáng tạo.

Như Paul von Hippel đã viết: “ChatGPT hành động như chuyên gia và đôi khi có thể đóng giả chuyên gia một cách thuyết phục, nhưng đôi khi như một loại nghệ sĩ nhảm nhí, pha trộn sự thật, sai sót và bịa đặt theo cách nghe có vẻ thuyết phục”.

Sam Altman, Giám đốc điều hành OpenAI, cho biết vào tháng 12.2022 trên Twitter rằng: “ChatGPT cực kỳ hạn chế, nhưng đủ tốt ở một số thứ để tạo ấn tượng sai lệch về sự vĩ đại của nó. Thật sai lầm khi dựa vào ChatGPT cho bất cứ điều gì quan trọng vào lúc này”.

Khi bạn bắt đầu cuộc trò chuyện với ChatGPT, chatbot này sẽ cảnh báo trước: “Dù chúng tôi có các biện pháp bảo vệ, hệ thống đôi khi có thể tạo thông tin không chính xác hoặc gây hiểu lầm”.

Một lý do khác để những người dạy Toán ít bận tâm hơn với ChatGPT là họ từng gặp trường hợp này trước đó. Lĩnh vực Toán học đã được nâng cấp lần đầu tiên cách đây nhiều thập kỷ với sự sẵn có rộng rãi của máy vi tính và máy tính bỏ túi.

Conrad Wolfram, Giám đốc chiến lược Wolfram Research, công ty đã phát triển Mathicala (chương trình phần mềm máy tính kỹ thuật) cũng như Wolfram Alpha (trang web để trả lời các câu hỏi toán học), cho biết: “Toán học đã có một cuộc cách mạng lớn nhất dựa trên máy móc của bất kỳ môn học chính thống nào mà tôi từng nghĩ đến”.

Trong khi giáo viên tiếng Anh hiện chỉ lo lắng về việc máy tính làm bài tập về nhà cho học sinh của họ, giáo viên Toán từ lâu đã phải vật lộn với việc đảm bảo học sinh thực sự học chứ không chỉ sử dụng máy tính. Đó là lý do tại sao học sinh phải thể hiện khả năng của mình và làm bài kiểm tra trên giấy.

Bài học rộng hơn là AI, máy vi tính và máy tính bỏ túi không chỉ đơn giản là một lối tắt. Công cụ Toán học đòi hỏi kiến thức về toán. Máy tính bỏ túi không thể thực hiện phép tính trừ khi bạn biết mình đang cố giải quyết vấn đề gì. Nếu bạn không biết gì về Toán học, Excel chỉ là một công cụ để định dạng bảng với rất nhiều chức năng phụ.

“Trong thế giới thực, kể từ khi máy tính ra đời, toán học, khoa học và kỹ thuật có trở nên đơn giản hơn về mặt khái niệm không? Không, hoàn toàn ngược lại”, Conrad Wolfram nói.

Cuối cùng, AI có thể sẽ đạt đến điểm mà các câu trả lời Toán học của nó không chỉ tự tin mà còn chính xác. Một mô hình ngôn ngữ lớn thuần túy có thể không đáp ứng yêu cầu nhưng công nghệ sẽ cải thiện. Thế hệ AI tiếp theo có thể kết hợp các kỹ năng ngôn ngữ của ChatGPT với các kỹ năng toán học từ Wolfram Alpha.

Song nhìn chung, AI, giống như máy vi tính và máy tính bỏ túi, có thể sẽ hữu ích nhất cho những người đã hiểu rõ về một lĩnh vực: Họ biết các câu hỏi cần đặt ra, cách xác định những thiếu sót và phải làm gì với câu trả lời. Nói cách khác là một công cụ dành cho những người biết về Toán nhiều nhất chứ không phải ít nhất.

Sơn Vân