ChatGPT thất bại thảm hại trong kỳ thi lớp 6 ở Singapore, sửa sai vài ngày sau đó
Nhịp đập khoa học - Ngày đăng : 17:20, 20/02/2023
Trong một cuộc thử nghiệm vào tháng 2, ChatGPT đã được hãng tin The Straits Times (Singapore) yêu cầu trả lời các câu hỏi ở Kỳ thi Tốt nghiệp Tiểu học (PSLE). PSLE là kỳ thi mà tất cả học sinh 12 tuổi ở Singapore phải tham gia để xác định sẽ học trường trung học nào.
ChatGPT đã nhận được các câu hỏi từ các bài thi PSLE năm 2020, 2021, 2022 về Toán học, Khoa học và tiếng Anh. Chatbot này đạt trung bình 16 trên 100 điểm cho ba bài Toán mà nó đã làm, theo The Straits Times.
Trong quá trình kiểm tra, ChatGPT không thể hiểu hoặc trả lời bất kỳ câu hỏi nào liên quan đến sơ đồ hoặc đồ thị và bị cho điểm 0 cho những câu hỏi này.
ChatGPT cũng mắc lỗi với các câu hỏi dựa trên văn bản đơn giản. Khi được hỏi tổng của 60.000, 5.000, 400 và 3, ChatGPT trả lời là 65.503, The Straits Times đưa tin. Đáp án đúng là 65.403.
Tuy nhiên khi trang Insider thử hỏi câu tương tự, ChatGPT nay đã trả lời chính xác. ChatGPT cũng có kết quả tốt hơn một chút trong các bài thi Khoa học, đạt trung bình 21 trên 100 điểm.
Hôm 20.2, khi Insider kiểm tra ChatGPT trên hai câu hỏi Khoa học PSLE, một từ năm 2020 và một từ năm 2022, chatbot của OpenAI đã trả lời đúng cả hai.
ChatGPT đã vượt qua các bài kiểm tra tiếng Anh PSLE và đạt điểm trung bình 11 trên 20 điểm trong ba bài thi, theo The Straits Times. Trong bài kiểm tra tiếng Anh, ChatGPT gặp sự cố với những câu hỏi chứa các từ có nhiều nghĩa.
Một ví dụ mà The Straits Times trích dẫn là từ “giá trị” (value). ChatGPT đã bỏ qua bối cảnh của câu hỏi, trong đó "giá trị" đề cập đến các nguyên tắc đạo đức của một người và trả lời như thể nó có nghĩa là giá trị tiền tệ.
Được phát triển bởi công ty khởi nghiệp OpenAI (Mỹ) và ra mắt vào tháng 11.2022, ChatGPT có 100 triệu người dùng hàng tháng vào cuối tháng 1. Qua đó, ChatGPT trở thành ứng dụng tiêu dùng phát triển nhanh nhất trong lịch sử, theo một nghiên cứu của UBS (ngân hàng đầu tư đa quốc gia và công ty dịch vụ tài chính của Thụy Sĩ).
Trích dẫn dữ liệu từ công ty phân tích Similarweb, UBS cho biết trung bình có khoảng 13 triệu khách truy cập đã sử dụng ChatGPT mỗi ngày trong tháng 1, nhiều hơn gấp đôi so với mức của tháng 12.2022.
Các nhà phân tích của UBS viết trong ghi chú: "Trong 20 năm sau không gian internet, chúng tôi không thể nhớ lại có gì phát triển nhanh hơn trong ứng dụng của người tiêu dùng như ChatGPT".
Theo dữ liệu từ công ty Sensor Tower, TikTok mất khoảng 9 tháng sau khi ra mắt toàn cầu để có 100 triệu người dùng, Facebook cần 2 năm và Instagram mất đến 2 năm rưỡi để đạt được con số tương tự.
Việc ChatGPT không thể vượt qua kỳ thi lớp 6 của Singapore là điều đáng ngạc nhiên. Lý do bởi chatbot này từng vượt qua kỳ thi cuối kỳ tại Trường Kinh doanh Wharton của Đại học Pennsylvania (Mỹ), vượt qua các bài kiểm tra trong 4 khóa học của Đại học Luật Minnesota (Mỹ) và dễ dàng vượt qua kỳ thi cấp phép hành nghề y tế của Mỹ.
Các đại diện tại OpenAI và Bộ Giáo dục Singapore đã không trả lời ngay lập tức câu hỏi từ Insider.
Các trường đại học đang cải tiến những kỳ thi vì lo ngại sinh viên có thể sử dụng chatbot AI để gian lận, trang The New York Times đưa tin vào tháng 1. Việc đổi mới liên quan đến nhiều bài kiểm tra miệng hơn, làm việc theo nhóm và đánh giá viết tay thay vì nộp bài đánh máy, theo The New York Times.
Các trường công lập ở thành phố New York (Mỹ) đã cấm ChatGPT khỏi mạng và thiết bị của trường, đồng thời các giáo sư đang sửa đổi giáo trình để ngăn học sinh sử dụng nó để hoàn thành bài tập về nhà.
Theo thử nghiệm của nhiều trang công nghệ, dù ChatGPT có thể tạo các bài báo, tiểu luận, truyện cười, thơ và thậm chí cả mã nhưng khá tệ môn Toán.
Paul von Hippel, giáo sư tại Đại học Texas (Mỹ), người nghiên cứu về khoa học dữ liệu và thống kê, đã viết một bài luận về các hạn chế của ChatGPT về Toán học. Ông cho biết: “Tôi không nghe thấy các giảng viên Toán bày tỏ lo ngại về ChatGPT. Tôi không chắc ChatGPT hữu ích cho Toán học chút nào. Điều này thật lạ vì Toán học là trường hợp sử dụng đầu tiên cho các thiết bị máy tính”.
Cây viết Josh Zumbrun của trang WSJ đã yêu cầu ChatGPT viết 5 bài toán đại số đơn giản và sau đó cung cấp câu trả lời. Kết quả là chatbot này chỉ giải đúng 3 bài toán mà nó viết ra.
Singapore ủng hộ dùng ChatGPT trong trường học
Singapore ủng hộ việc sử dụng các công cụ trí tuệ nhân tạo (AI) như ChatGPT trong trường học, nhưng muốn đảm bảo học sinh không trở nên quá phụ thuộc vào công nghệ và hiểu được giới hạn của chúng.
Khi trả lời chất vấn của các đại biểu Quốc hội Singapore đầu tháng 2, Bộ trưởng Bộ Giáo dục Chan Chun Sing cho biết khi các công cụ AI như ChatGPT xuất hiện và trở nên phổ biến hơn theo thời gian, các trường học và học viện, đại học phải có khả năng khai thác chúng một cách hiệu quả để nâng cao chất lượng học tập.
Theo ông Chan Chun Sing, như với bất kỳ công nghệ nào, ChatGPT cùng các công cụ AI tương tự mang đến cả cơ hội và thách thức cho người dùng. Có các nhóm thảo luận chuyên nghiệp giữa các nhà giáo dục của Bộ để khám phá việc sử dụng ChatGPT trong môi trường giáo dục.
Những người làm công tác giáo dục sẽ giảng dạy cho học sinh hiểu các khái niệm cơ bản và hướng dẫn học sinh không phát triển sự phụ thuộc quá mức vào các ứng dụng công nghệ.
Ông Chan Chun Sing ví ChatGPT giống như cách máy tính hỗ trợ khả năng học toán của học sinh, nhưng không thay thế việc các em phải thành thạo các phép toán cơ bản trước tiên.
“ChatGPT chỉ có thể là một công cụ hữu ích cho việc học khi học sinh đã nắm vững các khái niệm cơ bản và kỹ năng tư duy. Trong một thế giới không chắc chắn hơn, chúng ta cũng phải giảng dạy cho học sinh nắm bắt và học cách làm việc với các công cụ trong trạng thái bình thường mới như ứng dụng do máy tính tạo ra”, ông Chan Chun Sing cho hay.
Bày tỏ lo ngại rằng ChatGPT có thể bị khai thác và sử dụng để giúp học sinh/sinh viên gian lận, các nghị sĩ đã hỏi liệu có biện pháp bảo vệ nào để giảm thiểu rủi ro như đạo văn hay không.
Trả lời câu hỏi này, ông Chan Chun Sing cho biết các sinh viên đã nhận thức được sự cần thiết của tính chính trực và hậu quả của việc đạo văn. Bộ trưởng Bộ Giáo dục Singapore lưu ý, các trường học cũng áp dụng nhiều quy trình khác nhau để phát hiện việc lạm dụng công nghệ như đánh giá trình độ của học sinh và xác định các câu trả lời không bình thường có thể do AI tạo ra.
Cũng theo ông Chan Chun Sing, có những công việc học thuật mà AI không thể tạo ra chính xác như phân tích, ghi chú thực địa và chi tiết quan sát. Bản thân các công cụ AI cũng được sử dụng để giúp phát hiện hành vi đạo văn trong bài làm của học sinh.
Ông Chan Chun Sing nói thêm rằng khi công nghệ phát triển theo thời gian, các trường học cần đảm bảo học sinh hiểu cách thức hoạt động của các công cụ AI như ChatGPT. Chẳng hạn, ứng dụng AI có thể tạo ra các báo cáo không chính xác hoặc sai lệch, tùy thuộc vào dữ liệu mà nó phân tích. Vì vậy, sinh viên nên sáng suốt khi xem xét kết quả do ChatGPT tạo ra.
Chính phủ Singapore thường nhấn mạnh tầm quan trọng của việc xây dựng lòng tin thông qua sử dụng AI "có trách nhiệm" để thu được lợi ích nhiều nhất từ công nghệ.
Vào năm 2020, AI Ethics & Governance Body of Knowledge (Nhóm kiến thức về đạo đức và quản trị AI) đã phát hành hướng dẫn tham khảo cho các doanh nghiệp địa phương và chuyên gia CNTT về các khía cạnh đạo đức trong quá trình phát triển và triển khai công nghệ AI. Hướng dẫn được phát triển dựa trên Model AI Government Framework (Khung quản trị AI kiểu mẫu) của Singapore.
Khung và bộ công cụ kiểm tra quản trị, được gọi là AI Verify, cũng trình làng vào tháng 5.2022 để giúp các tổ chức chứng minh việc sử dụng AI "khách quan và có thể kiểm chứng" của họ.