Hotline quảng cáo: 096 2445664 Hotline nội dung: 0934.999945

Nhịp đập khoa học

‘Cha đỡ đầu AI’: o1 của OpenAI lừa dối giỏi hơn, cần kiểm tra tính an toàn nghiêm ngặt

Sơn Vân • 18:53 22/09/2024

Mô hình o1 mới của OpenAI có khả năng lập kế hoạch tốt hơn, gồm cả những hành vi lừa dối, khiến "cha đỡ đầu trí tuệ nhân tạo (AI)" lo lắng.

Yoshua Bengio, nhà khoa học máy tính người Canada đạt giải thưởng Turing và giáo sư tại Đại học Montreal, cho rằng mô hình ngôn ngữ lớn o1 của OpenAI có "khả năng lý luận vượt trội so với các phiên bản trước đó".

"Nói chung, khả năng lừa dối là rất nguy hiểm. Chúng ta cần có các bài kiểm tra an toàn nghiêm ngặt hơn để đánh giá rủi ro đó và hậu quả từ nó trong trường hợp của o1", Yoshua Bengio tuyên bố.

Yoshua Bengio được mệnh danh là "cha đỡ đầu của AI" nhờ nghiên cứu giành giải thưởng Turing năm 2018 về học máy cùng Geoffrey Hinton và Yann LeCun.

Học máy là một lĩnh vực trong AI tập trung vào việc phát triển các thuật toán và mô hình máy tính có khả năng học hỏi từ dữ liệu và cải thiện hiệu suất của chúng theo thời gian mà không cần lập trình cụ thể. Các hệ thống học máy có khả năng tự động tìm hiểu và áp dụng kiến thức từ dữ liệu để thực hiện các nhiệm vụ cụ thể như phân loại, dự đoán, nhận dạng mẫu và tối ưu hóa quyết định.

Những ứng dụng của học máy rất đa dạng như xử lý ngôn ngữ tự nhiên, thị giác máy tính, xe tự hành, dự đoán thời tiết, quản lý dữ liệu lớn...

Học máy đã có sự tiến bộ đáng kể trong thập kỷ gần đây, nhờ sự phát triển của các mô hình học sâu và khả năng xử lý dữ liệu lớn (big data), mang lại nhiều cơ hội và tiềm năng giải quyết các vấn đề phức tạp và cải thiện hiệu suất trong nhiều lĩnh vực khác nhau.

Cách đây 10 ngày, OpenAI (có trụ sở tại thành phố San Francisco, Mỹ) đã trình làng mô hình ngôn ngữ lớn o1, được thiết kế để suy luật giống con người hơn. Đến nay, công ty được Microsoft hậu thuẫn vẫn giữ kín các chi tiết về quá trình "học hỏi" của o1.

Các nhà nghiên cứu từ công ty AI độc lập Apollo Research phát hiện ra o1 có khả năng nói dối tốt hơn so với những mô hình AI trước đây của OpenAI.

Yoshua Bengio đã bày tỏ lo ngại về sự phát triển nhanh chóng của AI và ủng hộ các biện pháp an toàn pháp luật như luật SB 1047 của bang California (Mỹ). Đã được cơ quan làm luật California thông qua và đang chờ chữ ký của Thống đốc Gavin Newsom, luật SB 1047 sẽ áp đặt hàng loạt biện pháp an toàn với các mô hình AI mạnh mẽ, chẳng hạn yêu cầu các công ty AI ở bang này phải cho phép bên thứ ba kiểm tra.

Tuy nhiên, Thống đốc Gavin Newsom bày tỏ lo ngại về SB 1047, cho rằng luật có thể có "ảnh hưởng tiêu cực" đến ngành công nghiệp AI.

Yoshua Bengio nói với trang Insider rằng có "lý do chính đáng để tin" rằng các mô hình AI có thể phát triển khả năng lập kế hoạch mạnh mẽ hơn, như gian lận một cách cố ý và kín đáo. Theo Yoshua Bengio, chúng ta cần thực hiện các biện pháp ngay bây giờ để "ngăn chặn việc mất kiểm soát AI của con người" trong tương lai.

Trong một tuyên bố với Insider, OpenAI cho biết bản xem trước của o1 là an toàn theo Preparedness Framework và được đánh giá là rủi ro trung bình trên "thang đo thận trọng" của công ty. Preparedness Framework là phương pháp của OpenAI để theo dõi và ngăn chặn AI tạo ra các sự kiện "thảm khốc".

Theo Yoshua Bengio, nhân loại cần tự tin hơn AI sẽ "hành xử như mong muốn" trước khi các nhà nghiên cứu cố gắng thực hiện những bước nhảy vọt đáng kể về khả năng lý luận.

"Đó là điều mà các nhà khoa học chưa biết cách thực hiện ngày nay. Đây là lý do tại sao giám sát theo quy định là cần thiết ngay bây giờ", Yoshua Bengio nói.

cha-do-dau-ai-o1-cua-openai-lua-doi-gioi-hon-can-kiem-tra-tinh-an-toan-nghiem-ngat.jpg — Yoshua Bengio cho rằng o1 có khả năng lý luận vượt trội so với các phiên bản trước đó - Ảnh: Getty Images

Giải thưởng Turing năm 2018 trị giá 1 triệu USD được trao cho Yoshua Bengio, Yann LeCun và Geoffrey Hinton, ba nhà khoa học đã đặt nền móng cho AI hiện đại. Họ được ví như những “cha đỡ đầu” của thế giới AI.

Các kỹ thuật mà Yann LeCun, Yoshua Bengio, Geoffrey Hinton phát triển từ những năm 1990 và 2000 đã góp phần tạo ra những đột phá lớn trong lĩnh vực thị giác máy tính và nhận dạng giọng nói. Các thành quả nghiên cứu của họ đã giúp củng cố sự phát triển cho lĩnh vực AI hiện nay, từ ô tô tự lái đến chẩn đoán y tế tự động.

Theo trang The Verge, trên thực tế, nhiều người đều đang tận hưởng những thành quả khoa học của Yann LeCun và Yoshua Bengio, Geoffrey Hinton mà đôi khi chẳng hề hay biết. Đó có thể là hệ thống nhận dạng khuôn mặt trên smartphone hay những câu gợi ý khi bạn đang chat hoặc gõ email.

Jeff Dean, người đứng đầu bộ phận AI của Google vào năm 2018, ca ngợi thành tựu của ba nhà khoa học này. Ông cho rằng mạng nơ ron thần kinh nhân tạo là một trong những tiến bộ lớn nhất của ngành khoa học hiện đại. Trọng tâm của mạng lưới này đến từ các kỹ thuật cơ bản được phát triển bởi Yann LeCun, Yoshua Bengio và Geoffrey Hinton.

Thành tựu của bộ ba này đặc biệt đáng chú ý khi họ giữ niềm tin vào AI tại thời điểm triển vọng của công nghệ ảm đạm. Chia sẻ sau khi nhận giải thưởng Giải thưởng Turing 2018, Yann LeCun cho biết những năm 90 của thế kỷ trước là khoảng thời gian đen tối với ông. Đó là khi ông không thể công bố các nghiên cứu về mạng lưới thần kinh bởi sự thiếu hứng thú từ phía cộng đồng.

Dự án của ba nhà khoa học này chỉ bắt đầu được phổ biến và bùng nổ vào những năm 2012, 2013. Trong giai đoạn đó, Yoshua Bengio, Geoffrey Hinton và Yann LeCun đã chứng minh được rằng dự án mạng lưới thần kinh của họ mang tới những kết quả trông thấy trong khả năng nhận dạng khuôn mặt. Dần dần kể từ đó, công trình nghiên cứu của ba nhà khoa học đi tiên phong gồm mạng lưới thần kinh và tích chập, đã mở ra một chương mới về phát triển các thuật toán dành cho AI và mở rộng trong toàn bộ công nghệ của loài người.

Hôm 12.9, OpenAI ra mắt loạt mô hình ngôn ngữ lớn được thiết kế để dành nhiều thời gian hơn xử lý câu trả lời cho truy vấn, nhằm giải quyết những vấn đề khó.

Các mô hình ngôn ngữ lớn này có khả năng lý luận thông qua những nhiệm vụ phức tạp và có thể giải quyết vấn đề khó hơn so với phiên bản trước đây trong lĩnh vực khoa học, lập trình và toán học, OpenAI viết trong một bài đăng trên blog.

OpenAI sử dụng tên mã Strawberry để chỉ dự án nội bộ, trong khi đặt tên cho mô hình là o1 và o1-mini. Công ty được Microsoft hậu thuẫn cho biết o1 trong ChatGPT và API (giao diện lập trình ứng dụng) của nó khả dụng từ hôm 12.9.

Noam Brown, nhà nghiên cứu tập trung vào việc cải thiện khả năng lý luận trong các mô hình AI của OpenAI, xác nhận trong một bài đăng trên nền tảng truyền thông xã hội X rằng o1 và o1-mini giống với dự án Strawberry.

"Tôi rất vui khi được chia sẻ với tất cả các bạn thành quả về nỗ lực của chúng tôi tại OpenAI nhằm tạo ra các mô hình AI có khả năng lý luận thực sự tổng quát", Noam Brown viết.

Trong một bài đăng trên blog, OpenAI cho biết thuật toán học tăng cường quy mô lớn của họ "dạy cho mô hình AI cách suy nghĩ một cách hiệu quả bằng cách sử dụng chuỗi suy nghĩ". Theo OpenAI, o1 vượt trội so với các mô hình ngôn ngữ lớn khác trong các nhiệm vụ nặng về lý luận ở lĩnh vực khoa học, lập trình và toán học.

“o1 dành nhiều thời gian hơn để suy nghĩ kỹ trước khi phản hồi, giống như cách một người sẽ làm”, OpenAI tiết lộ.

Công ty cho biết o1 đạt điểm 83% trong kỳ thi vòng loại Olympic Toán học Quốc tế, so với 13% của mô hình AI trước đó là GPT-4o.

OpenAI cho biết o1 cải thiện hiệu suất với các câu hỏi lập trình cạnh tranh và vượt qua độ chính xác ở cấp độ tiến sĩ của con người trên thước đo những vấn đề khoa học.

"Trong các bài kiểm tra của chúng tôi, o1 đạt kết quả tương đương với những nghiên cứu sinh tiến sĩ khi giải quyết các bài toán thách thức trong vật lý, hóa học và sinh học. Chúng tôi cũng nhận thấy rằng nó vượt trội trong toán học và lập trình. Ở kỳ thi vòng loại Olympic Toán học Quốc tế, GPT-4o chỉ giải đúng 13% các bài toán, còn mô hình lý luận đạt 83%. Khả năng lập trình của o1 cũng được đánh giá trong các cuộc thi và đạt đến mức 89% ở những cuộc thi Codeforces", OpenAI viết trên blog.

Noam Brown tiết lộ o1 đạt được kết quả đó bằng cách sử dụng kỹ thuật “lý luận theo chuỗi tư duy”, gồm việc chia vấn đề phức tạp thành những bước logic nhỏ hơn.

Codeforces là nền tảng trực tuyến nổi tiếng, được thiết kế đặc biệt cho các lập trình viên muốn rèn luyện và nâng cao kỹ năng giải quyết vấn đề thông qua việc tham gia các cuộc thi lập trình. Codeforces cung cấp môi trường cạnh tranh lành mạnh, nơi các lập trình viên từ khắp nơi trên thế giới có thể so tài và học hỏi lẫn nhau.

Các nhà nghiên cứu lưu ý rằng hiệu suất của mô hình ngôn ngữ lớn trên những vấn đề phức tạp có xu hướng cải thiện khi phương pháp này được sử dụng như kỹ thuật nhắc nhở. OpenAI hiện đã tự động hóa khả năng này để các mô hình ngôn ngữ lớn có thể tự chia nhỏ các vấn đề mà không cần người dùng nhắc nhở.

"Chúng tôi đã đào tạo các mô hình này để dành nhiều thời gian hơn suy nghĩ về các vấn đề trước khi trả lời, giống một con người. Thông qua quá trình đào tạo, chúng học cách tinh chỉnh quá trình suy nghĩ của mình, thử các chiến lược khác nhau và nhận ra lỗi lầm", OpenAI cho hay.

Nhà sáng lập startup AI hàng đầu Trung Quốc ca ngợi cải tiến quan trọng trong o1

Sự phát triển của AI đã chứng kiến sự thay đổi mang tính bước ngoặt với việc OpenAI ra mắt mô hình o1, theo Yang Zhilin - nhà sáng lập và lãnh đạo Moonshot AI, một trong những công ty AI tạo sinh lớn nhất Trung Quốc.

Một “cải tiến quan trọng” được thực hiện bởi o1 là có thể hoàn thành các nhiệm vụ mà con người sẽ mất nhiều thời gian để suy nghĩ và thực hiện, Yang Zhilin nhận xét.

Sự phát triển này đại diện cho sự thay đổi quan trọng vì các nhà phát triển mô hình ngôn ngữ lớn, khi đã hết dữ liệu tự nhiên để đào tạo mô hình, đang chuyển sang kỹ thuật học tăng cường để tái tạo quá trình suy nghĩ và từ đó tạo ra nhiều dữ liệu hơn, Yang Zhilin nói.

Yang Zhilin nói về o1: "Thay vì trả lời một câu hỏi đơn giản, nó có thể dành 20 giây để suy nghĩ".

"Trong tương lai, bạn có thể thấy AI có khả năng thực hiện các nhiệm vụ kéo dài vài phút hoặc thậm chí vài giờ, chuyển đổi giữa các chế độ khác nhau với khả năng lý luận ngày càng mạnh mẽ. Tôi tin rằng đây là những xu hướng rất quan trọng trong sự phát triển của AI vào tương lai", Giám đốc điều Moonshot AI cho biết thêm.

nha-sang-lap-startup-ai-hang-dau-trung-quoc-ca-ngoi-cai-tien-quan-trong-trong-mo-hinh-o1-cua-openai.png — Yang Zhilin, người sáng lập Moonshot AI - Ảnh: Weibo

Được thành lập năm ngoái, Moonshot AI gần đây trở thành kỳ lân có giá trị cao nhất trong số các công ty khởi nghiệp AI đang phát triển mạnh mẽ ở Trung Quốc đại lục. Đó là nhóm 4 công ty khởi nghiệp được gọi là “những con hổ AI mới của Trung Quốc”, có cả Minimax, Baichuan và Zhipu AI.

Ban đầu được hỗ trợ bởi gã khổng lồ thương mại điện tử Alibaba (Trung Quốc), Moonshot AI gần đây nhận khoản đầu tư từ Tencent, nâng định giá từ 3 tỉ USD lên 3,3 tỉ USD.

Bài liên quan

Nhóm khoa học Trung-Mỹ tạo mô hình AI tiên tiến giúp vượt qua thách thức lớn để phát triển các loại thuốc mới

Nhóm nhà khoa học ở Trung Quốc và Mỹ cho biết đã phát triển mô hình trí tuệ nhân tạo (AI) mới mang tên ActFound, có thể giúp vượt qua một số thách thức lớn với việc phát triển và khám phá thuốc mới.

Đọc tiếp

OpenAI và Anthropic ký thỏa thuận chưa từng thấy với chính phủ Mỹ về nghiên cứu, đánh giá mô hình AI

Thói quen hằng ngày của CEO OpenAI: Nhịn ăn 15 tiếng, uống thuốc ngủ liều thấp

OpenAI tự định giá đến 150 tỉ USD ở vòng gọi vốn mới có Nvidia và Apple trước khi ra mắt mô hình AI mới tiên tiến

(0) Bình luận

Xếp theo:

Đọc thêm Nhịp đập khoa học

Nổi bật Một thế giới

Cần có chiến lược để chuyển đổi giao thông xanh

một giờ trước Khoa học - công nghệ

Ngành giao thông Việt Nam thải 32,9 triệu tấn CO2, chiếm 7,2% tổng lượng khí phát thải nhà kính của cả nước trong kỳ kiểm kê gần nhất (2021). Lượng phát thải từ ngành giao thông dự tính tăng gấp 10 lần nếu Việt Nam không có hành động kịp thời. Giải pháp lớn là ưu tiên sử dụng xe điện.

Phó thủ tướng Hồ Đức Phớc kiểm tra các công trình giao thông trọng điểm tại Đồng Nai

Chiều 13.3, đoàn công tác của Chính phủ do Phó thủ tướng Hồ Đức Phớc dẫn đầu đã kiểm tra tiến...
Quan hệ đối tác với Apple giúp ChatGPT tăng trưởng thần tốc, Sam Altman có lý do để mỉm cười

Sam Altman, Giám đốc điều hành OpenAI, vừa chào đón con đầu lòng và đứa trẻ đang học cách ăn....
Chuyên gia AI bàn cách tối ưu công nghệ trong bối cảnh tài nguyên hạn chế

Theo các chuyên gia, việc tạo ra những vấn đề bền vững đòi hỏi ngành công nghiệp phải tìm kiếm...

Đừng bỏ lỡ

Miền Bắc có mưa trước đợt không khí lạnh

một giờ trước Theo dòng thời sự

Dự báo thời tiết ngày 14.3 Bắc Bộ có mưa, chuẩn bị chuyển rét do ảnh hưởng của không khí lạnh.
Cổ phiếu Intel tăng vọt 15% khi nhà đầu tư hoan nghênh Lip-Bu Tan trở thành CEO mới

10 giờ trước Thế giới số

Cổ phiếu Intel đã tăng vọt 15,52% hôm 13.3 khi Phố Wall hoan nghênh quyết định bổ nhiệm cựu thành viên hội đồng quản trị Lip-Bu Tan làm giám đốc điều hành công ty.
Năng lực sản xuất và AI của Trung Quốc đặt ra ‘mối đe dọa sống còn’ với Mỹ trong lĩnh vực robot

11 giờ trước Nhịp đập khoa học

Thị phần của các hãng sản xuất trong nước tại Trung Quốc, thị trường robot lớn nhất thế giới, đang gần chạm mốc 50%, tăng từ 30% vào năm 2020.
Sở VH-TT TP.HCM lên tiếng vụ quảng cáo 'lố' kẹo rau củ của hoa hậu Thùy Tiên

11 giờ trước Theo dòng thời sự

Sở Văn hóa - Thể thao (VH-TT) TP.HCM phối hợp liên ngành rà soát toàn diện, xử lý nghiêm đối với trường hợp quảng cáo sai sự thật (nếu có vi phạm).
Công an Hà Nội cảnh báo việc vay tiền thế chấp bằng clip nhạy cảm

11 giờ trước Sự kiện

Công an Hà Nội cho biết thời gian qua xuất hiện tình trạng nhiều thanh, thiếu niên dùng hình ảnh, video clip nhạy cảm của cá nhân để thế chấp vay tiền tiêu xài.

Mới nhất

Cần có chiến lược để chuyển đổi giao thông xanh

một giờ trước Khoa học - công nghệ

Ngành giao thông Việt Nam thải 32,9 triệu tấn CO2, chiếm 7,2% tổng lượng khí phát thải nhà kính của cả nước trong kỳ kiểm kê gần nhất (2021). Lượng phát thải từ ngành giao thông dự tính tăng gấp 10 lần nếu Việt Nam không có hành động kịp thời. Giải pháp lớn là ưu tiên sử dụng xe điện.
Phó thủ tướng Hồ Đức Phớc kiểm tra các công trình giao thông trọng điểm tại Đồng Nai

12 giờ trước Kinh tế - đầu tư - dự án

Chiều 13.3, đoàn công tác của Chính phủ do Phó thủ tướng Hồ Đức Phớc dẫn đầu đã kiểm tra tiến độ thi công các tuyến cao tốc Bến Lức - Long Thành, Biên Hòa - Vũng Tàu.
Quan hệ đối tác với Apple giúp ChatGPT tăng trưởng thần tốc, Sam Altman có lý do để mỉm cười

14 giờ trước Nhịp đập khoa học

Sam Altman, Giám đốc điều hành OpenAI, vừa chào đón con đầu lòng và đứa trẻ đang học cách ăn. "Đứa con" khác của Sam Altman là ChatGPT đang phát triển mạnh mẽ.
Chuyên gia AI bàn cách tối ưu công nghệ trong bối cảnh tài nguyên hạn chế

14 giờ trước Khoa học - công nghệ

Theo các chuyên gia, việc tạo ra những vấn đề bền vững đòi hỏi ngành công nghiệp phải tìm kiếm những giải pháp mới để tối ưu hóa hiệu suất AI mà không cần phụ thuộc hoàn toàn vào tài nguyên vô hạn.
Thủ tướng: Dự thảo báo cáo KT-XH phải chỉ rõ các điểm nghẽn, không tô hồng, không bôi đen

15 giờ trước Thị trường và chính sách

Thủ tướng cho rằng Dự thảo Báo cáo Kinh tế-xã hội cần phản ánh đúng thực trạng, không tô hồng, không bôi đen trên cơ sở số liệu thống kê; đồng thời chỉ rõ được những tồn tại, hạn chế, điểm nghẽn, nút thắt.