Google nghiên cứu AI có khả năng lý luận giống con người, cố gắng bám đuổi OpenAI

Nhịp đập khoa học - Ngày đăng : 16:26, 03/10/2024

Google và OpenAI đang ở trong cuộc chiến khốc liệt để giành quyền thống trị trong lĩnh vực trí tuệ nhân tạo (AI).

Nhịp đập khoa học

Google nghiên cứu AI có khả năng lý luận giống con người, cố gắng bám đuổi OpenAI

Sơn Vân • 03/10/2024 16:26

Google và OpenAI đang ở trong cuộc chiến khốc liệt để giành quyền thống trị trong lĩnh vực trí tuệ nhân tạo (AI).

Google đang nghiên cứu phần mềm AI có khả năng lý luận giống con người, tương tự mô hình ngôn ngữ lớn o1 của OpenAI, đánh dấu một mặt trận mới trong cuộc cạnh tranh giữa gã khổng lồ công nghệ với công ty khởi nghiệp đang phát triển nhanh chóng này.

Những tháng gần đây, nhiều nhóm tại Google đã đạt được tiến triển trong phần mềm lý luận AI, theo những người hiểu biết về vấn đề này, yêu cầu không nêu tên vì thông tin là riêng tư. Các phần mềm như vậy thành thạo hơn trong việc giải quyết các vấn đề nhiều bước trong lĩnh vực như toán học và lập trình máy tính.

Các nhà nghiên cứu AI đang theo đuổi mô hình lý luận khi tìm bước tiến quan trọng tiếp theo trong công nghệ này. Giống OpenAI, Google đang cố gắng mô phỏng suy luận của con người bằng kỹ thuật gọi là gợi ý chuỗi suy nghĩ, theo hai người trong nhóm.

Với kỹ thuật này, phần mềm sẽ tạm dừng vài giây trước khi phản hồi gợi ý bằng văn bản. Nó sẽ xem xét một số lời gợi ý liên quan rồi tóm tắt lại những gì có vẻ là phản hồi tốt nhất cho người dùng.

Google từ chối bình luận về nỗ lực này.

Google và OpenAI đang ở trong cuộc chiến khốc liệt giành quyền thống trị trong lĩnh vực AI, đặc biệt là kể từ khi ChatGPT ra mắt. Đây là chatbot AI phổ biến mà một số người cho rằng sẽ làm giảm nhu cầu tìm kiếm với Google.

Google đã thực hiện nhiều bước khác nhau để giành lại vị trí dẫn đầu, gồm sáp nhập các phòng nghiên cứu hàng đầu của mình để thành lập đơn vị Google DeepMind và củng cố mối quan hệ giữa những nhà nghiên cứu với nhóm sản phẩm. Tuy nhiên, gã khổng lồ tìm kiếm vẫn tiếp tục chậm hơn trong việc phát hành các sản phẩm AI, phải tạm dừng để xem xét vấn đề về đạo đức, chịu áp lực đáp ứng kỳ vọng từ công chúng về lòng tin vào thương hiệu của mình…

Kể từ khi OpenAI công bố o1, được biết đến với tên gọi nội bộ là Strawberry, vào giữa tháng 9, một số người trong Google DeepMind lo rằng công ty đã tụt hậu. Thế nhưng, họ không còn quá lo như khi OpenAI ra mắt ChatGPT nữa, vì giờ đây Google đã có một số sản phẩm AI riêng.

Oren Etzioni, nhà nghiên cứu AI kỳ cựu sáng lập TrueMedia.org - tổ chức phi lợi nhuận chuyên chống lại thông tin sai lệch về chính trị, nói dù tốc độ triển khai sản phẩm của Google chậm hơn nhưng họ vẫn là đối thủ đáng gờm.

Oren Etzioni bình luận: "Về mặt kỹ thuật, năng lực của Google luôn là hàng đầu. Họ chỉ bảo thủ hơn trong việc triển khai mọi thứ. Đây là một cuộc chạy marathon và bất kỳ ai cũng có thể giành chiến thắng".

Vào tháng 7, Google đã giới thiệu AlphaProof (chuyên về lý luận toán học) và AlphaGeometry 2 (phiên bản cập nhật của mô hình tập trung vào hình học mà công ty ra mắt đầu năm nay). AlphaProof và AlphaGeometry 2 đã giải được 4 trong 6 bài toán trong kỳ thi Olympic Toán học Quốc tế, Google cho biết trong một bài đăng trên blog. Đây là cuộc thi thường niên mà học sinh giải quyết các chủ đề như đại số và hình học.

Tại hội nghị dành cho nhà phát triển I/O hồi tháng 5, Google đã giới thiệu sơ lược về trợ lý AI mang tên Astra, có thể sử dụng camera của điện thoại để quan sát thế giới xung quanh và trả lời các câu hỏi, chẳng hạn cho người dùng biết cô ấy để quên kính ở đâu. Google thông báo một số tính năng Astra có thể xuất hiện trên mô hình AI hàng đầu của mình là Gemini cuối năm nay.

"Suy luận toán học nâng cao là một khả năng quan trọng với AI hiện đại", Demis Hassabis, Giám đốc điều hành Google DeepMind, viết trong một bài đăng trên mạng xã hội X vào tháng 7.

google-nghien-cuu-ai-co-kha-nang-ly-luan-giong-con-nguoi-co-gang-bam-duoi-openai.jpg — Google đang nghiên cứu phần mềm AI có khả năng lý luận giống con người, tương tự mô hình ngôn ngữ lớn o1 của OpenAI - Ảnh: Getty Images

OpenAI giới thiệu o1 vào ngày 12.9 vừa qua. Theo OpenAI, o1 vượt trội hơn mô hình ngôn ngữ lớn khác trong các nhiệm vụ nặng về mặt lý luận ở lĩnh vực khoa học, lập trình và toán học. OpenAI tiết lộ o1 biết "cách suy nghĩ hiệu quả bằng cách sử dụng chuỗi suy nghĩ của mình" nhờ một kỹ thuật được gọi là học tăng cường.

Học tăng cường là một nhánh của học máy, nơi tác nhân học cách đưa ra các quyết định trong môi trường để tối ưu hóa nhiệm vụ cụ thể. Nói cách khác, nó giống như việc dạy một đứa trẻ học đi xe đạp. Đứa trẻ sẽ thử đi, ngã, rồi lại thử và cuối cùng sẽ tìm ra cách cân bằng và đi được.

Học máy là một lĩnh vực trong AI tập trung vào việc phát triển các thuật toán và mô hình máy tính có khả năng học hỏi từ dữ liệu và cải thiện hiệu suất của chúng theo thời gian mà không cần lập trình cụ thể. Các hệ thống học máy có khả năng tự động tìm hiểu và áp dụng kiến thức từ dữ liệu để thực hiện các nhiệm vụ cụ thể như phân loại, dự đoán, nhận dạng mẫu và tối ưu hóa quyết định.

Những ứng dụng của học máy rất đa dạng như xử lý ngôn ngữ tự nhiên, thị giác máy tính, xe tự hành, dự đoán thời tiết, quản lý dữ liệu lớn...

Học máy đã có sự tiến bộ đáng kể trong thập kỷ gần đây, nhờ sự phát triển của các mô hình học sâu và khả năng xử lý dữ liệu lớn (big data), mang lại nhiều cơ hội và tiềm năng giải quyết các vấn đề phức tạp và cải thiện hiệu suất trong nhiều lĩnh vực khác nhau.

Yang Zhilin, nhà sáng lập Moonshot AI - công ty khởi nghiệp AI hàng đầu Trung Quốc, ca ngợi o1 có một “cải tiến quan trọng” là hoàn thành các nhiệm vụ mà con người sẽ mất nhiều thời gian để suy nghĩ và thực hiện.

Yang Zhilin cho biết o1 đại diện cho sự thay đổi quan trọng vì các nhà phát triển mô hình ngôn ngữ lớn, khi đã hết dữ liệu tự nhiên để đào tạo mô hình, đang chuyển sang kỹ thuật học tăng cường để tái tạo quá trình suy nghĩ và từ đó tạo ra nhiều dữ liệu hơn.

“o1 dành nhiều thời gian hơn để suy nghĩ kỹ trước khi phản hồi, giống như cách một người sẽ làm”, OpenAI viết trong bài đăng trên blog.

"Thay vì trả lời một câu hỏi đơn giản, nó có thể dành 20 giây để suy nghĩ", Yang Zhilin nói về o1.

"Trong tương lai, bạn có thể thấy AI có khả năng thực hiện các nhiệm vụ kéo dài vài phút hoặc thậm chí vài giờ, chuyển đổi giữa các chế độ khác nhau với khả năng lý luận ngày càng mạnh mẽ. Tôi tin rằng đây là những xu hướng rất quan trọng trong sự phát triển của AI vào tương lai", nhà sáng lập Moonshot AI cho biết thêm.

Theo Roey Tzezana, các kỹ thuật chuỗi suy nghĩ như vậy, khi được thực hiện đúng cách, có thể tạo ra kết quả tốt mà không cần phải tăng đáng kể sức mạnh tính toán. Điều đó có thể hữu ích cho các công ty Trung Quốc không thể tiếp cận chip AI tiên tiến trong bối cảnh đối diện hạn chế xuất khẩu từ Mỹ.

"Nó sẽ giảm bớt một số khó khăn mà tình trạng thiếu sức mạnh tính toán sẽ gây ra cho Trung Quốc. Vì vậy, sẽ rất thú vị khi xem liệu sự thiếu hụt sức mạnh tính toán ở Trung Quốc có dẫn đến sự đổi mới tốt hơn trong lĩnh vực này hay không”, Roey Tzezana nói.

Trong bài đăng trên blog, OpenAI cho biết o1 đạt điểm 83% trong kỳ thi vòng loại Olympic Toán học Quốc tế, so với 13% của mô hình AI trước đó là GPT-4o.

Công ty cho biết o1 cải thiện hiệu suất với các câu hỏi lập trình cạnh tranh và vượt qua độ chính xác ở cấp độ tiến sĩ của con người trên thước đo những vấn đề khoa học.

"Trong các bài kiểm tra của chúng tôi, o1 đạt kết quả tương đương với những nghiên cứu sinh tiến sĩ khi giải quyết các bài toán thách thức trong vật lý, hóa học và sinh học. Chúng tôi cũng nhận thấy rằng nó vượt trội trong toán học và lập trình. Ở kỳ thi vòng loại Olympic Toán học Quốc tế, GPT-4o chỉ giải đúng 13% các bài toán, còn mô hình lý luận đạt 83%. Khả năng lập trình của o1 cũng được đánh giá trong các cuộc thi và đạt đến mức 89% ở những cuộc thi Codeforces", OpenAI viết trên blog.

Noam Brown, nhà nghiên cứu tập trung vào việc cải thiện khả năng lý luận trong các mô hình AI của OpenAI, tiết lộ o1 đạt được kết quả đó bằng cách sử dụng kỹ thuật “lý luận theo chuỗi tư duy”, gồm việc chia vấn đề phức tạp thành những bước logic nhỏ hơn.

Codeforces là nền tảng trực tuyến nổi tiếng, được thiết kế đặc biệt cho các lập trình viên muốn rèn luyện và nâng cao kỹ năng giải quyết vấn đề thông qua việc tham gia các cuộc thi lập trình. Codeforces cung cấp môi trường cạnh tranh lành mạnh, nơi các lập trình viên từ khắp nơi trên thế giới có thể so tài và học hỏi lẫn nhau.

Các nhà nghiên cứu lưu ý rằng hiệu suất của mô hình ngôn ngữ lớn trên những vấn đề phức tạp có xu hướng cải thiện khi phương pháp này được sử dụng như kỹ thuật nhắc nhở. OpenAI hiện đã tự động hóa khả năng này để các mô hình ngôn ngữ lớn có thể tự chia nhỏ các vấn đề mà không cần người dùng nhắc nhở.

"Chúng tôi đã đào tạo các mô hình này để dành nhiều thời gian hơn suy nghĩ về các vấn đề trước khi trả lời, giống một con người. Thông qua quá trình đào tạo, chúng học cách tinh chỉnh quá trình suy nghĩ của mình, thử các chiến lược khác nhau và nhận ra lỗi lầm", OpenAI cho hay.

Sơn Vân