Nhà sáng lập startup AI hàng đầu Trung Quốc ca ngợi cải tiến quan trọng trong mô hình o1 của OpenAI

Nhịp đập khoa học - Ngày đăng : 16:53, 17/09/2024

Sự phát triển của trí tuệ nhân tạo (AI) đã chứng kiến sự thay đổi mang tính bước ngoặt với việc OpenAI ra mắt mô hình mới nhất o1, theo nhà sáng lập một trong những công ty AI tạo sinh lớn nhất Trung Quốc.

Nhịp đập khoa học

Nhà sáng lập startup AI hàng đầu Trung Quốc ca ngợi cải tiến quan trọng trong mô hình o1 của OpenAI

Sơn Vân • 17/09/2024 16:53

Một “cải tiến quan trọng” được thực hiện bởi o1, mô hình ngôn ngữ lớn mới nhất của OpenAI trình làng tuần trước, là có thể hoàn thành các nhiệm vụ mà con người sẽ mất nhiều thời gian để suy nghĩ và thực hiện, theo Yang Zhilin.

Yang Zhilin, nhà sáng lập và lãnh đạo Moonshot AI (Trung Quốc), cho biết điều này trong buổi chia sẻ tại thành phố Thiên Tân, Tencent News đưa tin. Tencent News là nền tảng tin tức trực tuyến lớn ở Trung Quốc, thuộc sở hữu của tập đoàn công nghệ khổng lồ Tencent.

Sự phát triển này đại diện cho sự thay đổi quan trọng vì các nhà phát triển mô hình ngôn ngữ lớn, khi đã hết dữ liệu tự nhiên để đào tạo mô hình, đang chuyển sang kỹ thuật học tăng cường để tái tạo quá trình suy nghĩ và từ đó tạo ra nhiều dữ liệu hơn, Yang Zhilin nói.

nha-sang-lap-startup-ai-hang-dau-trung-quoc-ca-ngoi-cai-tien-quan-trong-trong-mo-hinh-o1-cua-openai.png — Yang Zhilin, người sáng lập Moonshot AI - Ảnh: Weibo

Trong một bài đăng trên blog, OpenAI (có trụ sở tại thành phố San Francisco, Mỹ) cho biết thuật toán học tăng cường quy mô lớn của họ "dạy cho mô hình AI cách suy nghĩ một cách hiệu quả bằng cách sử dụng chuỗi suy nghĩ". Theo OpenAI, o1 vượt trội so với các mô hình ngôn ngữ lớn khác trong các nhiệm vụ nặng về lý luận ở lĩnh vực khoa học, lập trình và toán học.

“o1 dành nhiều thời gian hơn để suy nghĩ kỹ trước khi phản hồi, giống như cách một người sẽ làm”, OpenAI cho hay.

"Thay vì trả lời một câu hỏi đơn giản, nó có thể dành 20 giây để suy nghĩ", Yang Zhilin nói về o1.

"Trong tương lai, bạn có thể thấy AI có khả năng thực hiện các nhiệm vụ kéo dài vài phút hoặc thậm chí vài giờ, chuyển đổi giữa các chế độ khác nhau với khả năng lý luận ngày càng mạnh mẽ. Tôi tin rằng đây là những xu hướng rất quan trọng trong sự phát triển của AI vào tương lai", Giám đốc điều Moonshot AI cho biết thêm.

Được thành lập năm ngoái, Moonshot AI gần đây trở thành kỳ lân có giá trị cao nhất trong số các công ty khởi nghiệp AI đang phát triển mạnh mẽ ở Trung Quốc đại lục. Đó là nhóm 4 công ty khởi được gọi là “những con hổ AI mới của Trung Quốc”, có cả Minimax, Baichuan và Zhipu AI.

Ban đầu được hỗ trợ bởi gã khổng lồ thương mại điện tử Alibaba (Trung Quốc), Moonshot AI gần đây nhận khoản đầu tư từ Tencent, nâng định giá từ 3 tỉ USD lên 3,3 tỉ USD.

Chatbot Kimi của Moonshot AI được xây dựng trên mô hình ngôn ngữ lớn Kimi do công ty tự phát triển, nhanh chóng trở nên phổ biến tại Trung Quốc đại lục sau khi ra mắt vào tháng 10.2023, vì có khả năng xử lý các truy vấn văn bản cực dài lên tới 2 triệu ký tự Trung Quốc.

Giữa cuộc cạnh tranh khốc liệt với những công ty khởi nghiệp khác và hãng công nghệ lớn ở Trung Quốc để đưa sản phẩm AI tạo sinh ra thị trường, Moonshot AI hồi tháng 8 đã tham gia cuộc chiến giá mô hình ngôn ngữ lớn, giảm 1/2 giá một tính năng mới trên Kimi.

Tính năng này là bộ nhớ đệm ngữ cảnh, cho phép các nhà phát triển mô hình ngôn ngữ lớn lưu trữ thông tin trong một thời gian nhất định. Thông tin này có thể được yêu cầu thường xuyên để mô hình ngôn ngữ lớn của họ phản hồi nhanh hơn với các truy vấn tương tự.

Hôm 12.9, OpenAI ra mắt loạt mô hình ngôn ngữ lớn được thiết kế để dành nhiều thời gian hơn xử lý câu trả lời cho truy vấn, nhằm giải quyết những vấn đề khó.

Các mô hình ngôn ngữ lớn này có khả năng lý luận thông qua những nhiệm vụ phức tạp và có thể giải quyết vấn đề khó hơn so với phiên bản trước đây trong lĩnh vực khoa học, lập trình và toán học, OpenAI viết trong một bài đăng trên blog.

OpenAI sử dụng tên mã Strawberry để chỉ dự án nội bộ, trong khi đặt tên cho mô hình là o1 và o1-mini. Công ty được Microsoft hậu thuẫn cho biết o1 trong ChatGPT và API (giao diện lập trình ứng dụng) của nó khả dụng từ hôm 12.9.

Noam Brown, nhà nghiên cứu tập trung vào việc cải thiện khả năng lý luận trong các mô hình AI của OpenAI, xác nhận trong một bài đăng trên nền tảng truyền thông xã hội X rằng o1 và o1-mini giống với dự án Strawberry.

"Tôi rất vui khi được chia sẻ với tất cả các bạn thành quả về nỗ lực của chúng tôi tại OpenAI nhằm tạo ra các mô hình AI có khả năng lý luận thực sự tổng quát", Noam Brown viết.

Trong bài đăng trên blog, OpenAI cho biết o1 đạt điểm 83% trong kỳ thi vòng loại Olympic Toán học Quốc tế, so với 13% của mô hình AI trước đó là GPT-4o.

Công ty cho biết o1 cải thiện hiệu suất với các câu hỏi lập trình cạnh tranh và vượt qua độ chính xác ở cấp độ tiến sĩ của con người trên thước đo những vấn đề khoa học.

"Trong các bài kiểm tra của chúng tôi, o1 đạt kết quả tương đương với những nghiên cứu sinh tiến sĩ khi giải quyết các bài toán thách thức trong vật lý, hóa học và sinh học. Chúng tôi cũng nhận thấy rằng nó vượt trội trong toán học và lập trình. Ở kỳ thi vòng loại Olympic Toán học Quốc tế, GPT-4o chỉ giải đúng 13% các bài toán, còn mô hình lý luận đạt 83%. Khả năng lập trình của o1 cũng được đánh giá trong các cuộc thi và đạt đến mức 89% ở những cuộc thi Codeforces", OpenAI viết trên blog.

Noam Brown tiết lộ o1 đạt được kết quả đó bằng cách sử dụng kỹ thuật “lý luận theo chuỗi tư duy”, gồm việc chia vấn đề phức tạp thành những bước logic nhỏ hơn.

Codeforces là nền tảng trực tuyến nổi tiếng, được thiết kế đặc biệt cho các lập trình viên muốn rèn luyện và nâng cao kỹ năng giải quyết vấn đề thông qua việc tham gia các cuộc thi lập trình. Codeforces cung cấp môi trường cạnh tranh lành mạnh, nơi các lập trình viên từ khắp nơi trên thế giới có thể so tài và học hỏi lẫn nhau.

nha-sang-lap-startup-ai-hang-dau-trung-quoc-ca-ngoi-cai-tien-quan-trong-trong-mo-hinh-o1-cua-openai1.jpg — o1 được thiết kế để dành nhiều thời gian hơn xử lý câu trả lời cho truy vấn, nhằm giải quyết những vấn đề khó - Ảnh: OpenAI

Các nhà nghiên cứu lưu ý rằng hiệu suất của mô hình ngôn ngữ lớn trên những vấn đề phức tạp có xu hướng cải thiện khi phương pháp này được sử dụng như kỹ thuật nhắc nhở. OpenAI hiện đã tự động hóa khả năng này để các mô hình ngôn ngữ lớn có thể tự chia nhỏ các vấn đề mà không cần người dùng nhắc nhở.

"Chúng tôi đã đào tạo các mô hình này để dành nhiều thời gian hơn suy nghĩ về các vấn đề trước khi trả lời, giống một con người. Thông qua quá trình đào tạo, chúng học cách tinh chỉnh quá trình suy nghĩ của mình, thử các chiến lược khác nhau và nhận ra lỗi lầm", OpenAI cho hay.

Reuters là hãng thông tấn đầu tiên đưa tin về công trình của OpenAI trong dự án lý luận, khi đó được gọi là Q*, vào tháng 11.2023. Hồi tháng 7, Reuters đưa tin rằng dự án này được gọi là Strawberry.

Mức định giá 150 tỉ USD của OpenAI sẽ phụ thuộc vào việc thay đổi cấu trúc

OpenAI đang đàm phán để huy động 6,5 tỉ USD từ các nhà đầu tư với mức định giá công ty khởi nghiệp AI này lên đến 150 tỉ USD, theo những người hiểu rõ tình hình.

Mức định giá mới, không bao gồm cả số tiền đang được huy động, cao hơn đáng kể so với mức định giá 86 tỉ USD từ đề nghị mua lại cổ phần của OpenAI hồi đầu năm nay. Động thái đó củng cố vị thế OpenAI là một trong những công ty khởi nghiệp có giá trị nhất trên thế giới.

Một trong những nguồn tin cho biết OpenAI đàm phán để vay 5 tỉ USD từ các ngân hàng dưới dạng một hạn mức tín dụng quay vòng.

“Cha đẻ ChatGPT” từ chối bình luận khi hãng tin Bloomberg liên hệ. Những người hiểu rõ thỏa thuận này lưu ý rằng cuộc thảo luận vẫn đang diễn ra và những điều khoản có thể thay đổi.

Theo Reuters, mức định giá 150 tỷ USD sẽ phụ thuộc vào việc liệu OpenAI có thể thay đổi cấu trúc công ty và gỡ bỏ giới hạn lợi nhuận cho các nhà đầu tư hay không.

OpenAI đang nỗ lực thay đổi về mặt cấu trúc để thu hút ngày càng nhiều đầu tư hơn nữa nhằm tài trợ cho mục tiêu theo đuổi AI tổng quát (AGI). AGI là AI vượt trội trí thông minh của con người.

Vòng gọi vốn lớn của OpenAI đã nhận được sự ủng hộ mạnh mẽ từ các nhà đầu tư và có thể được hoàn tất trong hai tuần tới, do doanh thu của công ty tăng trưởng nhanh chóng.

Cuối tháng 8, truyền thông Mỹ đưa tin Apple và Nvidia đang đàm phán để đầu tư vào OpenAI như một phần trong vòng gọi vốn mới. Tin tức này xuất hiện sau khi Wall Street Journal đưa tin công ty đầu tư mạo hiểm Thrive Capital sẽ đầu tư khoảng 1 tỉ USD vào OpenAI.

Microsoft, nhà đầu tư chiến lược lớn nhất của OpenAI với khoản đầu tư hơn 10 tỉ USD, dự kiến sẽ tham gia vào vòng gọi vốn mới này.

Số tiền đầu tư chính xác vào OpenAI từ Apple, Nvidia và Microsoft vẫn chưa được tiết lộ. Apple, Microsoft và Nvidia chính là ba công ty có vốn hóa thị trường cao nhất hiện nay.

Theo các chuyên gia, nếu việc tái cấu trúc không thành công, OpenAI sẽ cần phải đàm phán lại mức định giá với các nhà đầu tư. Theo đó, cổ phiếu OpenAI sẽ được chuyển đổi, có thể ở mức thấp hơn.

Khi được hỏi về vấn đề tài chính và thay đổi tiềm năng, OpenAI cho biết vẫn tập trung vào việc xây dựng AI mang lại lợi ích cho mọi người trong khi làm việc với hội đồng phi lợi nhuận của mình. Người phát ngôn nói: "Tổ chức phi lợi nhuận này là cốt lõi trong sứ mệnh của chúng tôi và sẽ tiếp tục tồn tại".

Tuy nhiên, việc gỡ bỏ giới hạn lợi nhuận sẽ cần có sự chấp thuận từ hội đồng phi lợi nhuận của OpenAI, gồm Giám đốc điều hành Sam Altman, Bret Taylor (Chủ tịch hội đồng quản trị OpenAI) và 7 thành viên khác.

OpenAI đã thảo luận với các luật sư về việc chuyển đổi cơ cấu phi lợi nhuận của mình thành công ty vì lợi nhuận, tương tự những gì Anthropic và xAI đang sử dụng.

Nhiều nhà phân tích không rõ liệu những thay đổi cơ bản về cấu trúc doanh nghiệp như vậy có thể xảy ra hay không. Việc xóa bỏ giới hạn lợi nhuận sẽ mang lại cho các nhà đầu tư ban đầu vào OpenAI chiến thắng lớn hơn nữa.

Song điều đó cũng có thể đặt ra câu hỏi về việc OpenAI rời xa sứ mệnh phi lợi nhuận ban đầu của mình. OpenAI cho biết mức giới hạn được đưa ra để "khuyến khích họ nghiên cứu, phát triển và triển khai AGI theo cách cân bằng giữa tính thương mại với tính an toàn và tính bền vững, thay vì chỉ tập trung vào việc tối đa hóa lợi nhuận”.

Sơn Vân