Hotline quảng cáo: 076 4575985 Hotline nội dung: 0934.999945

Nhịp đập khoa học

Chuyên gia: Trung Quốc chậm hơn Mỹ 1 năm về mô hình ngôn ngữ lớn, khoảng cách này là đáng kể

Sơn Vân • 18:42 29/09/2024

Theo chuyên gia, Trung Quốc vẫn chậm hơn Mỹ khoảng một năm về mô hình ngôn ngữ lớn và phải cố gắng hơn nữa để bắt kịp sau khi OpenAI ra mắt o1.

Khi nói đến mô hình ngôn ngữ lớn có khả năng tạo văn bản, Trung Quốc chậm hơn Mỹ khoảng nửa năm đến một năm, theo Roey Tzezana, nghiên cứu viên tại Hội thảo Yuval Ne’eman về Khoa học, Công nghệ & An ninh thuộc Đại học Tel Aviv (Israel).

Dù khoảng cách có vẻ không lớn nhưng không dễ thu hẹp với tốc độ phát triển của trí tuệ nhân tạo (AI), các nhà nghiên cứu nhận định.

Ông cho biết: "Mỗi năm trong khoảng hai năm rưỡi trở lại đây, đều có sự thay đổi lớn về khả năng của AI. Vì vậy, một năm nghe có vẻ không nhiều và cũng không đến nỗi tệ, nhưng đó là khoảng cách đáng kể”.

Một doanh nhân AI người Trung Quốc gần đây đã đưa ra đánh giá tương tự. Khoảng cách giữa Trung Quốc và Mỹ về mô hình ngôn ngữ lớn trực tuyến vẫn còn khoảng 1 đến 2 năm, Li Dahai, đồng sáng lập kiêm Giám đốc điều hành công ty khởi nghiệp AI ModelBest, nhận xét trong cuộc phỏng vấn với hãng tin Tencent News.

Dù số năm chính xác chỉ dựa trên nhận định của chuyên gia nhưng "khoảng cách vẫn tồn tại rõ ràng", theo Li Dahai, người trước đây là Giám đốc công nghệ Zhihu - nền tảng hỏi đáp giống kiểu Quora ở Trung Quốc

Li Dahai nói thêm rằng không có mô hình ngôn ngữ lớn trực tuyến nào tại Trung Quốc đạt hoặc vượt qua GPT-4 của OpenAI.

Ông cho biết Trung Quốc sẽ “phải cố gắng hơn nữa” để bắt kịp OpenAI sau khi mô hình ngôn ngữ lớn o1 trình làng.

Có trụ sở tại thành phố San Francisco (Mỹ), OpenAI đã giới thiệu o1 vào ngày 12.9. Theo OpenAI, o1 vượt trội hơn mô hình ngôn ngữ lớn khác trong các nhiệm vụ nặng về mặt lý luận ở lĩnh vực khoa học, lập trình và toán học. OpenAI tiết lộ o1 biết "cách suy nghĩ hiệu quả bằng cách sử dụng chuỗi suy nghĩ của mình" nhờ một kỹ thuật được gọi là học tăng cường.

Học tăng cường là một nhánh của học máy, nơi tác nhân học cách đưa ra các quyết định trong môi trường để tối ưu hóa nhiệm vụ cụ thể. Nói cách khác, nó giống như việc dạy một đứa trẻ học đi xe đạp. Đứa trẻ sẽ thử đi, ngã, rồi lại thử và cuối cùng sẽ tìm ra cách cân bằng và đi được.

Học máy là một lĩnh vực trong AI tập trung vào việc phát triển các thuật toán và mô hình máy tính có khả năng học hỏi từ dữ liệu và cải thiện hiệu suất của chúng theo thời gian mà không cần lập trình cụ thể. Các hệ thống học máy có khả năng tự động tìm hiểu và áp dụng kiến thức từ dữ liệu để thực hiện các nhiệm vụ cụ thể như phân loại, dự đoán, nhận dạng mẫu và tối ưu hóa quyết định.

Những ứng dụng của học máy rất đa dạng như xử lý ngôn ngữ tự nhiên, thị giác máy tính, xe tự hành, dự đoán thời tiết, quản lý dữ liệu lớn...

Học máy đã có sự tiến bộ đáng kể trong thập kỷ gần đây, nhờ sự phát triển của các mô hình học sâu và khả năng xử lý dữ liệu lớn (big data), mang lại nhiều cơ hội và tiềm năng giải quyết các vấn đề phức tạp và cải thiện hiệu suất trong nhiều lĩnh vực khác nhau.

Yang Zhilin, nhà sáng lập Moonshot AI - công ty khởi nghiệp AI hàng đầu Trung Quốc, ca ngợi o1 có một “cải tiến quan trọng” là hoàn thành các nhiệm vụ mà con người sẽ mất nhiều thời gian để suy nghĩ và thực hiện.

Yang Zhilin cho biết o1 đại diện cho sự thay đổi quan trọng vì các nhà phát triển mô hình ngôn ngữ lớn, khi đã hết dữ liệu tự nhiên để đào tạo mô hình, đang chuyển sang kỹ thuật học tăng cường để tái tạo quá trình suy nghĩ và từ đó tạo ra nhiều dữ liệu hơn.

“o1 dành nhiều thời gian hơn để suy nghĩ kỹ trước khi phản hồi, giống như cách một người sẽ làm”, OpenAI viết trong bài đăng trên blog.

"Thay vì trả lời một câu hỏi đơn giản, nó có thể dành 20 giây để suy nghĩ", Yang Zhilin nói về o1.

"Trong tương lai, bạn có thể thấy AI có khả năng thực hiện các nhiệm vụ kéo dài vài phút hoặc thậm chí vài giờ, chuyển đổi giữa các chế độ khác nhau với khả năng lý luận ngày càng mạnh mẽ. Tôi tin rằng đây là những xu hướng rất quan trọng trong sự phát triển của AI vào tương lai", nhà sáng lập Moonshot AI cho biết thêm.

Theo Roey Tzezana, các kỹ thuật chuỗi suy nghĩ như vậy, khi được thực hiện đúng cách, có thể tạo ra kết quả tốt mà không cần phải tăng đáng kể sức mạnh tính toán. Điều đó có thể hữu ích cho các công ty Trung Quốc không thể tiếp cận chip AI tiên tiến trong bối cảnh đối diện hạn chế xuất khẩu từ Mỹ.

"Nó sẽ giảm bớt một số khó khăn mà tình trạng thiếu sức mạnh tính toán sẽ gây ra cho Trung Quốc. Vì vậy, sẽ rất thú vị khi xem liệu sự thiếu hụt sức mạnh tính toán ở Trung Quốc có dẫn đến sự đổi mới tốt hơn trong lĩnh vực này hay không”, Roey Tzezana nói.

chuyen-gia-trung-quoc-cham-hon-my-1-nam-ve-mo-hinh-ngon-ngu-lon-khoang-cach-nay-la-dang-ke.jpg — Khi nói đến mô hình ngôn ngữ lớn tạo văn bản, Trung Quốc chậm hơn Mỹ khoảng 1 năm, Roey Tzezana cho biết - Ảnh: Shutterstock Images

Trong bài đăng trên blog, OpenAI cho biết o1 đạt điểm 83% trong kỳ thi vòng loại Olympic Toán học Quốc tế, so với 13% của mô hình AI trước đó là GPT-4o.

Công ty cho biết o1 cải thiện hiệu suất với các câu hỏi lập trình cạnh tranh và vượt qua độ chính xác ở cấp độ tiến sĩ của con người trên thước đo những vấn đề khoa học.

"Trong các bài kiểm tra của chúng tôi, o1 đạt kết quả tương đương với những nghiên cứu sinh tiến sĩ khi giải quyết các bài toán thách thức trong vật lý, hóa học và sinh học. Chúng tôi cũng nhận thấy rằng nó vượt trội trong toán học và lập trình. Ở kỳ thi vòng loại Olympic Toán học Quốc tế, GPT-4o chỉ giải đúng 13% các bài toán, còn mô hình lý luận đạt 83%. Khả năng lập trình của o1 cũng được đánh giá trong các cuộc thi và đạt đến mức 89% ở những cuộc thi Codeforces", OpenAI viết trên blog.

Noam Brown, nhà nghiên cứu tập trung vào việc cải thiện khả năng lý luận trong các mô hình AI của OpenAI, tiết lộ o1 đạt được kết quả đó bằng cách sử dụng kỹ thuật “lý luận theo chuỗi tư duy”, gồm việc chia vấn đề phức tạp thành những bước logic nhỏ hơn.

Codeforces là nền tảng trực tuyến nổi tiếng, được thiết kế đặc biệt cho các lập trình viên muốn rèn luyện và nâng cao kỹ năng giải quyết vấn đề thông qua việc tham gia các cuộc thi lập trình. Codeforces cung cấp môi trường cạnh tranh lành mạnh, nơi các lập trình viên từ khắp nơi trên thế giới có thể so tài và học hỏi lẫn nhau.

Các nhà nghiên cứu lưu ý rằng hiệu suất của mô hình ngôn ngữ lớn trên những vấn đề phức tạp có xu hướng cải thiện khi phương pháp này được sử dụng như kỹ thuật nhắc nhở. OpenAI hiện đã tự động hóa khả năng này để các mô hình ngôn ngữ lớn có thể tự chia nhỏ các vấn đề mà không cần người dùng nhắc nhở.

"Chúng tôi đã đào tạo các mô hình này để dành nhiều thời gian hơn suy nghĩ về các vấn đề trước khi trả lời, giống một con người. Thông qua quá trình đào tạo, chúng học cách tinh chỉnh quá trình suy nghĩ của mình, thử các chiến lược khác nhau và nhận ra lỗi lầm", OpenAI cho hay.

Tiến bộ hơn về mô hình chuyển văn bản thành video AI

Các chuyên gia cho rằng dù tụt hậu trong mô hình văn bản, Trung Quốc dường như phát triển hơn ở lĩnh vực khác của AI tạo sinh.

Theo Li Dahai, xét về các mô hình AI biên, thực hiện các tác vụ tạo sinh cục bộ trên thiết bị của người dùng thay vì trên đám mây giống ChatGPT, không có khoảng cách đáng kể nào giữa Trung Quốc và Mỹ.

Roey Tzezana cho rằng chuyển văn bản thành video AI có vẻ là một lĩnh vực mà các công ty Trung Quốc đang tiến bộ nhanh chóng và đang dẫn đầu.

Trong vài tháng qua, các hãng công nghệ lớn và công ty khởi nghiệp Trung Quốc đã chạy đua để công bố công cụ chuyển văn bản thành video AI của họ sau khi OpenAI trình làng mô hình Sora hồi tháng 2. OpenAI hiện vẫn chưa phát hành Sora ra công chúng.

“Họ đã khiến OpenAI cảm thấy hơi xấu hổ vì hứa hẹn với chúng ta về Sora từ rất lâu rồi mà vẫn chưa thực hiện lời hứa của mình”, Roey Tzezana phát biểu.

Được thành lập năm ngoái, Moonshot AI gần đây trở thành kỳ lân có giá trị cao nhất trong số các công ty khởi nghiệp AI đang phát triển mạnh mẽ ở Trung Quốc đại lục. Đó là nhóm 4 công ty khởi được gọi là “những con hổ AI mới của Trung Quốc”, có cả Minimax, Baichuan và Zhipu AI.

Ban đầu được hỗ trợ bởi gã khổng lồ thương mại điện tử Alibaba (Trung Quốc), Moonshot AI gần đây nhận khoản đầu tư từ Tencent, nâng định giá từ 3 tỉ USD lên 3,3 tỉ USD.

Chatbot Kimi của Moonshot AI được xây dựng trên mô hình ngôn ngữ lớn Kimi do công ty tự phát triển, nhanh chóng trở nên phổ biến tại Trung Quốc đại lục sau khi ra mắt vào tháng 10.2023, vì có khả năng xử lý các truy vấn văn bản cực dài lên tới 2 triệu ký tự Trung Quốc.

Giữa cuộc cạnh tranh khốc liệt với những công ty khởi nghiệp khác và hãng công nghệ lớn ở Trung Quốc để đưa sản phẩm AI tạo sinh ra thị trường, Moonshot AI hồi tháng 8 đã tham gia cuộc chiến giá mô hình ngôn ngữ lớn, giảm 1/2 giá một tính năng mới trên Kimi.

Tính năng này là bộ nhớ đệm ngữ cảnh, cho phép các nhà phát triển mô hình ngôn ngữ lớn lưu trữ thông tin trong một thời gian nhất định. Thông tin này có thể được yêu cầu thường xuyên để mô hình ngôn ngữ lớn của họ phản hồi nhanh hơn với các truy vấn tương tự.

Bài liên quan

Microsoft: Hacker từ Trung Quốc, Nga và Iran sử dụng các mô hình ngôn ngữ lớn của OpenAI

Theo một báo cáo được Microsoft công bố hôm 14.2, hacker từ Nga, Trung Quốc và Iran đã sử dụng các công cụ trí tuệ nhân tạo (AI) do OpenAI cung cấp để trau dồi kỹ năng và đánh lừa mục tiêu của chúng.

Đọc tiếp

Mô hình ngôn ngữ lớn Baidu và Zhipu AI đứng đầu Trung Quốc, nhưng kém OpenAI về khả năng tổng thể

CEO Baidu: Có quá nhiều mô hình ngôn ngữ lớn nhưng lại thiếu ứng dụng AI ở Trung Quốc

‘Cha đỡ đầu AI’: o1 của OpenAI lừa dối giỏi hơn, cần kiểm tra tính an toàn nghiêm ngặt

(0) Bình luận

Xếp theo:

Đọc thêm Nhịp đập khoa học

Nổi bật Một thế giới

Cần có một cuộc cách mạng thực sự về khoa học - công nghệ

6 giờ trước Khoa học - công nghệ

TSKH Nghiêm Vũ Khải - nguyên Phó chủ tịch Liên hiệp Các hội khoa học và kỹ thuật Việt Nam cho rằng nếu không có một cuộc cách mạng thực sự về khoa học - công nghệ thì sẽ không thể vượt qua tình trạng tụt hậu.

Những tính năng AI mới và được cải tiến sẽ có trên dòng Galaxy S25

Chưa đầy một tuần nữa, Samsung sẽ giới thiệu dòng Galaxy S25 tại sự kiện Unpacked 2025 (diễn...
Ông Trump công bố memecoin: Sự kết hợp giữa chính trị, tiền điện tử và sự hài hước?

Chỉ vài ngày trước lễ nhậm chức, Tổng thống Donald Trump đã khiến cộng đồng mạng dậy sóng với...
Vai trò của công nghệ trong phòng chống cháy rừng tại Los Angeles

Nhờ một loạt công nghệ, cháy rừng được dự báo và phát hiện kịp thời, qua đó giảm thiểu thiệt...

Đừng bỏ lỡ

Hàng không tăng thêm 586 chuyến bay dịp cao điểm tết

34 phút trước Thị trường và chính sách

Các hãng hàng không Việt Nam tiếp tục tăng thêm 586 chuyến bay trong thời kỳ cao điểm Tết Nguyên đán 2025, từ ngày 17.1 đến 12.2.2025.
Quán quân Giọng hát hay Hà Nội Bùi Huyền Trang ra mắt MV về Hà Nội

1 giờ trước Văn hóa

Bùi Huyền Trang - nữ ca sĩ trẻ vừa đoạt giải quán quân cuộc thi Giọng hát hay Hà Nội 2024 đã cho ra mắt khán giả MV đầu tay trong sự nghiệp ca hát của mình, với tên gọi đầy thân thương: Cô gái Hà Nội.
Cựu Bí thư Tỉnh ủy Thanh Hóa Trịnh Văn Chiến lĩnh 30 tháng tù treo

1 giờ trước Theo dòng thời sự

HĐXX TAND tỉnh Thanh Hóa tuyên phạt cựu Bí thư Trịnh Văn Chiến 30 tháng tù, nhưng cho hưởng án treo.
Hòa bình tại Ukraine: Ông Trump đối mặt với sự quyết liệt từ Moscow và Kyiv

2 giờ trước Góc nhìn

Tổng thống đắc cử Donald Trump đã hứa hẹn sẽ nhanh chóng chấm dứt cuộc chiến kéo dài ba năm ở Ukraine, thậm chí khẳng định có thể giải quyết vấn đề trong vòng 24 giờ.
Khởi tố 7 bị can tại Tập đoàn Thiên Minh Đức

2 giờ trước Sự kiện

Bộ Công an vừa thông tin về vụ án vi phạm xảy ra tại Công ty Cổ phần Tập đoàn Thiên Minh Đức.

Mới nhất

Những tính năng AI mới và được cải tiến sẽ có trên dòng Galaxy S25

39 phút trước Thế giới số

Chưa đầy một tuần nữa, Samsung sẽ giới thiệu dòng Galaxy S25 tại sự kiện Unpacked 2025 (diễn ra lúc 1 giờ sáng ngày 23.1 giờ Việt Nam). Những chiếc smartphone Samsung cao cấp sắp ra mắt sẽ có phần cứng tốt hơn và tập trung vào các tính năng Galaxy AI mới.
Vai trò của công nghệ trong phòng chống cháy rừng tại Los Angeles

2 giờ trước Khoa học - công nghệ

Nhờ một loạt công nghệ, cháy rừng được dự báo và phát hiện kịp thời, qua đó giảm thiểu thiệt hại mà thảm họa này gây ra.
Ông Trump công bố memecoin: Sự kết hợp giữa chính trị, tiền điện tử và sự hài hước?

3 giờ trước Khoa học - công nghệ

Chỉ vài ngày trước lễ nhậm chức, Tổng thống Donald Trump đã khiến cộng đồng mạng dậy sóng với memecoin mang tên chính ông.
TikTok ngừng hoạt động từ 19.1 nếu không có chỉ thị mới cho Apple-Google, ông Trump sắp ra quyết định quan trọng

6 giờ trước Thế giới số

TikTok tuyên bố sẽ ngừng hoạt động tại Mỹ vào ngày 19.1 tới trừ khi chính quyền của Tổng thống Joe Biden sắp mãn nhiệm đảm bảo rằng các công ty như Apple và Google sẽ không bị phạt hoặc chịu hậu quả pháp lý vì tiếp tục hỗ trợ ứng dụng này khi có lệnh cấm.
Lịch thời gian chạy tàu metro số 1 tuyến Bến Thành - Suối Tiên dịp Tết Nguyên đán

6 giờ trước Kinh tế - đầu tư - dự án

Dự báo dịp Tết Nguyên đán sắp tới, thời tiết tại TP.HCM sẽ thuận lợi cho người dân đi lại bằng metro.