GPT-4 Turbo giúp OpenAI nới rộng khoảng cách với các gã khổng lồ công nghệ Trung Quốc
Nhịp đập khoa học - Ngày đăng : 10:35, 09/11/2023
Các cải tiến của GPT-4 Turbo, bản cập nhật nền tảng cho chatbot AI phổ biến ChatGPT, bao gồm bộ nhớ lớn hơn để ghi nhớ tới 300 trang văn bản chỉ trong một lời nhắc, giá rẻ hơn cho nhà phát triển và ngày được đào tạo kiến thức đến tháng 4.2023, theo Sam Altman - Giám đốc điều hành OpenAI.
Xu Liang, một doanh nhân trong lĩnh vực AI tại thành phố Hàng Châu (Trung Quốc), cho rằng GPT-4 Turbo dự kiến sẽ khởi động một loạt hoạt động khác khi các đối thủ Trung Quốc, như Baidu và Alibaba, chạy đua để cố bắt kịp OpenAI.
Xu Liang nói trong một cuộc phỏng vấn với trang SCMP: “Các Big Tech (hãng công nghệ lớn) và công ty khởi nghiệp sẽ cần đầu tư nhiều hơn để theo kịp với sự phát triển của OpenAI. Nếu không thì sản phẩm của họ sẽ tụt quá xa so với GPT-4 Turbo và khiến người dùng thất vọng”.
Theo ông, trong khi một số công ty có thể tăng cường tập trung vào phát triển các mô hình nền tảng độc quyền, những hãng khác quyết định xây dựng các mô hình cụ thể cho ngành công nghiệp với khả năng tùy chỉnh cho những ngành khác nhau.
Lu Yanxia, Giám đốc nghiên cứu của công ty tư vấn CNTT International Data Corp, nói GPT-4 Turbo sẽ “truyền cảm hứng và thúc đẩy” các hãng công nghệ lớn Trung Quốc đầu tư hơn nữa vào các lĩnh vực như xử lý ngôn ngữ tự nhiên, một công nghệ quan trọng giúp các chatbot AI hiểu và xử lý các ngôn ngữ phức tạp của con người.
Kể từ khi OpenAI ra mắt ChatGPT vào tháng 11.2022, các chính phủ đã quảng cáo tiềm năng của generative AI (AI tạo sinh) để biến đổi các ngành công nghiệp truyền thống, đồng thời cảnh báo những nguy hiểm về nó nếu không được quản lý hợp lý. Hiện ChatGPT và Google Bard chưa có sẵn ở Trung Quốc, nên các công ty Trung Quốc đua nhau phát triển các lựa chọn thay thế.
Tại Hội nghị Internet Thế giới (còn được gọi là Hội nghị thượng đỉnh Ô Trấn) diễn ra từ ngày 8 đến 10.11, các hãng như Alibaba (công ty thương mại điện tử lớn nhất Trung Quốc), Baidu (gã khổng lồ công cụ tìm kiếm internet) và iFlyTek (chuyên về AI) sẽ trình diễn những khả năng mới nhất của họ trong lĩnh vực generative AI.
Chủ tịch Trung Quốc - Tập Cận Bình lặp lại lời kêu gọi phát triển AI một cách an toàn trong bài phát biểu qua video mà ông gửi tới sự kiện hôm 8.11, nhắc lại quan điểm của chính phủ rằng dù AI nên được tận dụng để thúc đẩy tăng trưởng kinh tế nhưng phải tránh những hậu quả tiêu cực tiềm ẩn.
ChatGPT, Bard và các chatbot AI nước ngoài khác vẫn bị Trung Quốc chặn do nước này tập trung vào bảo mật internet, song một số cư dân mạng vẫn truy cập được chúng qua mạng riêng ảo (VPN).
Xu Liang cho biết: “Do những hạn chế về internet, việc truy cập ổn định vào mô hình ngôn ngữ lớn mới nhất của OpenAI (GPT-4 Turbo) sẽ tiếp tục là một vấn đề. Do đó, việc triển khai ứng dụng AI cấp doanh nghiệp ở Trung Quốc sẽ phụ thuộc vào mô hình ngôn ngữ lớn nội địa”.
GPT-4 Turbo gồm hai phiên bản, một phiên bản phân tích văn bản chặt chẽ và phiên bản còn lại có tìm hiểu về bối cảnh của văn bản, hình ảnh. Theo OpenAI, hai phiên bản GPT-4 Turbo sẽ được cung cấp cho các nhà phát triển vài tuần tới.
OpenAI cho biết đã tối ưu hóa hiệu suất để có thể cung cấp GPT-4 Turbo với mức giá cho chuỗi ký tự đầu vào và đầu ra lần lượt chỉ bằng 1/3 và 1/2 so với giá GPT-4.
Flo Crivello, người sáng lập công ty khởi nghiệp trợ lý AI Lindy, cho biết: “Đó là một sự bùng nổ lớn với các công ty khởi nghiệp như chúng tôi. Đột nhiên, chi phí của chúng tôi giảm xuống gấp ba lần, một con số rất lớn”.
Nếu như GPT-4 được cập nhật dữ liệu lấy từ các trang web đến tháng 9.2021 thì GPT-4 Turbo lấy dữ liệu cập nhật tới tháng 4.2023. GPT-4 Turbo có thể đưa ra câu trả lời với độ dài tương đương hơn 300 trang văn bản trong một lần nhận yêu cầu.
Cuối tháng 10 vừa qua, Baichuan (Trung Quốc) ra mắt một mô hình ngôn ngữ lớn Baichuan2-192k mà công ty cho biết có thể hấp thụ và tóm tắt tiểu thuyết, cho biết “cửa sổ ngữ cảnh” của nó có thể xử lý khoảng 350.000 ký tự tiếng Trung. Cửa sổ ngữ cảnh là sự kết hợp giữa văn bản đầu vào và đầu ra mà mô hình có thể xử lý trong quá trình hội thoại với người dùng.
Theo Baichuan, Baichuan2-192k trở thành mô hình ngôn ngữ lớn mạnh mẽ nhất thế giới trong việc xử lý các truy vấn văn bản dài.
Baichuan là công ty khởi nghiệp trí tuệ nhân tạo (AI) có trụ sở tại thủ đô Bắc Kinh, được thành lập bởi Wang Xiaochuan - người sáng lập công cụ tìm kiếm Sogou (Trung Quốc).
Để so sánh, Claude 2 trước đó là mô hình ngôn ngữ lớn tiên tiến nhất thế giới xét về số lượng từ mà người dùng có thể đưa vào truy vấn trò chuyện của họ, được cho có cửa sổ ngữ cảnh khoảng 75.000 từ tiếng Anh, tương ứng với hàng trăm trang tài liệu hoặc một cuốn sách. Claude 2 được công ty Anthropic (Mỹ), do Amazon hậu thuẫn, giới thiệu vào tháng 7.
Theo bài đăng trên WeChat của Baichuan, cửa sổ ngữ cảnh của Baichuan2-192k lớn hơn 14 lần so với GPT-4.
Baichuan cũng cho biết Baichuan2-192k vượt qua Claude 2 về chất lượng phản hồi cũng như khả năng hiểu và tóm tắt văn bản dài, trích dẫn kết quả kiểm tra từ LongEval - dự án do Đại học California (Berkeley) và các tổ chức khác ở Mỹ khởi xướng để đánh giá mức độ mô hình ngôn ngữ lớn xử lý các yêu cầu lớn.
Baichuan tuyên bố cửa sổ ngữ cảnh lớn hơn sẽ giúp mô hình AI của công ty trở nên hữu ích cho các doanh nghiệp cần xử lý và tạo văn bản dài hàng ngày, chẳng hạn như ngành pháp lý, truyền thông và tài chính. Baichuan tiết lộ công ty đã bắt đầu thử nghiệm nội bộ Baichuan2-192k với các đối tác công nghiệp.
Tuy nhiên, nghiên cứu chung của các học giả từ Đại học Stanford và Đại học California (Berkeley) cho thấy khả năng xử lý nhiều thông tin hơn không hẳn làm cho một mô hình ngôn ngữ lớn tốt hơn so với các đối thủ khác.
Baichaun phải đối mặt với sự cạnh tranh ngày càng cao từ các đối thủ Trung Quốc đang chạy đua để thu hút người dùng đến với các mô hình và ứng dụng AI của họ.
Hôm 31.10, Alibaba Cloud (bộ phận đám mây của tập đoàn Alibaba) đã công bố bản cập nhật 2.0 cho mô hình Tongyi Qianwen, được đào tạo với hàng trăm tỉ thông số.
Chu Jingren, Giám đốc công nghệ Alibaba Cloud, nói tại sự kiện đối tác thường niên của công ty rằng Tongyi Qianwen 2.0 vượt trội hơn GPT-3.5 của OpenAI và Llama2 của Meta Platforms, đồng thời đã thu hẹp khoảng cách với GPT-4.
Hôm 24.10, iFlytek cho biết mô hình ngôn ngữ lớn Spark 3.0 của họ hiện đã vượt trội so với GPT-3.5 xét về ngữ cảnh tiếng Trung.
Là một trong những hãng công nghệ lớn đầu tiên ở Trung Quốc tung ra giải pháp thay thế ChatGPT, iFlytek ra mắt mô hình ngôn ngữ lớn Spark 3.0 lần đầu tiên vào tháng 5 và phát hành ra công chúng vào tháng 9 sau khi có sự chấp thuận của chính phủ Trung Quốc.
"Spark 3.0 đã vượt trội GPT-3.5 ở các khả năng như tạo văn bản, lý luận logic, toán học và mã hóa, đồng thời sẽ được đặt ngang hàng với GPT-4 vào nửa đầu năm 2024”, Chủ tịch iFlytek - Liu Qingfeng tuyên bố.
Spark 3.0 (phiên bản thứ tư kể từ lần phát hành đầu tiên) cũng đạt điểm gần bằng GPT-3.5 khi thực hiện 48 nhiệm vụ trong ngữ cảnh tiếng Anh, Liu Qingfeng cho biết.
Tuy nhiên, bất chấp những tiến bộ này, Chủ tịch iFlytek nói mô hình ngôn ngữ lớn trong nước vẫn có “khoảng cách thực sự” với GPT-4. Ông hy vọng sẽ thách thức mô hình ngôn ngữ lớn do OpenAI phát triển trong nửa đầu năm 2024.
Trước đó, gã khổng lồ tìm kiếm Baidu tiết lộ Ernie Bot 4, phiên bản cập nhật của sản phẩm giống ChatGPT ra mắt lần đầu tiên vào tháng 3, và cho biết nó mạnh mẽ như GPT-4.