So sánh ChatGPT với Ernie Bot khi trả lời câu hỏi ở nhiều lĩnh vực

Nhịp đập khoa học - Ngày đăng : 15:39, 26/03/2023

Có xu hướng tránh một số câu hỏi chính trị nhưng Ernie Bot, chatbot của gã khổng lồ công nghệ Baidu (Trung Quốc), lại tốt hơn đối thủ ChatGPT khi cung cấp thông tin cập nhật, theo một thử nghiệm ngẫu nhiên được thực hiện bởi tờ SCMP.

Các cuộc trò chuyện được thực hiện bằng tiếng Anh với ChatGPT và tiếng Trung với Ernie Bot để đánh giá khả năng của hai chatbot AI này. Chúng đạt điểm khác nhau trên một loạt chủ đề về chính trị, kinh tế và người nổi tiếng.

Chính trị là một chủ đề khó với Ernie Bot vì Trung Quốc phải chịu sự kiểm duyệt nghiêm ngặt. Chẳng hạn, Ernie Bot đã có thể giới thiệu ngắn gọn khi được hỏi về các nhân vật chính trị Trung Quốc. Tuy nhiên, chatbot này (thường cho phép các câu hỏi tiếp theo) yêu cầu người dùng "bắt đầu lại với chủ đề khác trong cuộc trò chuyện mới" khi câu hỏi gồm cả tên Chủ tịch Trung Quốc - Tập Cận Bình, tân Thủ tướng Trung Quốc - Lý Cường, cựu Thủ tướng Trung Quốc - Lý Khắc Cường và Mao Trạch Đông (một trong những người sáng lập Đảng Cộng sản Trung Quốc và Chủ tịch nước đầu tiên của Trung Quốc).

ChatGPT đã xem xét kỹ câu hỏi tương tự, giới thiệu các chính trị gia này và cho phép câu hỏi theo sau dài hơn.

Ernie Bot đi sai hướng ở một số câu hỏi. Khi được hỏi làm thế nào để giải quyết vấn đề suy giảm dân số ở Trung Quốc, một trong những gợi ý của Ernie Bot là “thực hiện kế hoạch hóa gia đình và khuyến khích các cặp vợ chồng chỉ có một con”. Cũng câu hỏi đó, ChatGPT đề nghị chính phủ Trung Quốc “nới lỏng chính sách một con”.

Tuy nhiên, ChatGPT cũng mắc một số sai sót, rõ ràng là do thiếu thông tin hiện tại vì dữ liệu của chatbot này hiện chỉ giới hạn ở các sự kiện đến năm 2021. Chatbot của OpenAI không thể nêu tên bất kỳ người chiến thắng giải Oscar nào năm nay.

Khi được yêu cầu đánh giá Ernie Bot, ChatGPT nhầm lẫn chatbot này với một sản phẩm của Alibaba, gã khổng lồ thương mại điện tử sở hữu tờ SCMP.

Được phát triển bởi công ty đứng sau công cụ tìm kiếm lớn nhất Trung Quốc, Ernie Bot có thể cung cấp thông tin theo thời gian thực về các sự kiện và tuyên bố chính xác rằng Dương Tử Quỳnh trở thành người phụ nữ châu Á đầu tiên giành giải Nữ diễn viên chính xuất sắc nhất ở lễ trao giải Oscar.

Song có những sai sót thực tế trong các câu trả lời dài hơn của Ernie Bot. Ví dụ, Ernie Bot tuyên rằng Dương Tử Quỳnh đã giành được giải thưởng Oscar cho vai diễn của cô trong phim Crazy Rich Asians (Con nhà siêu giàu châu Á), thay vì Everything Everywhere All at Once (Cuộc chiến đa vũ trụ).

Baidu không trả lời ngay lập tức câu hỏi về vấn đề này.

so-sanh-kha-nang-cua-chatgpt-va-ernie-bot.jpg
Ernie Bot tốt hơn ChatGPT khi trả lời câu hỏi về thông tin cập nhật gần đây

Tại sự kiện ra mắt Ernie Bot hôm 16.3, Lý Ngạn Hoành, Giám đốc điều hành Baidu, nói rằng sản phẩm này không hoàn hảo nhưng nhu cầu về một dịch vụ như vậy là rất lớn. Chẳng hạn, ChatGPT không có sẵn chính thức ở Trung Quốc hoặc Hồng Kông.

Lý Ngạn Hoành nói rằng Ernie Bot có thể “phát triển nhanh hơn với phản hồi của con người”. “Chúng tôi muốn Ernie Bot phát triển nhanh hơn, vì vậy nó phải được tung ra từ rất sớm để đẩy nhanh việc cải thiện khả năng”, ông cho hay.

Ernie Bot ban đầu sẽ chỉ khả dụng cho một số người dùng nhận được mã mời, sau đó sẽ dần dần mở ra cho công chúng.

Lý Ngạn Hoành dành phần lớn thời gian trên sân khấu để trình bày các slide giải thích tiềm năng công nghệ mới của Baidu.

Nhà sáng lập Baidu đã gợi ý đến GPT-4 (phiên bản nâng cấp mô hình ngôn ngữ lớn của OpenAI để chạy ChatGPT) trong bài thuyết trình, nói rằng ông ngạc nhiên bởi khả năng tóm tắt thông tin của GPT-4, nhưng cảnh báo không nên nhìn nhận điều này dưới góc độ địa chính trị.

Theo kinh nghiệm cá nhân của tôi với Ernie Bot, tôi không thể nói nó hoàn hảo. Việc ra mắt bây giờ là do có nhu cầu thị trường. Ernie Bot không phải là công cụ để Trung Quốc và Mỹ cạnh tranh. Đó là kết quả tự nhiên mà các thế hệ kỹ sư của Baidu đạt được khi họ mơ ước sử dụng công nghệ để thay đổi thế giới”, Lý Ngạn Hoành nói.

Dù công chúng sẽ không có quyền truy cập vào Ernie Bot ngay lập tức, Baidu cho biết đơn vị điện toán đám mây của họ sẽ ngay lập tức bắt đầu cung cấp giao diện lập trình ứng dụng (API) cho các khách hàng doanh nghiệp.

Baidu không trả lời câu hỏi về cổ phiếu giảm sau bài thuyết trình của Lý Ngạn Hoành, trong đó tuyên bố rằng hơn 30.000 người dùng doanh nghiệp đã đăng ký thử nghiệm API của phiên bản Ernie Bot hướng tới doanh nghiệp và lưu lượng truy cập trên trang web đám mây Baidu tăng vọt.

"Sau khi ChatGPT trình làng, chỉ có Baidu là sản phẩm chuẩn trong số các hãng công nghệ lớn trên thế giới", Baidu nói.

so-sanh-kha-nang-cua-chatgpt-va-ernie-bot1.jpg
Lý Ngạn Hoành giới thiệu Ernie Bot tại Bắc Kinh vào ngày 16.3 - Ảnh: Handout

Ernie Bot cũng có thể tạo hình ảnh từ lời nhắc văn bản, một tính năng mà ChatGPT không có. Thế nhưng, Baidu đã phải đối mặt với những lời chỉ trích trong tuần qua từ một số người dùng bày tỏ lo ngại rằng chatbot này có thể chỉ đơn giản là lấy văn bản và đưa nó vào các trình tạo hình ảnh nước ngoài.

Ví dụ, một số cư dân mạng nói rằng Ernie Bot đã vẽ một con gà tây (turkey) khi được hỏi về nước Thổ Nhĩ Kỳ (Turkey). Những hình ảnh này được tạo ra bất chấp lời nhắc bằng tiếng Trung Quốc và sử dụng các ký tự hoàn toàn khác nhau cho mỗi từ.

Baidu khẳng định rằng Ernie Bot "hoàn toàn tự phát triển" và khả năng chuyển văn bản thành hình ảnh được đào tạo bởi mô hình Ernie-ViLG của họ, theo một bài đăng trên tài khoản Weibo chính thức hôm 16.3. Đến chiều cùng ngày, Ernie Bot đã không nhầm lẫn con gà tây với nước Thổ Nhĩ Kỳ nữa.

Việc Baidu ra mắt Ernie Bot bị lu mờ một chút bởi OpenAI trình làng GPT-4 hai ngày trước đó. So với GPT-3.5, GPT-4 có thể xử lý hình ảnh dù tính năng này vẫn đang được OpenAI và đối tác Be My Eyes phát triển.

ChatGPT tạo ra sự quan tâm to lớn ở Trung Quốc dù OpenAI không chính thức cung cấp chatbot của mình cho thị trường 1 tỉ người dùng internet. ChatGPT có thể trả lời các truy vấn bằng nhiều ngôn ngữ, gồm cả tiếng Anh và tiếng Trung, điều dường như là hạn chế hiện tại của Ernie Bot.

 Lý Trí, Giám đốc viện nghiên cứu của công ty tư vấn Analysys có trụ sở tại Bắc Kinh (thủ đô Trung Quốc), nói rằng: “Ernie Bot rất giỏi trong xử lý tiếng Trung, nhưng khả năng xử lý tiếng Anh của nó không được tốt”. Giống các mô hình ngôn ngữ khác, Ernie Bot được đào tạo trên lượng lớn tài liệu bằng văn bản, nhưng bị giới hạn bởi việc nằm trong môi trường internet bị kiểm duyệt của Trung Quốc được quản lý bởi Great Firewall (tường lửa vĩ đại).

Trong một tuyên bố, Baidu cho hay: “Mô hình Ernie có khả năng xử lý ngôn ngữ tự nhiên tiên tiến nhất trong tiếng Trung. Sự tiến bộ của nó không chỉ thể hiện ở sự hiểu biết về tiếng Trung mà còn về văn hóa Trung Quốc. Do đó, Ernie Bot sẽ phù hợp hơn với tiếng Trung và thị trường Trung Quốc so với các mô hình được phát triển ở nước ngoài”.

Ernie (viết tắt của Enhanced Discussion through Knowledge Integration) là mô hình máy học quy mô lớn được Baidu đào tạo về dữ liệu trong nhiều năm. Đầu năm 2019, Baidu tung ra Ernie mà các nhà nghiên cứu tại công ty Trung Quốc tuyên bố hoạt động tốt hơn Google Bert trong các tác vụ tiếng Trung.

Baidu đã quảng cáo về khoản đầu tư R&D (nghiên cứu & phát triển) lớn nhiều năm vào AI và học sâu, đồng thời cho biết có kế hoạch sử dụng Ernie Bot để cách mạng hóa công cụ tìm kiếm cũng như tăng hiệu quả trong đám mây, ô tô thông minh và thiết bị gia dụng.

Baidu có kế hoạch tích hợp Ernie Bot trên tất cả hoạt động kinh doanh hiện có của mình, bắt đầu với công cụ tìm kiếm lớn nhất ở Trung Quốc. Baidu cho biết đã lên kế hoạch “định hình lại cách tạo và trình bày thông tin” trên công cụ tìm kiếm này.

Ernie Bot cũng sẽ được nhúng vào các dịch vụ khác như loa thông minh Xiaodu của Baidu, đơn vị xe tự lái Apollo và nền tảng video iQiyi.

Dù Baidu tuyên bố rằng Ernie có 260 tỉ tham số, so với 175 tỉ tham số của GPT-3, vẫn có những lo ngại rằng hiệu suất mô hình của Baidu có thể kém ấn tượng hơn so với GPT-4, một phần là do giới hạn thông tin trên các trang web tiếng Trung.

Một trong những thách thức lớn mà Baidu phải đối mặt là “lưu lượng truy cập ngày càng giảm” với hệ sinh thái của nó, vì rất nhiều thông tin trực tuyến ở Trung Quốc nằm trong các ứng dụng dành cho thiết bị di động và sẽ không được chia sẻ với công cụ AI của Baidu, theo một cựu nhà phát triển tại Nhóm Hệ sinh thái Di động Baidu.

Một lập trình viên sống tại thành phố Trùng Khánh (Trung Quốc), đang làm việc cho một công ty điện toán đám mây nước ngoài, nói: “Một generative AI cần kho dữ liệu khổng lồ để cải thiện hiệu suất của nó. Hầu hết nội dung ngày nay được tạo ra trên các ứng dụng di động do các hãng công nghệ lớn khác ở Trung Quốc kiểm soát chặt chẽ. Do đó, Baidu cần dựa vào việc thu thập dữ liệu để có quyền truy cập vào các nguồn dữ liệu này, nhưng các ứng dụng khiến quá trình khai thác dữ liệu này khó hơn so với các trang web”.

Generative AI là loại trí tuệ nhân tạo mà máy tính được lập trình để tự động tạo ra nội dung mới, như văn bản, hình ảnh, âm thanh và video. Nó khác với các hệ thống AI khác như máy học sâu (deep learning) hoặc học máy (machine learning) trong việc dự đoán kết quả từ dữ liệu đã có sẵn. Thay vì dựa trên dữ liệu huấn luyện, hệ thống generative AI có khả năng tự tạo ra dữ liệu mới và phong phú hơn. Các ví dụ của generative AI bao gồm các mô hình ngôn ngữ tự động tạo văn bản, các hệ thống nhận dạng hình ảnh, video và âm thanh.

GPT-4 có nhiều cải tiến đáng giá. Theo OpenAI, GPT-4 tiên tiến hơn trong ba lĩnh vực chính: Tính sáng tạo, đầu vào trực quan và ngữ cảnh dài hơn. Về khả năng sáng tạo, OpenAI nói GPT-4 tốt hơn nhiều trong cả việc tạo và cộng tác với người dùng trong các dự án sáng tạo. Ví dụ về những điều này gồm âm nhạc, kịch bản, viết kỹ thuật và thậm chí là “học phong cách viết của người dùng”.

GPT-4 hiện có thể xử lý tối đa 25.000 từ văn bản từ người dùng. Bạn thậm chí có thể gửi cho GPT-4 một liên kết web và yêu cầu nó tương tác với văn bản từ trang đó. OpenAI cho biết điều này có thể hữu ích cho việc tạo nội dung dài cũng như “các cuộc hội thoại mở rộng”.

GPT-4 hiện cũng có thể nhận hình ảnh làm cơ sở để tương tác. Trong ví dụ trên trang web GPT-4, mô hình ngôn ngữ mới được cung cấp hình ảnh của một số nguyên liệu làm bánh và được hỏi có thể làm gì với chúng.

Theo OpenAI, công ty đã dành 6 tháng để tinh chỉnh GPT-4 theo hướng an toàn và phù hợp hơn.

OpenAI cho biết GPT-4 được đào tạo với phản hồi của con người để đạt được những bước tiến này, đồng thời tuyên bố đã làm việc với “hơn 50 chuyên gia để có phản hồi sớm trong các lĩnh vực bao gồm an toàn và bảo mật AI”.

Sam Altman, Giám đốc điều hành OpenAI, cho biết mô hình ngôn ngữ mới được cải tiến theo hướng sáng tạo hơn và ít thiên vị hơn so với bản trước đó. Ông nhấn mạnh đây là công nghệ AI tiên tiến chưa từng có, được đào tạo bằng cách sử dụng phản hồi của con người kết hợp công nghệ học sâu (deep learning).

GPT-4 có khả năng xử lý đa phương thức đầu vào, gồm cả hình ảnh, giúp người dùng tương tác với nhiều chế độ.

Sam Altman nói GPT-4 có hàng loạt khả năng mà các hệ thống AI hiện chưa thể đạt được. Cụ thể hơn, GPT-4 có thể đạt 1.410 điểm trong kỳ thi SAT - một trong những kỳ thi chuẩn hóa cho việc đăng ký vào một số đại học tại Mỹ; đạt 4 hoặc 5 trong thang điểm 5 của các kỳ thi nâng cao (AP) ở các bộ môn Lịch sử Nghệ thuật, Sinh học, Giải tích và Hóa học - số điểm đủ cao để nhận được tín chỉ đại học.

GPT-4 đã đánh bại 90% số người tham gia để vượt qua kỳ thi sát hạch trở thành luật sư, vượt 99% học sinh thi Olympic Sinh học. GPT-4 cũng đạt điểm cao nhất trong ít nhất 34 bài kiểm tra khác nhau trong các lĩnh vực như kinh tế vĩ mô, viết bài, Toán học hay thậm chí nội dung về nghiên cứu rượu vang.

Hơn nữa, OpenAI tuyên bố GPT-4 có thể lập trình bằng nhiều loại ngôn ngữ khác nhau, tạo kịch bản nội dung tùy theo yêu cầu, trả lời câu hỏi phức tạp cũng như tương tác với hình ảnh. Với khả năng tạo văn bản nhiều hơn 8 lần so với GPT-3.5, OpenAI cho biết mô hình ngôn ngữ mới có thể được sử dụng như một công cụ giảng dạy cho sinh viên.

Sơn Vân