Kỹ sư hé lộ Google đào tạo Bard bằng các phản hồi của ChatGPT rồi nghỉ việc, làm cho OpenAI

Các cuộc chiến AI đang diễn ra khốc liệt với việc Google tham gia bữa tiệc hơi muộn. Bard bị cáo buộc sử dụng các phản hồi của ChatGPT được chia sẻ trực tuyến làm dữ liệu đào tạo, nhưng Google bác bỏ điều này.

Google Bard là mô hình ngôn ngữ lớn có thể tạo nội dung dựa trên lời nhắc. Điều này có thể bao gồm giải thích các chủ đề, trả lời câu hỏi hoặc tạo các đoạn văn bản dựa trên yêu cầu đơn giản của người dùng. Bard hoạt động rất giống ChatGPT, generative AI đã gây bão trên toàn thế giới vào năm ngoái và công nghệ của nó cũng đang cung cấp sức mạnh cho Bing chatbot.

Generative AI là loại trí tuệ nhân tạo mà máy tính được lập trình để tự động tạo ra nội dung mới, như văn bản, hình ảnh, âm thanh và video. Nó khác với các hệ thống AI khác như máy học sâu (deep learning) hoặc học máy (machine learning) trong việc dự đoán kết quả từ dữ liệu đã có sẵn. Thay vì dựa trên dữ liệu huấn luyện, hệ thống generative AI có khả năng tự tạo ra dữ liệu mới và phong phú hơn. Các ví dụ của generative AI bao gồm các mô hình ngôn ngữ tự động tạo văn bản, các hệ thống nhận dạng hình ảnh, video và âm thanh.

Trong tuần đầu tiên ra mắt công chúng, Bard đã hoạt động khá giống ChatGPT, nghĩa là thiếu sót về nhiều mặt. Bard thường hiểu sai các chi tiết thực tế, đôi khi bị "ảo giác" và tạo ra những câu trả lời vô nghĩa, đồng thời không trích dẫn nguồn tham khảo theo bất kỳ cách nào.

Tuy nhiên, một vấn đề lớn hơn đằng sau hậu trường có thể là cách Bard được đào tạo. Theo trang The Information, Jacob Devlin, cựu kỹ sư AI của Google, không đồng tình với việc Google sử dụng dữ liệu từ ChatGPT để đào tạo Bard.

Jacob Devlin chia sẻ những lo ngại của mình với Giám đốc điều hành Google - Sundar Pichai và Jeff Dean – Giám đốc Google AI và các quản lý cấp cao khác rằng đội Bard, được hỗ trợ bởi các nhân viên Brain, đang huấn luyện mô hình học máy của mình bằng dữ liệu từ ChatGPT.

Cụ thể hơn, Jacob Devlin tin rằng đội Bard đang phụ thuộc rất nhiều vào các phản hồi từ ChatGPT được công khai trên trang web ShareGPT. Đây là nơi người dùng thường chia sẻ các phản hồi mà họ nhận được từ chatbot của OpenAI. Jacob Devlin cũng cảm thấy rằng việc đào tạo như vậy có thể khiến phản hồi của Bard giống với ChatGPT hơn.

Sau khi chia sẻ mối lo ngại của mình, Jacob Devlin đã từ chức và chuyển sang làm việc cho OpenAI. Trang The Information cho biết Google cũng ngừng sử dụng dữ liệu đó để đào tạo Bard.

Theo The Information, các nhân viên Google khác biết về tình huống này dường như cảm thấy rằng việc sử dụng dữ liệu như vậy đã vi phạm điều khoản dịch vụ của OpenAI. Điều khoản này cấm sử dụng đầu ra của ChatGPT “để phát triển các mô hình cạnh tranh với OpenAI”.

Sau khi thông tin đó xuất hiện, Google đưa ra một tuyên bố ngắn gọn với trang The Verge rằng Bard không được đào tạo với dữ liệu có nguồn gốc từ ChatGPT.

Tuyên bố của Google dường như không loại trừ chắc chắn rằng dữ liệu từ ChatGPT từng được sử dụng để đào tạo Bard hay chưa, nhưng có vẻ như điều đó ít nhất không còn đúng nữa.

Theo The Information, đội Brain của Google và DeepMind, công ty thuộc Alphabet (chủ sở hữu Google) đang hợp tác để cạnh tranh tốt hơn với OpenAI. The Information cho biết dự án của họ mang tên Gemini và là nỗ lực nhằm “cố gắng bắt kịp các khả năng của GPT-4 của OpenAI”. Điều này sẽ bao gồm việc đạt được 1.000 tỉ tham số (cách đo các tính toán trong một mô hình học máy) giống GPT-4.

ku-su-he-lo-google-dung-phan-hoi-tu-chatgpt-de-dao-tao-bard.jpg — Kỹ sư Jeff Dean báo cáo với lãnh đạo Google rằng Bard được đào tạo bằng dữ liệu phản hồi từ ChatGPT rồi nghỉ việc, đầu quân cho OpenAI

Google bắt đầu triển khai Bard cho một số người dùng hôm 21.3 và chatbot AI này nhanh chóng gặp vấn đề trong câu trả lời. Chuyên gia AI Kate Crawford đã đăng một cuộc trao đổi với Bard, trong đó cô hỏi tập dữ liệu đào tạo chatbot AI này đến từ đâu.

Trong ảnh chụp màn hình cuộc trò chuyện, Bard trả lời rằng tập dữ liệu của nó "được thu thập từ nhiều nguồn khác nhau", trong đó có "dữ liệu nội bộ của Google", gồm cả Gmail.

"Có ai lo ngại về việc Bard nói rằng tập dữ liệu đào tạo nó gồm cả Gmail không? Tôi cho rằng điều đó hoàn toàn sai, nếu không thì Google đang vượt qua một số ranh giới pháp lý nghiêm trọng", Kate Crawford viết.

Vài giờ sau đó, Google đã cố gắng làm rõ thông tin. Công ty đề cập trong một tweet rằng: "Bard là một thử nghiệm sớm dựa trên các mô hình ngôn ngữ lớn và sẽ phạm sai lầm. Nó không được huấn luyện trên dữ liệu của Gmail".

Trong bình luận khác đã bị xóa sau đó, Google cho biết: "Không có dữ liệu riêng tư nào sẽ được sử dụng trong quá trình huấn luyện Bard".

Trong phản hồi với Kate Crawford, Bard cho biết nó cũng được đào tạo bằng cách sử dụng "bộ dữ liệu văn bản và mã từ web, chẳng hạn Wikipedia, GitHub và Stack Overflow", cũng như dữ liệu từ các công ty "hợp tác với Google để cung cấp dữ liệu cho quá trình huấn luyện Bard".

Trước đó, Bard cũng khiến Google rơi vào cảnh oái oăm. Trong ảnh chụp màn hình cuộc đối thoại cùng Bard, Jane Manchun Wong (blogger công nghệ ở Hồng Kông) cho thấy chatbot này dường như đồng tình với Bộ Tư pháp Mỹ về vụ kiện chống độc quyền với Google trong lĩnh vực quảng cáo kỹ thuật số.

Đây là vụ kiện mà Bộ Tư pháp Mỹ và một số thẩm phán bang chống lại Google, được đệ trình vào tháng 1. Về cơ bản, đơn kiện này cho rằng Google đã dùng sức mạnh của mình để lấn át các nhà quảng cáo kỹ thuật số và buộc họ phải phụ thuộc vào công ty này.

Sundar Pichai đã yêu cầu các nhân viên cẩn trọng với những lỗi có thể xảy ra khi bắt đầu sử dụng Bard. "Khi nhiều người bắt đầu sử dụng Bard và kiểm tra khả năng của nó, họ sẽ làm chúng tôi ngạc nhiên. Nhiều thứ xảy ra sẽ không như ý muốn", ông Sundar Pichai viết trong email gửi nhân viên hôm 22.3, được trang CNBC đăng tải.

Google hôm 21.3 đã bắt đầu phát hành công khai chatbot Bard với mong muốn thu hút người dùng và nhận được phản hồi để vượt qua Microsoft trong cuộc đua về công nghệ AI.

Bắt đầu từ Mỹ và Vương quốc Anh, người dùng có thể tham gia danh sách chờ để truy cập Bard tiếng Anh tại địa chỉ https://bard.google.com, chương trình trước đây chỉ dành cho những người thử nghiệm được phê duyệt. Google mô tả Bard là thử nghiệm cho phép hợp tác với generative AI.

Khi được hỏi liệu các động lực cạnh tranh có đứng sau sự ra mắt của Bard hay không, Jack Krawczyk, Giám đốc sản phẩm cấp cao Google, cho biết công ty tập trung vào người dùng. Ông nói: “Những người thử nghiệm nội bộ và bên ngoài đã tìm đến Bard vì đã tăng năng suất, thúc đẩy ý tưởng và kích thích sự tò mò của họ”.

Trong buổi trình diễn trang web bard.google.com cho Reuters, Jack Krawczyk đã cho thấy cách Bard tạo ra các khối văn bản trong nháy mắt, khác với cách ChatGPT gõ từng từ để trả lời.

Bard cũng bao gồm tính năng hiển thị ba phiên bản khác nhau hoặc "bản nháp" của bất kỳ câu trả lời cụ thể nào mà người dùng có thể chuyển đổi và hiển thị nút Google it nếu người dùng muốn có kết quả web cho một truy vấn.

Tuy nhiên, độ chính xác vẫn là vấn đề đáng quan ngại. "Bard không phải lúc nào cũng đúng", lời cảnh báo của Google xuất hiện trong cửa sổ pop-up trong bài trình diễn.

Tháng trước, video quảng cáo cho thấy Bard trả lời sai một câu hỏi khiến vốn hóa thị trường Alphabet (công ty mẹ của Google) giảm hơn 100 tỉ USD trong ngày.

Google đã nêu bật một số sai lầm trong bản demo với Reuters, chẳng hạn nói rằng Bard trả lời sai rằng dương xỉ cần ánh sáng mạnh để trả lời một truy vấn.

Bard cũng đưa ra 9 đoạn văn bản khi được hỏi về 4 đoạn trong một câu hỏi khác. Sau câu trả lời đó, Jack Krawczyk nhấp vào nút ngón tay chỉa xuống để đánh giá không tốt.

“Chúng tôi hiểu rõ giới hạn của công nghệ và vì vậy chúng tôi muốn đưa ra một kế hoạch rõ ràng về tốc độ triển khai", ông nói.

Trong một tweet quảng cáo Bard hôm 6.2, Google đã chia sẻ một ảnh động mà chatbot này đang hoạt động. Bard trả lời các câu hỏi của người dùng, gồm cả câu hỏi về kính viễn vọng James Webb. Thế nhưng, một trong những câu trả lời của Bard không chính xác. Cụ thể hơn, Bard tuyên bố rằng James Webb là kính viễn vọng đầu tiên tìm thấy một hành tinh ngoài hệ Mặt trời. Sự thật thì đây là một thành tựu thuộc về ESO (Đài thiên văn phía nam của châu Âu), nơi phát hiện ra hành tinh đó cách nay gần 20 năm bằng kính viễn vọng VLT của mình.

Nhà vật lý thiên văn Grant Tremblay (Mỹ) là người chỉ ra lỗi kiến thức thiên văn của Bard. Theo Grant Tremblay, dù gây ấn tượng nhưng các chatbot AI "thường đưa ra câu trả lời sai một cách rất tự tin".

Đây được xem là một ví dụ điển hình về những sai sót có thể xảy ra với các chatbot dựa trên AI. Cụ thể, chúng có thể đưa ra các thông tin không chính xác nhưng giống như có căn cứ, dẫn đến việc nhiều người sẽ hiểu sai thông tin.

Sau đó, Sundar Pichai yêu cầu tất cả nhân viên Google dành 2 đến 4 giờ giúp thử nghiệm sản phẩm để chatbot này có thể sẵn sàng ra mắt.

"Tôi biết thời điểm này rất thú vị và đó là điều được mong đợi: Công nghệ cơ bản đang phát triển nhanh chóng với rất nhiều tiềm năng. Điều quan trọng nhất chúng tôi có thể làm lúc này là tập trung vào việc xây dựng một sản phẩm tuyệt vời và phát triển nó một cách có trách nhiệm”, Sundar Pichai viết cho nhân viên Google trong một bản ghi nhớ hồi tháng 2.

Google đang chịu áp lực ngày càng tăng trong việc phát hành các sản phẩm generative AI. Dù Google từ lâu đã được coi là tiên phong trong lĩnh vực nghiên cứu AI nhưng một số nhà phê bình cho rằng công ty quá chậm chạp trong việc tung ra các công cụ và dịch vụ của riêng mình để sẵn sàng cho công chúng sử dụng.