Bard nói được huấn luyện bằng dữ liệu Gmail gây hoang mang, Google phân trần

Google nói rằng điều đó không chính xác và Bard “sẽ phạm sai lầm”.

Google bắt đầu triển khai Bard cho một số người dùng hôm 21.3 và chatbot AI này nhanh chóng gặp vấn đề trong câu trả lời. Chuyên gia AI Kate Crawford đã đăng một cuộc trao đổi với Bard, trong đó cô hỏi tập dữ liệu đào tạo chatbot AI này đến từ đâu.

Trong ảnh chụp màn hình cuộc trò chuyện, Bard trả lời rằng tập dữ liệu của nó "được thu thập từ nhiều nguồn khác nhau", trong đó có "dữ liệu nội bộ của Google", gồm cả Gmail.

"Có ai lo ngại về việc Bard nói rằng tập dữ liệu đào tạo nó gồm cả Gmail không? Tôi cho rằng điều đó hoàn toàn sai, nếu không thì Google đang vượt qua một số ranh giới pháp lý nghiêm trọng", Kate Crawford viết.

Vài giờ sau đó, Google đã cố gắng làm rõ thông tin. Công ty đề cập trong một tweet rằng: "Bard là một thử nghiệm sớm dựa trên các mô hình ngôn ngữ lớn và sẽ phạm sai lầm. Nó không được huấn luyện trên dữ liệu của Gmail".

Trong phản hồi khác đã bị xóa sau đó, Google cho biết: "Không có dữ liệu riêng tư nào sẽ được sử dụng trong quá trình huấn luyện Bard".

Trong phản hồi của Bard với Kate Crawford, chatbot này cho biết nó cũng được đào tạo bằng cách sử dụng "bộ dữ liệu văn bản và mã từ web, chẳng hạn Wikipedia, GitHub và Stack Overflow", cũng như dữ liệu từ các công ty "hợp tác với Google để cung cấp dữ liệu cho quá trình huấn luyện Bard".

Trước đó, Bard cũng khiến Google rơi vào cảnh oái oăm. Trong ảnh chụp màn hình cuộc đối thoại cùng Bard, Jane Manchun Wong (blogger công nghệ ở Hồng Kông) cho thấy chatbot này dường như đồng tình với Bộ Tư pháp Mỹ về vụ kiện chống độc quyền với Google trong lĩnh vực quảng cáo kỹ thuật số.

Đây là vụ kiện mà Bộ Tư pháp Mỹ và một số thẩm phán bang chống lại Google, được đệ trình vào tháng 1. Về cơ bản, đơn kiện này cho rằng Google đã dùng sức mạnh của mình để lấn át các nhà quảng cáo kỹ thuật số và buộc họ phải phụ thuộc vào công ty này.

Sundar Pichai, Giám đốc điều hành Google, đã yêu cầu các nhân viên cẩn trọng với những lỗi có thể xảy ra khi bắt đầu sử dụng Bard. "Khi nhiều người bắt đầu sử dụng Bard và kiểm tra khả năng của nó, họ sẽ làm chúng tôi ngạc nhiên. Nhiều thứ xảy ra sẽ không như ý muốn", ông Sundar Pichai viết trong email gửi nhân viên hôm 22.3, được trang CNBC đăng tải.

Bard trả lời chuyên gia AI rằng được huấn luyện bằng dữ liệu Gmail gây hoang mang - Ảnh: Internet

Google hôm 21.3 đã bắt đầu phát hành công khai chatbot Bard với mong muốn thu hút người dùng và nhận được phản hồi để vượt qua Microsoft trong cuộc đua về công nghệ AI.

Bắt đầu từ Mỹ và Vương quốc Anh, người dùng có thể tham gia danh sách chờ để truy cập Bard tiếng Anh tại địa chỉ https://bard.google.com, chương trình trước đây chỉ dành cho những người thử nghiệm được phê duyệt. Google mô tả Bard là thử nghiệm cho phép hợp tác với generative AI.

Generative AI là loại trí tuệ nhân tạo mà máy tính được lập trình để tự động tạo ra nội dung mới, như văn bản, hình ảnh, âm thanh và video. Nó khác với các hệ thống AI khác như máy học sâu (deep learning) hoặc học máy (machine learning) trong việc dự đoán kết quả từ dữ liệu đã có sẵn. Thay vì dựa trên dữ liệu huấn luyện, hệ thống generative AI có khả năng tự tạo ra dữ liệu mới và phong phú hơn. Các ví dụ của generative AI bao gồm các mô hình ngôn ngữ tự động tạo văn bản, các hệ thống nhận dạng hình ảnh, video và âm thanh.

Khi được hỏi liệu các động lực cạnh tranh có đứng sau sự ra mắt của Bard hay không, Jack Krawczyk, Giám đốc sản phẩm cấp cao Google, cho biết công ty tập trung vào người dùng. Ông nói: “Những người thử nghiệm nội bộ và bên ngoài đã tìm đến Bard vì đã tăng năng suất, thúc đẩy ý tưởng và kích thích sự tò mò của họ”.

Trong buổi trình diễn trang web bard.google.com cho Reuters, Jack Krawczyk đã cho thấy cách Bard tạo ra các khối văn bản trong nháy mắt, khác với cách ChatGPT gõ từng từ để trả lời.

Bard cũng bao gồm tính năng hiển thị ba phiên bản khác nhau hoặc "bản nháp" của bất kỳ câu trả lời cụ thể nào mà người dùng có thể chuyển đổi và hiển thị nút Google it nếu người dùng muốn có kết quả web cho một truy vấn.

Tuy nhiên, độ chính xác vẫn là vấn đề đáng quan ngại. "Bard không phải lúc nào cũng đúng", lời cảnh báo của Google xuất hiện trong cửa sổ pop-up trong bài trình diễn.

Tháng trước, video quảng cáo cho thấy Bard trả lời sai một câu hỏi khiến vốn hóa thị trường Alphabet (công ty mẹ của Google) giảm hơn 100 tỉ USD trong ngày.

Google đã nêu bật một số sai lầm trong bản demo tuần này với Reuters, chẳng hạn nói rằng Bard trả lời sai rằng dương xỉ cần ánh sáng mạnh để trả lời một truy vấn.

Bard cũng đưa ra 9 đoạn văn bản khi được hỏi về 4 đoạn trong một câu hỏi khác. Sau câu trả lời đó, Jack Krawczyk nhấp vào nút ngón tay chỉa xuống để đánh giá không tốt.

“Chúng tôi hiểu rõ giới hạn của công nghệ và vì vậy chúng tôi muốn đưa ra một kế hoạch rõ ràng về tốc độ triển khai", ông nói.

Trong một tweet quảng cáo Bard hôm 6.2, Google đã chia sẻ một ảnh động mà chatbot này đang hoạt động. Bard trả lời các câu hỏi của người dùng, gồm cả câu hỏi về kính viễn vọng James Webb. Thế nhưng, một trong những câu trả lời của Bard không chính xác. Cụ thể hơn, Bard tuyên bố rằng James Webb là kính viễn vọng đầu tiên tìm thấy một hành tinh ngoài hệ Mặt trời. Sự thật thì đây là một thành tựu thuộc về ESO (Đài thiên văn phía nam của châu Âu), nơi phát hiện ra hành tinh đó cách nay gần 20 năm bằng kính viễn vọng VLT của mình.

Nhà vật lý thiên văn Grant Tremblay (Mỹ) là người chỉ ra lỗi kiến thức thiên văn của Bard. Theo Grant Tremblay, dù gây ấn tượng nhưng các chatbot AI "thường đưa ra câu trả lời sai một cách rất tự tin".

Đây được xem là một ví dụ điển hình về những sai sót có thể xảy ra với các chatbot dựa trên AI. Cụ thể, chúng có thể đưa ra các thông tin không chính xác nhưng giống như có căn cứ, dẫn đến việc nhiều người sẽ hiểu sai thông tin.

Sau đó, Sundar Pichai yêu cầu tất cả nhân viên Google dành 2 đến 4 giờ giúp thử nghiệm sản phẩm để chatbot này có thể sẵn sàng ra mắt.

"Tôi biết thời điểm này rất thú vị và đó là điều được mong đợi: Công nghệ cơ bản đang phát triển nhanh chóng với rất nhiều tiềm năng. Điều quan trọng nhất chúng tôi có thể làm lúc này là tập trung vào việc xây dựng một sản phẩm tuyệt vời và phát triển nó một cách có trách nhiệm”, Sundar Pichai viết cho nhân viên Google trong một bản ghi nhớ hồi tháng 2.

Google đang chịu áp lực ngày càng tăng trong việc phát hành các sản phẩm generative AI. Dù Google từ lâu đã được coi là tiên phong trong lĩnh vực nghiên cứu AI nhưng một số nhà phê bình cho rằng công ty quá chậm chạp trong việc tung ra các công cụ và dịch vụ của riêng mình để sẵn sàng cho công chúng sử dụng.

Chatbot Bard nói được huấn luyện bằng dữ liệu Gmail gây hoang mang, Google thanh minh