Chatbot Bard nói được huấn luyện bằng dữ liệu Gmail gây hoang mang, Google thanh minh

Sơn Vân | 23/03/2023, 11:52

Google nói rằng điều đó không chính xác và Bard “sẽ phạm sai lầm”.

Google bắt đầu triển khai Bard cho một số người dùng hôm 21.3 và chatbot AI này nhanh chóng gặp vấn đề trong câu trả lời. Chuyên gia AI Kate Crawford đã đăng một cuộc trao đổi với Bard, trong đó cô hỏi tập dữ liệu đào tạo chatbot AI này đến từ đâu.

Trong ảnh chụp màn hình cuộc trò chuyện, Bard trả lời rằng tập dữ liệu của nó "được thu thập từ nhiều nguồn khác nhau", trong đó có "dữ liệu nội bộ của Google", gồm cả Gmail.

"Có ai lo ngại về việc Bard nói rằng tập dữ liệu đào tạo nó gồm cả Gmail không? Tôi cho rằng điều đó hoàn toàn sai, nếu không thì Google đang vượt qua một số ranh giới pháp lý nghiêm trọng", Kate Crawford viết.

Vài giờ sau đó, Google đã cố gắng làm rõ thông tin. Công ty đề cập trong một tweet rằng: "Bard là một thử nghiệm sớm dựa trên các mô hình ngôn ngữ lớn và sẽ phạm sai lầm. Nó không được huấn luyện trên dữ liệu của Gmail".

Trong phản hồi khác đã bị xóa sau đó, Google cho biết: "Không có dữ liệu riêng tư nào sẽ được sử dụng trong quá trình huấn luyện Bard".

Trong phản hồi của Bard với Kate Crawford, chatbot này cho biết nó cũng được đào tạo bằng cách sử dụng "bộ dữ liệu văn bản và mã từ web, chẳng hạn Wikipedia, GitHub và Stack Overflow", cũng như dữ liệu từ các công ty "hợp tác với Google để cung cấp dữ liệu cho quá trình huấn luyện Bard".

Trước đó, Bard cũng khiến Google rơi vào cảnh oái oăm. Trong ảnh chụp màn hình cuộc đối thoại cùng Bard, Jane Manchun Wong (blogger công nghệ ở Hồng Kông) cho thấy chatbot này dường như đồng tình với Bộ Tư pháp Mỹ về vụ kiện chống độc quyền với Google trong lĩnh vực quảng cáo kỹ thuật số.

Đây là vụ kiện mà Bộ Tư pháp Mỹ và một số thẩm phán bang chống lại Google, được đệ trình vào tháng 1. Về cơ bản, đơn kiện này cho rằng Google đã dùng sức mạnh của mình để lấn át các nhà quảng cáo kỹ thuật số và buộc họ phải phụ thuộc vào công ty này.

Sundar Pichai, Giám đốc điều hành Google, đã yêu cầu các nhân viên cẩn trọng với những lỗi có thể xảy ra khi bắt đầu sử dụng Bard. "Khi nhiều người bắt đầu sử dụng Bard và kiểm tra khả năng của nó, họ sẽ làm chúng tôi ngạc nhiên. Nhiều thứ xảy ra sẽ không như ý muốn", ông Sundar Pichai viết trong email gửi nhân viên hôm 22.3, được trang CNBC đăng tải.

Bard trả lời chuyên gia AI rằng được huấn luyện bằng dữ liệu Gmail gây hoang mang - Ảnh: Internet

Google hôm 21.3 đã bắt đầu phát hành công khai chatbot Bard với mong muốn thu hút người dùng và nhận được phản hồi để vượt qua Microsoft trong cuộc đua về công nghệ AI.

Bắt đầu từ Mỹ và Vương quốc Anh, người dùng có thể tham gia danh sách chờ để truy cập Bard tiếng Anh tại địa chỉ https://bard.google.com, chương trình trước đây chỉ dành cho những người thử nghiệm được phê duyệt. Google mô tả Bard là thử nghiệm cho phép hợp tác với generative AI.

Generative AI là loại trí tuệ nhân tạo mà máy tính được lập trình để tự động tạo ra nội dung mới, như văn bản, hình ảnh, âm thanh và video. Nó khác với các hệ thống AI khác như máy học sâu (deep learning) hoặc học máy (machine learning) trong việc dự đoán kết quả từ dữ liệu đã có sẵn. Thay vì dựa trên dữ liệu huấn luyện, hệ thống generative AI có khả năng tự tạo ra dữ liệu mới và phong phú hơn. Các ví dụ của generative AI bao gồm các mô hình ngôn ngữ tự động tạo văn bản, các hệ thống nhận dạng hình ảnh, video và âm thanh.

Khi được hỏi liệu các động lực cạnh tranh có đứng sau sự ra mắt của Bard hay không, Jack Krawczyk, Giám đốc sản phẩm cấp cao Google, cho biết công ty tập trung vào người dùng. Ông nói: “Những người thử nghiệm nội bộ và bên ngoài đã tìm đến Bard vì đã tăng năng suất, thúc đẩy ý tưởng và kích thích sự tò mò của họ”.

Trong buổi trình diễn trang web bard.google.com cho Reuters, Jack Krawczyk đã cho thấy cách Bard tạo ra các khối văn bản trong nháy mắt, khác với cách ChatGPT gõ từng từ để trả lời.

Bard cũng bao gồm tính năng hiển thị ba phiên bản khác nhau hoặc "bản nháp" của bất kỳ câu trả lời cụ thể nào mà người dùng có thể chuyển đổi và hiển thị nút Google it nếu người dùng muốn có kết quả web cho một truy vấn.

Tuy nhiên, độ chính xác vẫn là vấn đề đáng quan ngại. "Bard không phải lúc nào cũng đúng", lời cảnh báo của Google xuất hiện trong cửa sổ pop-up trong bài trình diễn.

Tháng trước, video quảng cáo cho thấy Bard trả lời sai một câu hỏi khiến vốn hóa thị trường Alphabet (công ty mẹ của Google) giảm hơn 100 tỉ USD trong ngày.

Google đã nêu bật một số sai lầm trong bản demo tuần này với Reuters, chẳng hạn nói rằng Bard trả lời sai rằng dương xỉ cần ánh sáng mạnh để trả lời một truy vấn.

Bard cũng đưa ra 9 đoạn văn bản khi được hỏi về 4 đoạn trong một câu hỏi khác. Sau câu trả lời đó, Jack Krawczyk nhấp vào nút ngón tay chỉa xuống để đánh giá không tốt.

“Chúng tôi hiểu rõ giới hạn của công nghệ và vì vậy chúng tôi muốn đưa ra một kế hoạch rõ ràng về tốc độ triển khai", ông nói.

Trong một tweet quảng cáo Bard hôm 6.2, Google đã chia sẻ một ảnh động mà chatbot này đang hoạt động. Bard trả lời các câu hỏi của người dùng, gồm cả câu hỏi về kính viễn vọng James Webb. Thế nhưng, một trong những câu trả lời của Bard không chính xác. Cụ thể hơn, Bard tuyên bố rằng James Webb là kính viễn vọng đầu tiên tìm thấy một hành tinh ngoài hệ Mặt trời. Sự thật thì đây là một thành tựu thuộc về ESO (Đài thiên văn phía nam của châu Âu), nơi phát hiện ra hành tinh đó cách nay gần 20 năm bằng kính viễn vọng VLT của mình.

Nhà vật lý thiên văn Grant Tremblay (Mỹ) là người chỉ ra lỗi kiến thức thiên văn của Bard. Theo Grant Tremblay, dù gây ấn tượng nhưng các chatbot AI "thường đưa ra câu trả lời sai một cách rất tự tin".

Đây được xem là một ví dụ điển hình về những sai sót có thể xảy ra với các chatbot dựa trên AI. Cụ thể, chúng có thể đưa ra các thông tin không chính xác nhưng giống như có căn cứ, dẫn đến việc nhiều người sẽ hiểu sai thông tin.

Sau đó, Sundar Pichai yêu cầu tất cả nhân viên Google dành 2 đến 4 giờ giúp thử nghiệm sản phẩm để chatbot này có thể sẵn sàng ra mắt.

"Tôi biết thời điểm này rất thú vị và đó là điều được mong đợi: Công nghệ cơ bản đang phát triển nhanh chóng với rất nhiều tiềm năng. Điều quan trọng nhất chúng tôi có thể làm lúc này là tập trung vào việc xây dựng một sản phẩm tuyệt vời và phát triển nó một cách có trách nhiệm”, Sundar Pichai viết cho nhân viên Google trong một bản ghi nhớ hồi tháng 2.

Google đang chịu áp lực ngày càng tăng trong việc phát hành các sản phẩm generative AI. Dù Google từ lâu đã được coi là tiên phong trong lĩnh vực nghiên cứu AI nhưng một số nhà phê bình cho rằng công ty quá chậm chạp trong việc tung ra các công cụ và dịch vụ của riêng mình để sẵn sàng cho công chúng sử dụng.

Bài liên quan

Microsoft xây dựng hệ thống với hơn 10.000 chip Nvidia cho OpenAI để phát triển GPT-4

Những công nghệ mới như generative AI dựa trên việc sử dụng hàng ngàn chip Nvidia cùng lúc để huấn luyện hệ thống AI trên kho dữ liệu khổng lồ.

Đọc tiếp

Thời điểm Bill Gates nhận ra GPT của OpenAI là bước đột phá mang tính cách mạng về công nghệ

'GPT-4 ảnh hưởng nhiều đến những người có học thức kiếm được từ 80.000 USD/năm'

Công nghệ từ OpenAI giúp Bing tăng 15,8% lượt truy cập trong cuộc chiến với Google

(0) Bình luận

Xếp theo:

Nổi bật Một thế giới

Phát triển trung tâm đào tạo xuất sắc và tài năng về công nghệ 4.0 đến năm 2030

1 giờ trước Nhịp đập khoa học

Phó thủ tướng Chính phủ Lê Thành Long ký Quyết định số 374/QĐ-TTg phê duyệt Đề án phát triển hệ thống trung tâm đào tạo xuất sắc và tài năng về công nghệ 4.0 đến năm 2030.

Mỹ dùng Starlink đàm phán thỏa thuận đất hiếm với Ukraine

Hãng Reuters dẫn nguồn tin tiết lộ Mỹ dùng quyền tiếp cận dịch vụ internet vệ tinh Starlink...
Bài toán năng lượng để biến CO₂ thành nhiên liệu lỏng: Đáp án từ mặt trời

Trong nhiều thập kỷ qua, các nhà khoa học đã không ngừng tìm kiếm các phương pháp để giảm thiểu...
Không khí lạnh tràn xuống Bắc Bộ, rét đậm về đêm

Bắc Bộ trời rét, mưa nhỏ, mưa phùn, sương mù. Tây Nguyên và Nam Bộ mưa rào, dông rải rác.

Đừng bỏ lỡ

Kỳ 2: Gặp Đặng Lê Nguyên Vũ ở Sài Gòn: Có gì trong đồ hình không chữ?

2 giờ trước Kinh tế - đầu tư - dự án

Vừa qua, Chủ tịch Tập đoàn Trung Nguyên Legend Đặng Lê Nguyên Vũ đã có cuộc gặp gỡ trao đổi với nhà báo Nguyên Hằng (Báo Thanh Niên). Trong cuộc trò chuyện kéo dài hơn 3 giờ đồng hồ, nhà báo Nguyên Hằng đã ghi chép lại những suy tư, trăn trở đầy tâm huyết của Chủ tịch Vũ về sứ mệnh dân tộc, khát vọng đất nước hùng cường trong bối cảnh mới. Nhằm mang đến cho đông đảo độc giả những thông tin, nhiều góc nhìn đầy đủ hơn về Chủ tịch Vũ, tòa soạn trân trọng giới thiệu bài báo ấy.
Tái tạo mô hình AI suy luận của OpenAI chỉ với 450 USD trong 19 giờ bằng kỹ thuật DeepSeek từng dùng

11 giờ trước Nhịp đập khoa học

Công ty khởi nghiệp DeepSeek (Trung Quốc) gây chấn động thị trường vào tháng 1 khi công bố mô hình AI nguồn mở có hiệu suất ngang hoặc hơn các sản phẩm tương tự của Mỹ nhưng được đào tạo với chi phí thấp hơn nhiều, dẫn đến đợt bán tháo cổ phiếu trong lĩnh vực công nghệ và bán dẫn.
Đồng Nai cam kết tháo gỡ khó khăn cho doanh nghiệp đến đầu tư

11 giờ trước Kinh tế - đầu tư - dự án

Để hỗ trợ doanh nghiệp, chính quyền tỉnh Đồng Nai cam kết sẽ kịp thời tháo gỡ các khó khăn, vướng mắc, tiếp tục đồng hành và tạo điều kiện thuận lợi nhất.
Jensen Huang: Các nhà đầu tư hiểu sai về tiến bộ AI của DeepSeek khiến Nvidia mất gần 600 tỉ USD một ngày

12 giờ trước Nhịp đập khoa học

Các nhà đầu tư đã rút ra kết luận sai lầm từ những tiến bộ của DeepSeek trong lĩnh vực trí tuệ nhân tạo (AI), Jensen Huang - Giám đốc điều hành Nvidia nói tại sự kiện trực tuyến được phát sóng hôm 20.2.
Vụ Sài Gòn Đại Ninh: Nhiều công ty kháng cáo

12 giờ trước Theo dòng thời sự

Liên quan tới vụ án Sài Gòn - Đại Ninh, sau khi kết thúc phiên tòa sơ thẩm đã có nhiều công ty gửi đơn kháng cáo, đề nghị tòa phúc thẩm không tịch thu số tiền 2.700 tỉ đồng…

Mới nhất

Mỹ dùng Starlink đàm phán thỏa thuận đất hiếm với Ukraine

một giờ trước Chuyển động

Hãng Reuters dẫn nguồn tin tiết lộ Mỹ dùng quyền tiếp cận dịch vụ internet vệ tinh Starlink để gây sức ép với Ukraine trong nỗ lực đàm phán thỏa thuận đổi đất hiếm lấy bảo đảm an ninh.
Phát triển trung tâm đào tạo xuất sắc và tài năng về công nghệ 4.0 đến năm 2030

1 giờ trước Nhịp đập khoa học

Phó thủ tướng Chính phủ Lê Thành Long ký Quyết định số 374/QĐ-TTg phê duyệt Đề án phát triển hệ thống trung tâm đào tạo xuất sắc và tài năng về công nghệ 4.0 đến năm 2030.
Bài toán năng lượng để biến CO₂ thành nhiên liệu lỏng: Đáp án từ mặt trời

1 giờ trước Kiến thức - Học thuật

Trong nhiều thập kỷ qua, các nhà khoa học đã không ngừng tìm kiếm các phương pháp để giảm thiểu lượng khí carbon dioxide (CO₂) thải ra và biến chúng thành những thứ hữu ích một cách bền vững. Vấn đề khó nhất là năng lượng để chạy các phương pháp này.
Không khí lạnh tràn xuống Bắc Bộ, rét đậm về đêm

2 giờ trước Theo dòng thời sự

Bắc Bộ trời rét, mưa nhỏ, mưa phùn, sương mù. Tây Nguyên và Nam Bộ mưa rào, dông rải rác.
Hội nghị Ban Chấp hành Đảng bộ Liên hiệp Các hội KH-KT Việt Nam (mở rộng)

14 giờ trước Khoa học - công nghệ

Ngày 21.2, Đảng bộ Liên hiệp Các hội Khoa học và Kỹ thuật Việt Nam (Liên hiệp Hội Việt Nam) đã tổ chức Hội nghị Ban Chấp hành mở rộng.

Xem thêm