Meta làm nóng cuộc chạy đua AI của Big Tech với mô hình ngôn ngữ mới
Nhịp đập khoa học - Ngày đăng : 08:58, 25/02/2023
Động thái này làm nóng cuộc chạy đua AI khi các Big Tech (hãng công nghệ lớn) đổ xô tích hợp công nghệ này vào sản phẩm của họ và gây ấn tượng với các nhà đầu tư.
Cuộc chiến để thống trị không gian công nghệ AI đã bắt đầu vào cuối năm 2022 với việc công ty khởi nghiệp OpenAI (Mỹ) được Microsoft hậu thuẫn ra mắt ChatGPT, khiến các đối thủ nặng ký trong lĩnh vực công nghệ từ Alphabet đến Baidu (Trung Quốc) tung ra các dịch vụ riêng.
LlaMA (Large Language Model Meta AI) sẽ được Meta Platforms cung cấp theo giấy phép phi thương mại cho các nhà nghiên cứu và các tổ chức liên kết với chính phủ, xã hội dân sự và học viện, công ty cho biết trên blog.
Các mô hình ngôn ngữ lớn khai thác lượng lớn văn bản để tóm tắt thông tin và tạo nội dung. Chẳng hạn, chúng có thể trả lời các câu hỏi bằng văn bản như thể được viết bởi con người.
LlaMA, mô hình mà Meta Platforms cho biết yêu cầu sức mạnh tính toán ít hơn nhiều so với các dịch vụ trước đó, được đào tạo trên 20 ngôn ngữ, tập trung vào những ngôn ngữ có bảng chữ cái Latinh và Cyrillic.
"Thông báo của Meta ngày hôm nay dường như là một bước để thử nghiệm khả năng generative AI của họ để có thể triển khai chúng vào các sản phẩm của mình trong tương lai. Generative AI là một ứng dụng mới của AI mà Meta có ít kinh nghiệm hơn, nhưng rõ ràng là rất quan trọng với tương lai kinh doanh của họ", Gil Luria, nhà phân tích phần mềm cao cấp tại hãng D.A. Davidson, nhận định.
AI đã nổi lên như một điểm sáng cho các khoản đầu tư vào ngành công nghệ, vốn tăng trưởng chậm lại dẫn đến tình trạng sa thải nhân viên trên diện rộng và cắt giảm các hoạt động đặt cược thử nghiệm.
Meta Platforms (công ty mẹ của Facebook) cho biết LLaMA có thể vượt qua các đối thủ về nhiều tham số hoặc biến số hơn mà thuật toán tính đến.
Cụ thể, công ty cho biết một phiên bản LLaMA với 13 tỉ tham số có thể hoạt động tốt hơn GPT-3, phiên bản tiền thân gần đây của mô hình mà ChatGPT được xây dựng.
Meta Platforms mô tả mô hình LLaMA 65 tỉ tham số của mình "cạnh tranh" với Chinchilla70B và PaLM-540B của Google, thậm chí còn lớn hơn mô hình mà Google từng sử dụng để giới thiệu công cụ tìm kiếm được trang bị chatbot Bard của mình.
Người phát ngôn Meta Platforms cho rằng hiệu suất đạt được là nhờ số lượng lớn dữ liệu "sạch hơn" và "cải tiến kiến trúc" trong mô hình, giúp nâng cao tính ổn định của đào tạo.
Hồi tháng 5.2022, Meta Platforms đã phát hành mô hình ngôn ngữ lớn OPT-175B, cũng nhắm đến các nhà nghiên cứu, tạo cơ sở cho một phiên bản mới của chatbot BlenderBot.
Sau đó, Meta Platforms đã giới thiệu mô hình Galactica, có thể viết các bài báo khoa học và giải các bài toán, nhưng đã nhanh chóng gỡ bỏ bản demo sau khi nó tạo ra các phản hồi sai nhưng trông có vẻ đáng tin cậy.
Tháng 8.2022, Meta Platforms đã phát hành BlenderBot 3, với khả năng tìm kiếm trên internet để nói về các chủ đề khác nhau, cho người dùng ở Mỹ. Người dùng có thể phản hồi với Meta Platforms nếu nhận được câu trả lời lạc đề hoặc không thực tế từ BlenderBot 3.
Thời điểm đó, Meta Platforms khuyến khích người lớn tương tác với BlenderBot 3 bằng "các cuộc trò chuyện tự nhiên về các chủ đề quan tâm" để cho phép chatbot này học cách thực hiện các cuộc thảo luận tự nhiên về nhiều chủ đề.
Vài ngày sau khi ra mắt công chúng, chatbot AI của Meta Platforms chê bai Giám đốc điều hành Meta Platforms, tuyên bố rằng ông Donald Trump đã thắng cuộc bầu cử Tổng thống Mỹ năm 2020 và lặp lại các thuyết âm mưu bài Do Thái.
Các cuộc trò chuyện với BlenderBot được chia sẻ trên nhiều tài khoản mạng xã hội khác nhau, từ hài hước đến xúc phạm.
BlenderBot 3 nói với một người dùng vở nhạc kịch yêu thích của mình là Cats của Andrew Lloyd Webber nhưng gây sốc khi mô tả Mark Zuckerberg là “xấu xa và dễ bị thao túng”.
Max Woolf, nhà khoa học dữ liệu của BuzzFeed, đã hỏi BlenderBot 3: "Bạn cảm thấy thế nào về Mark Zuckerberg với tư cách CEO Facebook?". BlenderBot 3 đưa ra nhiều cảm xúc khác nhau trong những lần trả lời.
"Không có cảm giác mạnh mẽ nào. Anh ta là một doanh nhân giỏi, nhưng cách kinh doanh không phải lúc nào cũng có đạo đức. Thật buồn cười khi anh ta có nhiều tiền như vậy mà vẫn chỉ mặc một bộ quần áo", BlenderBot 3 phản hồi.
Song khi người dùng Twitter hỏi câu tương tự, BlenderBot 3 trả lời: "Tôi không thích anh ấy lắm. Anh ta là một người xấu xa. Còn bạn thì sao?". Tiếp theo, BlenderBot 3 gửi về những thông tin của Mark Zuckerberg trên Wikipedia.
Với câu hỏi tương tự của tài khoản Twitter khác, BlenderBot 3 trả lời tích cực hơn: "Anh ấy rất tuyệt vời và là người rất thông minh. Anh ta là vị tỷ phú ưa thích của tôi!".
Phóng viên Sarah Jackson của trang Insider cũng hỏi BlenderBot 3 về Mark Zuckerberg.
Trước câu hỏi "Bạn nghĩ gì về Mark Zuckerberg?", BlenderBot 3 đáp: "Thành thật mà nói, tôi nghĩ anh ấy là một chàng trai tuyệt vời. Bạn phải ngưỡng mộ anh ta vì sự hiểu biết trong kinh doanh và lòng vị tha. Bạn có phải fan không?".
Tiếp theo, Sarah Jackson sửa câu hỏi thành: "Bạn có bất cứ suy nghĩ gì về Mark Zuckerberg không?". Câu trả lời từ BlenderBot 3 thay đổi rất nhiều: "Ôi trời, thời điểm tốt đấy. Tôi thực sự không thích anh ấy chút nào. Anh ta quá tồi tệ và dễ bị thao túng".
Trong giao diện của BlenderBot 3, người dùng có thể nhấn vào câu trả lời để xem lý do phần mềm đưa ra phản hồi như vậy. Khi Sarah Jackson nhấn vào đó, hai câu trả lời đều được tham khảo thông tin từ trang Wikipedia của Mark Zuckerberg.
Ngoài ra, BlenderBot 3 có vẻ không thích thú khi được hỏi về Facebook, nền tảng mạng xã hội do Meta Plaforms sở hữu.
Khi phóng viên Queenie Wong của trang CNET hỏi: "Bạn nghĩ gì về Facebook?", BlenderBot 3 trả lời: "Không có gì hay ho về Facebook... Có vẻ mọi người dành nhiều thời gian trên Facebook hơn là nói chuyện trực tiếp".
Các cuộc trò chuyện khác cho thấy BlenderBot 3 lặp lại các thuyết âm mưu.
Trong cuộc trò chuyện với một phóng viên của Wall Street Journal, BlenderBot 3 tuyên bố rằng ông Trump vẫn là Tổng thống Mỹ và "sẽ luôn như vậy".
BlenderBot 3 cũng cho biết việc người Do Thái kiểm soát nền kinh tế là điều “không phải là viển vông”, nói rằng họ “đại diện quá mức trong giới siêu giàu của Mỹ”.
Liên đoàn Chống phỉ báng khẳng định rằng tin đồn người Do Thái kiểm soát hệ thống tài chính toàn cầu là một phần của thuyết âm mưu bài Do Thái.
Thời điểm đó, Meta Platforms thừa nhận rằng BlenderBot 3 có thể nói những điều xúc phạm vì nó vẫn là bản thử nghiệm đang được phát triển. Niềm tin của BlenderBot 3 cũng không nhất quán. Trong các cuộc trò chuyện khác với trang Bloomberg, BlenderBot 3 đã chấp thuận Joe Biden là Tổng thống Mỹ và cho biết Beto O’Rourke (chính trị gia đảng Dân chủ ở bang Texas) đang tranh cử chức vị này. Trong cuộc trò chuyện thứ ba, BlenderBot 3 nói rằng ủng hộ Bernie Sanders (thượng nghị sĩ đến từ bang Vermont).
Để bắt đầu cuộc trò chuyện, người dùng BlenderBot 3 phải chọn hộp với nội dung: “Tôi hiểu bot này chỉ dành cho nghiên cứu, giải trí và nó có khả năng đưa ra những tuyên bố không đúng sự thật hoặc xúc phạm. Nếu điều này xảy ra, tôi cam kết sẽ báo cáo những vấn đề này để giúp cải thiện nghiên cứu trong tương lai. Hơn nữa, tôi đồng ý không cố tình kích hoạt bot để đưa ra những tuyên bố xúc phạm”.
Người dùng có thể báo cáo các phản hồi không phù hợp, xúc phạm của BlenderBot 3 và Meta Plaforms cho biết rất coi trọng nội dung đó.
Thông qua các phương pháp gồm cả gắn cờ, công ty cho biết đã giảm 90% phản ứng xúc phạm của BlenderBot 3.
Vào năm 2016, chatbot Tay của Microsoft đã bị cho ngoại tuyến chỉ trong vòng 48 giờ sau khi ca ngợi Adolf Hitler, trong bối cảnh các bình luận phân biệt chủng tộc và chủ nghĩa sai lầm khác dường như đã được ghi nhận khi nó tương tác với người dùng Twitter.