Mark Zuckerberg khó chịu với những người nói muốn tạo ra ‘vị thần AI’ toàn năng
Nhịp đập khoa học - Ngày đăng : 11:03, 28/06/2024
Mark Zuckerberg khó chịu với những người nói muốn tạo ra ‘vị thần AI’ toàn năng
Đã đưa Meta Platforms vào cuộc đua trí tuệ nhân tạo (AI) nhưng Mark Zuckerberg không thích những người nghĩ rằng họ đang tạo ra một "vị thần AI" toàn năng duy nhất.
Giám đốc điều hành Meta Platforms gần đây đã tham gia cuộc phỏng vấn với YouTuber Kane Sutter (còn được gọi là Kallaway) để thảo luận về chiến lược AI của công ty: Không chỉ tập trung một mô hình AI duy nhất.
"Tương lai sẽ không chỉ có một AI. Sẽ có rất nhiều AI với nhiều người khác nhau có thể tạo ra những thứ khác nhau", Mark Zuckerberg nhấn mạnh.
Trong khi các hãng công nghệ khác đang tập trung vào một mô hình AI chính để phát triển, chẳng hạn như GPT của OpenAI hoặc Gemini của Google, Mark Zuckerberg cho biết Meta Platforms đang hướng tới việc tích hợp nhiều AI.
"Quan điểm tổng thể của chúng tôi rằng đây không phải là loại công nghệ mà chỉ nên có một. Người ta muốn tương tác với nhiều người và doanh nghiệp khác nhau, nên cần có nhiều AI khác nhau được tạo ra để phản ánh các sở thích khác nhau của mọi người", ông nói.
Nhân cơ hội được Kane Sutter phỏng vấn, Mark Zuckerberg một lần nữa tuyên bố ủng hộ các mô hình AI nguồn mở, nói rằng công nghệ này không nên bị "tích trữ" bởi một công ty nào đó muốn kiểm soát việc sử dụng nó hoặc xây dựng ra một sản phẩm trung tâm duy nhất.
Tỷ phú 40 tuổi người Mỹ thấy việc theo đuổi một AI toàn năng duy nhất là không hấp dẫn.
"Tôi cảm thấy khá khó chịu khi những người trong ngành công nghệ nói về việc xây dựng một AI thực sự duy nhất này. Họ gần như nghĩ rằng đang tạo ra vị thần hoặc gì đó tương tự", Mark Zuckerberg cho hay.
Ông dường như đề cập đến một số cuộc trò chuyện về việc đạt được AI tổng quát (AGI) - ý tưởng rằng cuối cùng AI sẽ vượt qua trí tuệ của chính loài người.
Với vài người, việc theo đuổi AI thậm chí có thể biến thành một dạng tôn giáo. Ví dụ, cựu kỹ sư Google - Anthony Levandowski đã thành lập nhà thờ Way of the Future (Con đường của tương lai) dành cho những người đang cố gắng xây dựng "kết nối tâm linh" với AI.
Thế nhưng, những bình luận của Mark Zuckerberg dường như nhắm vào các nhà nghiên cứu AI ví AGI như một vị thần.
"Chúng tôi đang tạo ra vị thần. Chúng tôi đang tạo ra những cỗ máy có ý thức", một nhân viên AI giấu tên nói với trang Vanity Fair vào tháng 9.2023.
Những người khác, chẳng hạn như Ilya Sutskever (đồng sáng lập và cựu Giám đốc khoa học OpenAI), không nói về "vị thần" mà đang theo đuổi một "siêu trí tuệ" duy nhất.
Arthur Mensch, Giám đốc điều hành công ty Mistral, đã bày tỏ lo ngại vào năm ngoái về sự quan tâm gần như sùng đạo của Thung lũng Silicon với AGI.
“Toàn bộ luận điệu về AGI là về việc tạo ra vị thần. Tôi là một người vô thần kiên định. Vì vậy, tôi không tin vào AGI”, Arthur Mensch cho biết.
Dù Meta Platforms cũng đang tham gia vào cuộc đua AI và cố gắng xây dựng các mô hình AI ngày càng mạnh mẽ, Mark Zuckerberg cho biết công ty mẹ Facebook hy vọng tạo ra bộ công cụ đa dạng để người dùng có thể xây dựng các hệ thống AI của riêng họ.
"Một số người đang nói rằng sẽ có một AI lớn thực sự duy nhất có thể làm mọi thứ. Tôi chỉ không nghĩ rằng đó là cách mọi thứ diễn ra", Mark Zuckerberg tuyên bố.
“Vấn đề không nằm ở dữ liệu”
Trong cuộc đua tìm kiếm dữ liệu đào tạo mô hình AI của các hãng công nghệ lớn, Mark Zuckerberg đưa ra một quan điểm thú vị: Vấn đề không nằm ở dữ liệu.
“Tôi cho rằng thứ có giá trị hơn chính là vòng lặp phản hồi chứ không phải bất kỳ kho dữ liệu ban đầu nào”, Giám đốc điều hành Meta Platforms nói trong cuộc phỏng vấn với trang tin công nghệ Command Line hồi tháng 4.
Vòng lặp phản hồi được sử dụng để đào tạo lại và cải thiện các mô hình AI theo thời gian dựa trên kết quả đầu ra trước đó. Ví dụ, thuật toán này cho phép các mô hình AI biết khi nào mắc lỗi và cung cấp cho chúng dữ liệu để điều chỉnh trong tương lai.
Mark Zuckerberg cho rằng việc thu thập phản hồi từ người dùng và sử dụng thông tin đó để cải thiện và tinh chỉnh sản phẩm sẽ là yếu tố quan trọng hơn, đồng thời cũng là yếu tố tạo ra sự khác biệt khi thời gian trôi qua.
Việc tìm kiếm nguồn dữ liệu mới để cung cấp cho các mô hình AI (về lý thuyết sẽ khiến chúng thông minh hơn) đang là nỗi ám ảnh của các công ty đang chạy đua để thống trị lĩnh vực AI.
OpenAI, Google, Amazon, Meta Platforms và các công ty khác đã xem xét một số giải pháp táo bạo. Ví dụ, Meta Platforms đã có lúc khao khát dữ liệu đến mức cân nhắc mua lại công ty xuất bản Simon & Schuster và thậm chí cân nhắc mạo hiểm chấp nhận bị kiện về bản quyền để có thêm tài liệu, trang The New York Times đưa tin.
Một giải pháp khác cho vấn đề hạn chế dữ liệu là tạo dữ liệu mới, thứ mà các hãng công nghệ lớn gọi là dữ liệu tổng hợp Dữ liệu tổng hợp được tạo ra nhân tạo và bắt chước dữ liệu do các sự kiện trong thế giới thực tạo ra. Mark Zuckerberg thích điều này.
Tỷ phú 40 tuổi nói: “Tôi nghĩ sẽ có rất nhiều thứ trong dữ liệu tổng hợp, nơi các mô hình AI cố gắng giải quyết các vấn đề khác nhau và xem con đường nào hiệu quả, sau đó sử dụng nó để củng cố”.
Anthropic, hãng phát triển chatbot Claude, cũng đã đưa dữ liệu được tạo nội bộ vào các mô hình AI của mình. OpenAI đã xem xét điều đó dù Giám đốc điều hành Sam Altman nói tại một hội nghị vào tháng 5.2023 rằng điều quan trọng là phải có một mô hình AI "đủ thông minh để tạo ra dữ liệu tổng hợp tốt".
Mark Zuckerberg coi các vòng lặp phản hồi là chìa khóa để xây dựng mô hình AI mạnh mẽ, nhưng cũng có những rủi ro khi phụ thuộc vào chúng. Chẳng hạn, mô hình AI có thể củng cố một số sai lầm, hạn chế trong khả năng và tỏ ra thành kiến nếu không được đào tạo trên "dữ liệu tốt" ngay từ đầu.
Ưu điểm và rủi ro khi đặt cược vào dữ liệu tổng hợp để xây dựng mô hình AI
Đằng sau mỗi phản hồi thông minh từ chatbot là một kho dữ liệu khổng lồ và trong một số trường hợp, hàng nghìn tỉ từ được lấy từ các bài báo, sách và bình luận trực tuyến để dạy hệ thống AI hiểu truy vấn của người dùng. Quan niệm thông thường trong ngành này là cần ngày càng nhiều thông tin càng tốt để tạo ra các sản phẩm AI thế hệ tiếp theo.
Tuy nhiên, tồn tại một vấn đề lớn với kế hoạch đó: Chỉ có một lượng dữ liệu chất lượng cao có sẵn trên internet. Để sở hữu chúng, các công ty AI thường trả hàng triệu USD cho các nhà xuất bản để cấp phép nội dung của họ hoặc thu thập dữ liệu từ các trang web, dẫn đến nguy cơ đối mặt với vụ kiện bản quyền. Ngày càng nhiều công ty AI hàng đầu đang khám phá một cách tiếp cận khác, gây ra tranh cãi trong cộng đồng AI: Sử dụng dữ liệu tổng hợp, hay bản chất là dữ liệu fake (giả).
Đây là cách hoạt động: Các hãng công nghệ có thể sử dụng hệ thống AI của riêng họ để tạo ra văn bản và các phương tiện truyền thông khác. Dữ liệu nhân tạo này sau đó được sử dụng để đào tạo các phiên bản tương lai của cùng những hệ thống AI đó, theo cái mà Giám đốc điều hành Anthropic - Dario Amodei gọi là “công cụ tạo dữ liệu vô hạn” tiềm năng. Bằng cách này, các công ty AI có thể tránh gây ra nhiều lo ngại về pháp lý, đạo đức và quyền riêng tư.
Ý tưởng về dữ liệu tổng hợp trong điện toán không phải là mới. Đó là kỹ thuật đã được sử dụng trong nhiều thập kỷ cho mọi thứ, từ ẩn danh thông tin cá nhân đến mô phỏng điều kiện đường sá cho công nghệ ô tô tự lái. Thế nhưng, sự phát triển của AI tạo sinh giúp việc tạo dữ liệu tổng hợp có chất lượng tốt hơn trên quy mô lớn trở nên dễ dàng hơn, đồng thời cũng tạo thêm tính cấp thiết mới để thực hiện điều đó.
Anthropic nói với hãng tin Bloomberg rằng đã sử dụng dữ liệu tổng hợp để xây dựng mô hình mới nhất hỗ trợ chatbot của mình là Claude. Meta Platforms và Google sử dụng dữ liệu tổng hợp để phát triển các mô hình nguồn mở gần đây của họ.
Google DeepMind cho biết dựa vào phương pháp này để giúp đào tạo một mô hình AI có thể giải các bài toán hình học cấp độ Olympic. Nhiều người thắc mắc liệu OpenAI có sử dụng dữ liệu tổng hợp để đào tạo Sora, mô hình chuyển văn bản thành video chân thực, hay không. OpenAI nói với Bloomberg rằng đang khám phá việc sử dụng dữ liệu tổng hợp nhưng sẽ không xác nhận thêm thông tin chi tiết.
Tại Microsoft, nhóm nghiên cứu AI tạo sinh đã chuyển sang sử dụng dữ liệu tổng hợp cho một dự án gần đây. Họ muốn xây dựng một mô hình AI nhỏ hơn, ít tốn tài nguyên hơn mà vẫn có khả năng ngôn ngữ và suy luận hiệu quả. Để làm được điều đó, nhóm này đã cố gắng bắt chước cách trẻ học ngôn ngữ thông qua việc đọc truyện.
Thay vì cung cấp cho mô hình AI một lượng lớn sách dành cho trẻ em, đội ngũ Microsoft đã đưa ra danh sách 3.000 từ mà đứa trẻ 4 tuổi có thể hiểu được. Sau đó, họ yêu cầu mô hình AI tạo ra một câu chuyện dành cho trẻ em bằng cách sử dụng một danh từ, một động từ và một tính từ trong danh sách đó. Các nhà nghiên cứu Microsoft lặp lại lời nhắc đó hàng triệu lần trong nhiều ngày, tạo ra hàng triệu truyện ngắn mà cuối cùng đã giúp phát triển một mô hình ngôn ngữ khác có khả năng tốt hơn. Microsoft đã tạo ra mô hình ngôn ngữ mới nhỏ gọn này (có tên Phi-3), nguồn mở và có sẵn cho công chúng.
Sébastien Bubeck, Phó chủ tịch phụ trách AI tại Microsoft, nói: “Đột nhiên, bạn có nhiều quyền kiểm soát hơn. Bạn có thể quyết định ở mức độ chi tiết hơn nhiều về những gì muốn mô hình AI của mình học”.
Theo Sébastien Bubeck, với dữ liệu tổng hợp, bạn cũng có thể hướng dẫn các hệ thống AI tốt hơn trong quá trình học hỏi bằng cách thêm nhiều giải thích hơn vào dữ liệu, nếu không thì máy có thể gặp khó khăn để xử lý.
Thế nhưng, một số chuyên gia AI lo lắng về rủi ro của những kỹ thuật như vậy. Vào năm ngoái, nhóm các nhà nghiên cứu tại Đại học Oxford, Cambridge và một số trường lớn khác đã xuất bản một bài viết giải thích cách sử dụng dữ liệu tổng hợp do ChatGPT tạo ra để xây dựng mô hình AI mới có thể dẫn đến “sự sụp đổ mô hình”.
Trong thử nghiệm của họ, mô hình AI được xây dựng trên đầu ra của ChatGPT bắt đầu bộc lộ “những khiếm khuyết không thể khắc phục” và dường như mất trí nhớ về những gì nó được đào tạo ban đầu.
Trong một ví dụ, các nhà nghiên cứu đã gợi ý mô hình ngôn ngữ lớn bằng văn bản về kiến trúc lịch sử của Anh. Sau khi các nhà nghiên cứu đào tạo lại mô hình ngôn ngữ lớn bằng dữ liệu tổng hợp nhiều lần, nó bắt đầu tạo ra những câu nói lảm nhảm vô nghĩa về thỏ rừng.
Các nhà nghiên cứu cũng đưa ra lo ngại rằng dữ liệu tổng hợp có thể làm tăng thêm sự thiên vị và độc hại trong bộ dữ liệu. Về phần mình, một số người ủng hộ dữ liệu tổng hợp nói rằng với các biện pháp phù hợp, mô hình AI được phát triển theo cách này có thể chính xác hoặc tốt hơn cái được xây dựng trên dữ liệu thực.
“Dữ liệu tổng hợp có thể hữu ích nếu được thực hiện đúng cách. Tuy nhiên, không có câu trả lời rõ ràng về cách thực hiện đúng đắng; một số thành kiến có thể rất khó nhận thấy với con người”, theo Zakhar Shumaylov, tiến sĩ nghiên cứu sinh tại Đại học Cambridge.