Mark Zuckerberg, Giám đốc điều hành Meta Platforms, vừa cho biết công ty đang "gắn kết chặt chẽ hơn" nhóm nghiên cứu AI với nhóm AI tạo sinh chuyên biệt về kinh doanh được thành lập vào năm 2023, tăng gấp đôi nỗ lực đưa công nghệ này vào các sản phẩm.
AI tạo sinh (generative AI) là một loại AI có mục tiêu chính là tạo ra thông tin mới, thường thông qua quá trình học máy và học sâu. Loại AI này không chỉ giải quyết các nhiệm vụ cụ thể, mà còn có khả năng tạo ra dữ liệu, văn bản, hình ảnh, âm thanh và nhiều loại thông tin khác.
Một ví dụ nổi tiếng về AI tạo sinh là mô hình ngôn ngữ lớn GPT (Generative Pre-trained Transformer) của OpenAI. GPT có khả năng tạo ra văn bản mới, dựa trên dữ liệu mà nó đã được huấn luyện trước đó. AI tạo sinh có thể được sử dụng trong nhiều ứng dụng, gồm tạo văn bản, hình ảnh, âm thanh và thậm chí trong việc giải quyết vấn đề trong lĩnh vực nghệ thuật sáng tạo và thiết kế.
Gã khổng lồ truyền thông xã hội Meta Platforms đang xây dựng cơ sở hạ tầng để đáp ứng nhu cầu phát triển và dự kiến sẽ có khoảng 350.000 bộ xử lý đồ họa (GPU) H100 từ hãng thiết kế chip Nvidia vào cuối năm 2024, Mark Zuckerberg cho biết trong bài đăng trên mạng xã hội Instagram và Threads. Giá một GPU Nvidia H100 từ 30.000 đến 40.000 USD USD tùy thời điểm.
Theo Mark Zuckerberg, kết hợp với số GPU tương đương từ các nhà cung cấp khác, Meta Platforms sẽ có tổng cộng khoảng 600.000 GPU vào cuối năm 2024. Khi hoàn thành, Meta Platforms sẽ sở hữu một trong những hệ thống lớn nhất trong ngành công nghệ.
Amazon vào mùa thu năm 2023 cho biết đang xây dựng một hệ thống với 100.000 chip Trainium2 nội bộ, trong khi Oracle đưa vào hoạt động một hệ thống với 32.000 GPU Nvidia H100.
Người phát ngôn của Meta Platforms từ chối nêu rõ đang hợp tác với nhà cung cấp GPU nào ngoài Nvidia (công ty đang dẫn đầu thị trường chip AI), dù công khai tuyên bố rằng hãng cũng có kế hoạch sử dụng chip AMD. Hãng tin Reuters trước đây đưa tin Meta Platforms đang phát triển một chip giống GPU được thiết kế nội bộ.
Meta Platforms đã phải vội vã xây dựng kho vũ khí điện toán để hỗ trợ cho nỗ lực phát triển AI tạo sinh trong 2023, sau nhiều năm dẫn đầu nghiên cứu về công nghệ này thông qua nhóm FAIR nhưng lại không tập trung vào việc tích hợp nó vào các sản phẩm cốt lõi trên mạng xã hội và thiết bị phần cứng thực tế ảo (VR)/thực tế tăng cường (AR).
Công ty đã triệu tập một nhóm AI tạo sinh vào năm 2023 để nỗ lực thay đổi cục diện sau thành công đột phá của ChatGPT cuối 2022.
Kể từ đó, Meta Platforms đã tung ra phiên bản thương mại của mô hình ngôn ngữ lớn Llama, các công cụ quảng cáo có thể tạo hình nền từ lời gợi ý bằng văn bản và chatbot Meta AI có thể được truy cập trực tiếp qua kính thông minh Ray-Ban.
Trong bài đăng của mình hôm 18.1.2024, Mark Zuckerberg cho biết công ty đang đào tạo phiên bản thứ ba của mô hình Llama. Tỷ phú 39 tuổi người Mỹ cũng liên kết các khoản đầu tư vào AI với sự chuyển đổi sang tầm nhìn về VR/AR, vốn đã truyền cảm hứng cho ông đổi tên công ty từ Facebook thành Meta Platforms vào năm 2021. Ông nói rằng mọi người sẽ “cần các thiết bị mới” như kính để tương tác với AI.
Yann LeCun, Giám đốc khoa học AI của Meta Platforms, từng cảnh báo Mark Zuckerberg rằng ChatGPT có thể gây rắc rối cho công ty truyền thông xã hội này và ông cần phải hành động nhanh chóng trước khi quá muộn.
6 tuần sau khi OpenAI ra mắt ChatGPT vào tháng 11.2022, Yann LeCun đã nói chuyện thành thật với Mark Zuckerberg khi họ chờ ăn trưa tại trụ sở Meta Platforms ở thành phố Menlo Park (bang California, Mỹ), theo nguồn tin của tờ The New York Times.
The New York Times đưa tin Yann LeCun nói với Mark Zuckerberg rằng Meta Platforms cần bắt kịp công nghệ của OpenAI và thực hiện các động thái phát hành trợ lý AI riêng.
Theo Yann LeCun, nếu Meta Platforms không tập trung mạnh mẽ vào các nỗ lực về AI của mình, Facebook và Instagram có thể bị lạc hậu và tuyệt chủng.
Mark Zuckerberg không trả lời, nhưng tỏ ra khó chịu với những lời nhắc nhở của Yann LeCun. Song vào buổi tối cùng ngày, tỷ phú công nghệ dường như đã thay đổi suy nghĩ.
“Tôi đã suy nghĩ về những gì ông. Và tôi nghĩ ông đúng", Mark Zuckerberg với Yann LeCun trong bữa tối tối hôm đó, theo The New York Times.
Sau đó, Mark Zuckerberg muốn Meta Platforms được biết đến như công ty AI hàng đầu và đã triển khai các tính năng AI trên các ứng dụng như Facebook, Instagram, WhatsApp.
Theo The New York Times, dù có một số phản đối từ phía các đội pháp lý và chính sách của Meta Platforms vì lo ngại về an toàn, Mark Zuckerberg vẫn quyết định phát hành mô hình AI mã nguồn mở của công ty càng sớm càng tốt.
Đến tháng 2.2023, Meta Platforms đã đổi tên Genesis, mô hình ngôn ngữ lớn mà nhóm Yann LeCun xây dựng, thành LLaMA và phát hành nó cho các nhà nghiên cứu bên ngoài công ty.
Song vài ngày sau khi phát hành lần đầu, mã nguồn của LLaMA bị rò rỉ trên diễn đàn 4chan, gây lo ngại về an ninh nội bộ. Vụ rò rỉ này là một trong những yếu tố thúc đẩy Thượng nghị sĩ Josh Hawley ở bang Missouri và Richard Blumenthal tại bang Connecticut (Mỹ) viết thư cho Meta Platforms trong những tháng sau đó, cáo buộc rằng công ty "không thực hiện bất kỳ đánh giá rủi ro có ý nghĩa nào" trước khi phát hành LLaMA và khiến mô hình AI này dễ bị kẻ xấu khai thác.
Tuy nhiên, Meta Platforms không đơn độc trong cuộc đua AI. Các đối thủ công nghệ của Meta Platforms như Google và Microsoft cũng gấp rút tung ra chatbot AI riêng để cạnh tranh với ChatGPT, mang lại kết quả khác nhau.
Vào tháng 2, cùng tháng Meta Platforms phát hành LLaMA, Microsoft đã giới thiệu công cụ tìm kiếm Bing được hỗ trợ bởi AI cho những người dùng. Sau đó, Bing Chat bị cáo buộc đưa ra những phản hồi đáng lo ngại.
Cùng tuần đó, Google đã công bố phiên bản beta của Bard, bị một số nhân viên chỉ trích là công việc "gấp rút" và "không thành công", sau khi mắc lỗi thực tế trong bản demo đầu tiên.
Trải nghiệm lần đó không làm Meta Platforms chùn bước khi hãng tiếp tục theo đuổi các công cụ AI mới với việc phát hành Llama 2 vào tháng 7, phiên bản tiếp theo của mô hình AI ban đầu.
Đến tháng 9.2023, công ty mẹ Facebook đã trình làng thế hệ kính thông minh Ray-Ban Meta mới nhất và hàng chục chatbot AI đóng vai những người nổi tiếng, chẳng hạn Paris Hilton hay Snoop Dogg.
Đã hơn một năm kể từ khi OpenAI ra mắt ChatGPT và nhiều người vẫn ngạc nhiên về mức độ phổ biến của chatbot AI này.
Yann LeCun nói với trang Forbes rằng ChatGPT được coi như "sự xuất hiện thứ hai của đấng cứu thế" khi nó được phát hành. Nhà tiên phong về AI cho biết thêm tác động của ChatGPT với phạm vi công cộng là “một sự bất ngờ lớn với tất cả mọi người, gồm cả OpenAI”.
Ông nói: "Điều ngạc nhiên là nếu bạn đưa công cụ này đến tay người dùng và nếu nó không đến từ một hãng công nghệ lớn thì mọi người sẽ thực sự ấn tượng với nó. Họ bắt đầu sử dụng nó".
ChatGPT nhanh chóng thu hút sự chú ý của công chúng và người dùng nhanh chóng tìm ra cách sáng tạo để tận dụng công nghệ này. Trong vòng hai tháng đầu sau khi ra mắt hôm 30.11.2022, ChatGPT có hơn 100 triệu người dùng đã truy cập trang web, theo dữ liệu của công ty phân tích dữ liệu Similarweb.
Sự phổ biến của ChatGPT đã gióng lên hồi chuông cảnh báo tại Google và khởi đầu cuộc chạy đua AI giữa các hãng công nghệ lớn, gồm cả Meta Platforms.
Yann LeCun từng chỉ trích các công ty AI nổi bật khác như OpenAI và Google DeepMind. Trong một bài đăng trên X, chuyên gia hàng đầu về AI này đã cáo buộc Sam Altman (Giám đốc điều hành OpenAI), Demis Hassabis (Giám đốc điều hành Google DeepMind) và Dario Amodei (Giám đốc điều hành Anthropic) là "kích động nỗi sợ" và "vận động hành lang" để phục vụ lợi ích riêng của họ.