Meta Platforms vừa ra mắt phiên bản đầu tiên của mô hình ngôn ngữ lớn mới nhất Llama 3 và trình tạo hình ảnh AI có thể cập nhật ảnh theo thời gian thực khi người dùng nhập gợi ý. Động thái này diễn ra khi công ty mẹ Facebook cố chạy đua để bắt kịp OpenAI, công ty dẫn đầu thị trường AI tạo sinh.
Hai mô hình mới này sẽ được tích hợp vào trợ lý ảo Meta AI, mà Meta Platforms quảng cáo là thông minh nhất trong số các sản phẩm miễn phí cùng loại. Theo Meta Platforms, Meta AI thể hiện tốt hơn về mặt lập luận, tạo mã lập trình và viết văn sáng tạo so với dịch vụ của đối thủ như Google và Mistral AI (công ty khởi nghiệp của Pháp).
Trợ lý Meta AI vừa được cập nhật sẽ đóng vai trò nổi bật hơn trong các ứng dụng Facebook, Instagram, WhatsApp và Messenger của Meta Platforms, cũng như trên một website độc lập mới, giúp gã khổng lồ truyền thông xã hội cạnh tranh trực tiếp với ChatGPT, sản phẩm đột phá của OpenAI do Microsoft hậu thuẫn.
Một trang chào đón khách truy cập trên website đó gợi ý họ thử nhờ trợ lý AI tạo danh sách đóng gói đồ đạc trong kỳ nghỉ, chơi trò hỏi đáp về âm nhạc thập niên 90, cung cấp trợ giúp trong bài tập về nhà và vẽ những bức tranh đường chân trời ở thành phố New York (Mỹ).
Meta Platforms đang nỗ lực đưa các sản phẩm AI tạo sinh tới hàng tỉ người dùng nhằm thách thức vị trí dẫn đầu của OpenAI về công nghệ. Điều này liên quan đến việc Meta Platforms đại tu cơ sở hạ tầng máy tính tốn kém và hợp nhất các nhóm nghiên cứu và sản phẩm riêng biệt trước đây.
Gã khổng lồ truyền thông xã hội đã công khai phát hành mô hình Llama để các nhà phát triển xây dựng ứng dụng AI sử dụng như một phần trong nỗ lực bắt kịp OpenAI, vì một tùy chọn miễn phí mạnh mẽ có thể cản trở kế hoạch kiếm doanh thu từ công nghệ độc quyền của đối thủ cạnh tranh. Chiến lược này đã gây ra lo ngại về tính an toàn từ những nhà phê bình cảnh giác với thứ nguy hiểm mà kẻ xấu có thể xây dựng bằng Llama.
Chris Cox, Giám đốc sản phẩm Meta Platforms, nói công ty đã trang bị cho Llama 3 khả năng tạo mã lập trình mới và cung cấp cho nó hình ảnh cũng như văn bản trong quá trình đào tạo lần này, dù hiện tại mô hình ngôn ngữ lớn mới sẽ chỉ xuất ra văn bản.
Ông nói thêm, khả năng lý luận nâng cao hơn, như lập kế hoạch nhiều bước dài hơn, sẽ có trong các phiên bản Llama tiếp theo. Trong các bài đăng trên blog, Meta Platforms cho biết những phiên bản Llama được lên kế hoạch phát hành vài tháng tới cũng sẽ có khả năng "đa phương thức", nghĩa là có thể tạo ra cả văn bản và hình ảnh.
Chris Cox nói: “Mục tiêu cuối cùng là giúp bạn giảm bớt những việc lặt vặt, chỉ giúp cuộc sống của bạn dễ dàng hơn, dù đó là tương tác với các doanh nghiệp, viết điều gì đó hay lên kế hoạch cho một chuyến đi”.
Chris Cox cho biết việc đưa hình ảnh vào chương trình đào tạo Llama 3 sẽ cải thiện khả năng của kính thông minh Ray-Ban Meta, với bản cập nhật sẽ được tung ra trong năm nay. Đây là một sản phẩm được sản xuất bởi hãng kính Essilor Luxoticca, cho phép kích hoạt Meta AI để xác định các đồ vật mà người đeo nhìn thấy và trả lời các câu hỏi về chúng.
Ngoài ra, Meta Platforms đã công bố hợp tác với Google để đưa kết quả tìm kiếm thời gian thực vào phản hồi của trợ lý Meta AI, bổ sung cho thỏa thuận hiện có với công cụ tìm kiếm Bing từ Microsoft.
Cổ phiếu Meta Platforms đã tăng 1,8% cuối ngày 18.4 và hiện ở mức 501,80 USD.
Trợ lý Meta AI đang mở rộng ra hơn 12 thị trường bên ngoài Mỹ với bản cập nhật, gồm cả Úc, Canada, Singapore, Nigeria và Pakistan.
Chris Cox cho biết Meta Platforms "vẫn đang tìm cách phù hợp để thực hiện điều này ở châu Âu", nơi các quy tắc về quyền riêng tư nghiêm ngặt hơn và Đạo luật AI sắp ra mắt sẵn sàng áp đặt các yêu cầu như tiết lộ dữ liệu đào tạo mô hình AI.
Nhu cầu dữ liệu ngày càng tăng cho các mô hình AI tạo sinh đã trở thành vấn đề gây căng thẳng chính trong quá trình phát triển công nghệ.
Mark Zuckerberg (Giám đốc điều hành Meta Platforms) đã đề cập đến sự cạnh tranh với OpenAI trong một video, trong đó ông gọi Meta AI là "trợ lý AI thông minh nhất mà bạn có thể sử dụng miễn phí".
Mark Zuckerberg cho biết hai phiên bản nhỏ hơn của Llama 3 đang được phát hành, với 8 tỉ tham số và 70 tỉ tham số, cao hơn các mô hình AI miễn phí khác về điểm chuẩn hiệu suất thường được sử dụng để đánh giá chất lượng mô hình. Ông nói phiên bản lớn nhất của Llama 3 vẫn đang được đào tạo, với 400 tỉ tham số.
Nathan Benaich, người sáng lập Air Street Capital - công ty đầu tư mạo hiểm tập trung vào AI, nhận xét rằng những kết quả đó "chắc chắn là ấn tượng", nhưng cũng cho thấy khoảng cách hiệu suất ngày càng tăng giữa các mô hình miễn phí và độc quyền.
Các nhà phát triển từng phàn nàn rằng phiên bản Llama 2 trước đó của Meta Platforms không hiểu được ngữ cảnh cơ bản. Google cũng gặp phải vấn đề tương tự và gần đây tạm dừng sử dụng trình tạo hình ảnh Gemini AI sau khi nó bị chỉ trích vì đưa ra mô tả không chính xác về màu da các nhân vật lịch sử.
Meta Platforms cho biết đã giảm bớt những vấn đề đó trong Llama 3 bằng cách sử dụng "dữ liệu chất lượng cao" để mô hình nhận ra sắc thái. Công ty không đề cập chi tiết về các bộ dữ liệu được sử dụng, nhưng cho biết đã nạp dữ liệu vào Llama 3 nhiều gấp 7 lần so với Llama 2.
Khi chạy đua để phát triển AI mạnh mẽ hơn, các hãng công nghệ lớn khác đang tìm cách tìm nguồn càng nhiều nội dung càng tốt để đào tạo các mô hình AI của mình nhằm đạt được kết quả chất lượng tốt hơn.
OpenAI, Google, Meta Platforms, Microsoft, Apple, Amazon ban đầu sử dụng miễn phí dữ liệu lấy từ internet để đào tạo các mô hình AI tạo sinh có thể bắt chước khả năng sáng tạo của con người. Họ nói rằng làm như vậy vừa hợp pháp vừa có đạo đức, dù phải đối mặt với các vụ kiện từ nhiều chủ sở hữu bản quyền về hành vi này.
Ngoài ra, các hãng công nghệ lớn cũng đang âm thầm trả tiền cho nội dung bị ẩn sau tường phí và màn hình đăng nhập, dẫn đến hoạt động giao dịch ngầm về mọi thứ, từ nhật ký trò chuyện đến ảnh cá nhân bị lãng quên từ lâu trên các ứng dụng mạng xã hội cũ.
Edward Klaris từ công ty luật Klaris Law nói: “Đang có một cuộc chạy đua để tìm đến những chủ sở hữu bản quyền có bộ sưu tập riêng tư về những thứ không thể thu thập tự động”. Klaris Law tiết lộ rằng đang tư vấn cho chủ sở hữu nội dung về các giao dịch trị giá hàng chục triệu USD cấp phép về ảnh, video và sách để đào tạo AI.
Meta ra mắt chip AI thế hệ mới để giảm phụ thuộc Nvidia
Hôm 10.4, Meta Platforms đã tiết lộ thông tin chi tiết về chip tăng tốc trí tuệ nhân tạo (AI) nội bộ mang tên MTIA (Meta Training and Inference Accelerator).
Đầu năm nay, Reuters đưa tin Meta Platforms đã lên kế hoạch triển khai phiên bản mới của chip trung tâm dữ liệu tùy chỉnh để giải quyết lượng sức mạnh tính toán ngày càng tăng cần thiết để chạy các sản phẩm AI trên Facebook, Instagram và WhatsApp. Chip này, có tên nội bộ là Artemis, sẽ giúp Meta Platforms giảm sự phụ thuộc vào chip AI Nvidia cũng như giảm chi phí dùng năng lượng nói chung.
Meta Platforms viết trong một bài đăng trên blog: “Kiến trúc của chip này về cơ bản tập trung vào việc cung cấp sự cân bằng phù hợp giữa tính toán, băng thông bộ nhớ và dung lượng bộ nhớ để phục vụ các mô hình xếp hạng và đề xuất”.
MTIA là một phần trong nỗ lực tùy chỉnh chip của công ty, gồm cả việc xem xét các hệ thống phần cứng khác. Ngoài việc xây dựng chip và phần cứng, Meta Platforms còn đầu tư đáng kể vào việc phát triển phần mềm cần thiết để khai thác sức mạnh của cơ sở hạ tầng theo cách hiệu quả nhất.
TSMC (hãng sản xuất chip theo hợp đồng số 1 thế giới) sẽ sản xuất chip MTIA trên quy trình 5 nanomet của mình. Meta Platforms cho biết MTIA có khả năng đạt hiệu suất gấp ba lần so với chip thế hệ đầu tiên.
Chip MTIA đã được triển khai trong trung tâm dữ liệu và tham gia phục vụ các ứng dụng AI. Meta Platforms cho biết họ có một số chương trình đang được tiến hành "nhằm mở rộng phạm vi MTIA, gồm cả hỗ trợ khối lượng công việc AI tạo sinh".
Thế nhưng, công ty mẹ Facebook cũng chi hàng tỉ USD để mua chip AI của Nvidia và các hãng khác. Mark Zuckerberg cho biết công ty có kế hoạch mua khoảng 350.000 chip AI H100 từ Nvidia. Ông nói kết hợp với các nhà cung cấp khác, Meta Platforms có kế hoạch tích lũy số lượng tương đương 600.000 H100 trong năm 2024.