Meta Platforms muốn người dùng thỏa sức tưởng tượng khi tạo ảnh với Imagine.
Nhịp đập khoa học

Trải nghiệm Imagine, trình tạo ảnh AI cập nhật nội dung theo thời gian thực của Meta

Sơn Vân - Ảnh chụp màn hình 21/04/2024 06:55

Meta Platforms muốn người dùng thỏa sức tưởng tượng khi tạo ảnh với Imagine.

Cách đây vài ngày, Meta Platforms đã phát hành Imagine, tính năng AI giúp tạo hình ảnh với nội dung cập nhật theo thời gian thực khi người dùng thay đổi gợi ý. Imagine được tích hợp vào trợ lý ảo Meta AI.

Công ty đang triển khai phiên bản beta Imagine cho người dùng trên WhatsApp và trang web Meta AI tại địa chỉ https://ai.meta.com.

Meta AI hiện khả dụng ở 13 thị trường bên ngoài Mỹ, gồm Úc, Canada, Ghana, Jamaica, Malawi, New Zealand, Nigeria, Pakistan, Singapore, Nam Phi, Uganda, Zambia và Zimbabwe. Vì vậy, nếu muốn trải nghiệm Meta AI nói chung hay Imagine nói riêng lúc này, người dùng ở Việt Nam cần nhờ ứng dụng chuyển IP sang Mỹ hoặc 1 trong các nước nêu trên.

Sau khi vào trang web https://ai.meta.com, bạn bấm nút Try Meta AI để thử nghiệm trợ lý ảo của Meta Platforms, rồi đăng nhập tài khoản Facebook của mình.

Muốn dùng tính năng tạo ảnh AI trong thời gian thực, người dùng chỉ cần gõ từ Imagine vào khung ở giữa màn hình rồi nhập thêm mô tả về hình ảnh muốn thấy. Hiện trợ lý ảo Meta AI chỉ hỗ trợ nhập bằng tiếng Anh. Chẳng hạn, bạn gõ Imagine beautiful girl để tạo ra hình ảnh cô gái xinh đẹp bằng AI.

trai-nghiem-imagine-trinh-tao-anh-ai-cap-nhat-noi-dung-theo-thoi-gian-thuc-cua-meta3.jpg

Hình ảnh sẽ thay đổi theo thời gian thực với một hay vài chữ cái mà bạn gõ tiếp theo. Chẳng hạn, Imagine sẽ tạo ra hình ảnh cô gái xinh đẹp người châu Á khi bạn sửa mô tả thành Imagine beautiful asian girl.

trai-nghiem-imagine-trinh-tao-anh-ai-cap-nhat-noi-dung-theo-thoi-gian-thuc-cua-meta-3-.jpg

Nếu hài lòng với nội dung do Imagine tạo, bạn bấm nút mũi tên màu xanh hướng lên để xuất ra 4 ảnh khác nhau liên quan đến những gì vừa mô tả. Tiếp theo, bạn nhấp vào từng ảnh để xem qua một lượt.

trai-nghiem-imagine-trinh-tao-anh-ai-cap-nhat-noi-dung-theo-thoi-gian-thuc-cua-meta-2-.jpg

Sau đó, bạn có thể chỉnh sửa ảnh bằng mô tả văn bản (bấm nút Edit) và tạo hoạt cảnh chuyển động cho từng ảnh dạng GIF (bấm nút Animate). Trên mỗi ảnh do Imagine tạo ra đều có logo chìm của Meta Platforms phía dưới góc trái.

Imagine được xây dựng dựa trên Llama 3, mô hình ngôn ngữ lớn nguồn mở mới nhất mà Meta Platforms cho biết tạo ra hình ảnh "sắc nét hơn và chất lượng cao hơn", đồng thời "có khả năng đưa văn bản vào hình ảnh tốt hơn".

Hôm 19.4, Meta Platforms đã ra mắt phiên bản đầu tiên của Llama 3 và Imagine. Động thái này diễn ra khi công ty mẹ Facebook cố chạy đua để bắt kịp OpenAI, công ty dẫn đầu thị trường AI tạo sinh.

Meta Platforms quảng cáo Meta AI là trợ lý ảo thông minh nhất trong số các sản phẩm miễn phí cùng loại. Theo công ty, Meta AI thể hiện tốt hơn về mặt lập luận, tạo mã lập trình và viết văn sáng tạo so với dịch vụ của đối thủ như Google và Mistral AI (công ty khởi nghiệp của Pháp).

Meta AI vừa được cập nhật sẽ đóng vai trò nổi bật hơn trong các ứng dụng Facebook, Instagram, WhatsApp và Messenger của Meta Platforms, cũng như trên một website độc lập mới, giúp gã khổng lồ truyền thông xã hội cạnh tranh trực tiếp với ChatGPT, sản phẩm đột phá của OpenAI do Microsoft hậu thuẫn.

Meta Platforms đang nỗ lực đưa các sản phẩm AI tạo sinh tới hàng tỉ người dùng nhằm thách thức vị trí dẫn đầu của OpenAI về công nghệ. Điều này liên quan đến việc Meta Platforms đại tu cơ sở hạ tầng máy tính tốn kém và hợp nhất các nhóm nghiên cứu và sản phẩm riêng biệt trước đây.

Gã khổng lồ truyền thông xã hội đã công khai phát hành mô hình Llama để các nhà phát triển xây dựng ứng dụng AI sử dụng như một phần trong nỗ lực bắt kịp OpenAI, vì một tùy chọn miễn phí mạnh mẽ có thể cản trở kế hoạch kiếm doanh thu từ công nghệ độc quyền của đối thủ cạnh tranh. Chiến lược này đã gây ra lo ngại về tính an toàn từ những nhà phê bình cảnh giác với thứ nguy hiểm mà kẻ xấu có thể xây dựng bằng Llama.

Chris Cox, Giám đốc sản phẩm Meta Platforms, nói công ty đã trang bị cho Llama 3 khả năng tạo mã lập trình mới và cung cấp cho nó hình ảnh cũng như văn bản trong quá trình đào tạo lần này, dù hiện tại mô hình ngôn ngữ lớn mới sẽ chỉ xuất ra văn bản.

Ông nói thêm, khả năng lý luận nâng cao hơn, như lập kế hoạch nhiều bước dài hơn, sẽ có trong các phiên bản Llama tiếp theo. Trong các bài đăng trên blog, Meta Platforms cho biết những phiên bản Llama được lên kế hoạch phát hành vài tháng tới cũng sẽ có khả năng "đa phương thức", nghĩa là có thể tạo ra cả văn bản và hình ảnh.

Chris Cox nói: “Mục tiêu cuối cùng là giúp bạn giảm bớt những việc lặt vặt, chỉ giúp cuộc sống của bạn dễ dàng hơn, dù đó là tương tác với các doanh nghiệp, viết điều gì đó hay lên kế hoạch cho một chuyến đi”.

Chris Cox cho biết việc đưa hình ảnh vào chương trình đào tạo Llama 3 sẽ cải thiện khả năng của kính thông minh Ray-Ban Meta, với bản cập nhật sẽ được tung ra trong năm nay. Đây là một sản phẩm được sản xuất bởi hãng kính Essilor Luxoticca, cho phép kích hoạt Meta AI để xác định các đồ vật mà người đeo nhìn thấy và trả lời các câu hỏi về chúng.

Ngoài ra, Meta Platforms đã công bố hợp tác với Google để đưa kết quả tìm kiếm thời gian thực vào phản hồi của trợ lý Meta AI, bổ sung cho thỏa thuận hiện có với công cụ tìm kiếm Bing từ Microsoft.

Meta AI hiện được mở rộng sang 13 thị trường bên ngoài Mỹ, gồm Úc, Canada, Ghana, Jamaica, Malawi, New Zealand, Nigeria, Pakistan, Singapore, Nam Phi, Uganda, Zambia và Zimbabwe.

Chris Cox cho biết Meta Platforms "vẫn đang tìm cách phù hợp để thực hiện điều này ở châu Âu", nơi các quy tắc về quyền riêng tư nghiêm ngặt hơn và Đạo luật AI sắp ra mắt sẵn sàng áp đặt các yêu cầu như tiết lộ dữ liệu đào tạo mô hình AI.

Nhu cầu dữ liệu ngày càng tăng cho các mô hình AI tạo sinh đã trở thành vấn đề gây căng thẳng chính trong quá trình phát triển công nghệ.

Mark Zuckerberg (Giám đốc điều hành Meta Platforms) đã đề cập đến sự cạnh tranh với OpenAI trong một video, trong đó ông gọi Meta AI là "trợ lý AI thông minh nhất mà bạn có thể sử dụng miễn phí".

Theo trang Axios, Mark Zuckerberg gọi “tin tức lớn về AI của Meta Platforms là khá phi thường”. Thế nhưng, Meta Platforms vẫn đang cố bắt kịp các đối thủ như OpenAI và Anthropic.

Mark Zuckerberg cho biết hai phiên bản nhỏ hơn của Llama 3 đang được phát hành, với 8 tỉ tham số và 70 tỉ tham số, cao hơn các mô hình AI miễn phí khác về điểm chuẩn hiệu suất thường được sử dụng để đánh giá chất lượng mô hình. Ông nói phiên bản lớn nhất của Llama 3 vẫn đang được đào tạo, với 400 tỉ tham số và khi được phát hành, nó có thể ngang hàng với GPT-4 của OpenAI và Claude 3 Opus của Anthropic.

Nathan Benaich, người sáng lập Air Street Capital - công ty đầu tư mạo hiểm tập trung vào AI, nhận xét rằng những kết quả đó "chắc chắn là ấn tượng", nhưng cũng cho thấy khoảng cách hiệu suất ngày càng tăng giữa các mô hình miễn phí và độc quyền.

Các nhà phát triển từng phàn nàn rằng phiên bản Llama 2 trước đó của Meta Platforms không hiểu được ngữ cảnh cơ bản. Google cũng gặp phải vấn đề tương tự và gần đây tạm dừng sử dụng trình tạo hình ảnh Gemini AI sau khi nó bị chỉ trích vì đưa ra mô tả không chính xác về màu da các nhân vật lịch sử.

Meta Platforms cho biết đã giảm bớt những vấn đề đó trong Llama 3 bằng cách sử dụng "dữ liệu chất lượng cao" để mô hình nhận ra sắc thái. Công ty không đề cập chi tiết về các bộ dữ liệu được sử dụng, nhưng cho biết đã nạp dữ liệu vào Llama 3 nhiều gấp 7 lần so với Llama 2.

Khi chạy đua để phát triển AI mạnh mẽ hơn, các hãng công nghệ lớn khác đang tìm cách tìm nguồn càng nhiều nội dung càng tốt để đào tạo các mô hình AI của mình nhằm đạt được kết quả chất lượng tốt hơn.

OpenAI, Google, Meta Platforms, Microsoft, Apple, Amazon ban đầu sử dụng miễn phí dữ liệu lấy từ internet để đào tạo các mô hình AI tạo sinh có thể bắt chước khả năng sáng tạo của con người. Họ nói rằng làm như vậy vừa hợp pháp vừa có đạo đức, dù phải đối mặt với các vụ kiện từ nhiều chủ sở hữu bản quyền về hành vi này.

Ngoài ra, các hãng công nghệ lớn cũng đang âm thầm trả tiền cho nội dung bị ẩn sau tường phí và màn hình đăng nhập, dẫn đến hoạt động giao dịch ngầm về mọi thứ, từ nhật ký trò chuyện đến ảnh cá nhân bị lãng quên từ lâu trên các ứng dụng mạng xã hội cũ.

Edward Klaris từ công ty luật Klaris Law nói: “Đang có một cuộc chạy đua để tìm đến những chủ sở hữu bản quyền có bộ sưu tập riêng tư về những thứ không thể thu thập tự động”. Klaris Law tiết lộ rằng đang tư vấn cho chủ sở hữu nội dung về các giao dịch trị giá hàng chục triệu USD cấp phép về ảnh, video và sách để đào tạo AI.

Bài liên quan
2 bộ tộc kiện Meta, Google, TikTok, Snapchat vì tỉ lệ tự tử của thanh thiếu niên bản địa cao gấp 4 lần
Hai bộ tộc ở Mỹ vừa kiện Meta, Google, TikTok và Snapchat cáo buộc những gã khổng lồ truyền thông xã hội này góp phần vào tỉ lệ tự tử cao ở thanh thiếu niên bản địa bằng cách cố tình lôi kéo trẻ em vào nền tảng của họ.

(0) Bình luận
Nổi bật Một thế giới
Bộ trưởng Đào Ngọc Dung nói gì về vấn đề nhạy cảm nhất, phức tạp nhất trong dự luật BHXH?
5 giờ trước Theo dòng thời sự
Về quy định hưởng bảo hiểm xã hội (BHXH) một lần, Bộ trưởng Đào Ngọc Dung cho biết đây là vấn đề nhạy cảm nhất trong dự thảo luật và cũng là vấn đề phức tạp nhất.
Đừng bỏ lỡ
Mới nhất
POWERED BY ONECMS - A PRODUCT OF NEKO
Trải nghiệm Imagine, trình tạo ảnh AI cập nhật nội dung theo thời gian thực của Meta