Hotline quảng cáo: 076 4575985 Hotline nội dung: 0934.999945

Nhịp đập khoa học

Movie Gen - mô hình AI tạo video từ văn bản được Meta quảng cáo tốt hơn Sora của OpenAI

Sơn Vân • 22:28 04/10/2024

Meta Platforms vừa công bố Movie Gen, mô hình trí tuệ nhân tạo (AI) mới có thể tạo ra các đoạn video và âm thanh sống động dựa trên yêu cầu bằng văn bản từ người dùng.

Meta tuyên bố Movie Gen có thể cạnh tranh với các công cụ từ các công ty khởi nghiệp hàng đầu trong lĩnh vực truyền thông như OpenAI và ElevenLabs.

Các video mẫu do Movie Gen tạo ra cho thấy các cảnh động vật bơi và lướt sóng.

Ngoài ra, Movie Gen có thể tạo ra các video trong đó sử dụng ảnh chụp người dùng và ghép vào tình huống hoạt động cụ thể, chẳng hạn vẽ tranh trên một tấm vải dày.

Movie Gen có khả năng tạo ra nhạc nền và hiệu ứng âm thanh phù hợp với nội dung của video, theo Meta Platforms.

Chưa hết, mô hình AI này cũng có thể được sử dụng để chỉnh sửa video hiện có. Trong một video, Meta đã sử dụng Movie Gen để thêm pom-pom vào tay người đàn ông đang chạy một mình trên sa mạc.

Pom-pom là vật trang trí làm từ sợi bông, lông hoặc chất liệu khác, thường có hình dạng tròn và bông xù. Pom-pom thường được dùng trong các hoạt động cổ vũ, đặc biệt là trong các đội cổ động viên. Những người cổ vũ thường cầm pom-pom trong tay và lắc chúng để tạo hiệu ứng thu hút sự chú ý và thể hiện tinh thần cổ vũ sôi nổi.

movie-gen-mo-hinh-ai-tao-video-tu-van-ban-duoc-meta-quang-cao-tot-hon-sora-cua-openai.jpg — Movie Gen thêm vật thể hoặc thay đổi hình dạng người đàn ông chạy trên sa mạc

Ở một video khác, Movie Gen đã thay đổi bãi đậu xe mà người đàn ông đang trượt ván từ mặt đất khô thành vũng nước bắn tung tóe.

Các video được tạo bởi Movie Gen có thời lượng 16 giây, còn âm thanh có thể kéo dài tới 45 giây, Meta Platforms cho biết.

Chủ sở hữu Facebook đã chia sẻ dữ liệu một số thử nghiệm mù chỉ ra rằng Movie Gen hoạt động tốt hơn so với sản phẩm từ công ty khởi nghiệp OpenAI, Runway, ElevenLabs và Kling.

Thử nghiệm mù (blind test) là phương pháp thử nghiệm mà người tham gia không biết trước các chi tiết cụ thể về sản phẩm hoặc đối tượng mà họ đang đánh giá, để đảm bảo tính khách quan,

Thông báo về Movie Gen của Meta Platforms được đưa ra trong bối cảnh Hollywood đang vật lộn với việc khai thác công nghệ video AI tạo sinh trong năm nay, sau khi OpenAI hồi tháng 2 giới thiệu cách mô hình Sora có thể tạo ra video giống phim điện ảnh từ gợi ý bằng văn bản.

Các kỹ thuật viên trong ngành giải trí háo hức sử dụng những công cụ như vậy để nâng cao và đẩy nhanh quá trình làm phim. Trong khi một số người khác lo ngại về việc chấp nhận hệ thống AI có vẻ đã được huấn luyện trên các tác phẩm có bản quyền mà không có sự cho phép.

Nhiều nhà làm luật cũng đã nêu lên mối lo ngại về việc các video giả do AI tạo ra (hay deepfake) đang được sử dụng trong cuộc bầu cử trên khắp thế giới, gồm cả ở Mỹ, Pakistan, Ấn Độ và Indonesia.

Các phát ngôn viên của Meta Platforms cho biết công ty khó có thể phát hành Movie Gen để các nhà phát triển sử dụng công khai, như từng làm với loạt mô hình ngôn ngữ lớn Llama. Các phát ngôn viên nói rằng Meta Platforms cân nhắc các rủi ro riêng cho từng mô hình AI và chưa có thông tin chi tiết về đánh giá của công ty với riêng Movie Gen.

Thay vào đó, họ cho biết Meta Platforms đang làm việc trực tiếp với cộng đồng giải trí cùng các nhà sáng tạo nội dung khác về việc sử dụng Movie Gen và sẽ tích hợp nó vào các sản phẩm Meta Platforms vào thời điểm nào đó trong năm 2025.

"Movie Gen hiện chỉ là một ý tưởng nghiên cứu AI và ngay ở giai đoạn đầu này, sự an toàn vẫn là ưu tiên hàng đầu như với tất cả công nghệ AI tạo sinh của chúng tôi", một đại diện Meta Platforms trả lời các câu hỏi từ trang TechCrunch.

Meta Platforms đã sử dụng kết hợp dữ liệu được cấp phép và dữ liệu công khai để phát triển Movie Gen, theo bài đăng trên blog và tài liệu nghiên cứu về công cụ do công ty công bố.

Hồi tháng 3, OpenAI đã gặp gỡ các giám đốc và nhà đại diện Hollywood để thảo luận về khả năng hợp tác liên quan đến Sora, dù chưa có thỏa thuận nào được báo cáo là đã thành công.

Tờ Financial Times đưa tin Sam Altman (Giám đốc điều hành OpenAI) và Brad Lightcap (Giám đốc vận hành OpenAI) đã tổ chức hàng loạt cuộc họp về Sora với các nhà điều hành Hollywood từ công ty Paramount, Universal và Warner Bros Discovery.

Sam Altman và Brad Lightcap đã yêu cầu lãnh đạo các hãng phim giúp họ triển khai Sora, theo những người tham dự cuộc họp.

Một số hãng phim sẵn sàng sử dụng Sora trong sản xuất, nói rằng nó có thể tiết kiệm thời gian và tiền bạc, nhưng OpenAI không cố gắng ký kết các thỏa thuận chính thức, theo nguồn tin của Financial Times.

Lo ngại về cách tiếp cận của OpenAI gia tăng vào tháng 5 khi nữ diễn viên Scarlett Johansson tố cáo công ty bắt chước giọng nói cô mà không được phép.

Lions Gate Entertainment, hãng giải trí đứng sau phim The Hunger Games và Twilight, gần đây công bố sẽ cho phép Runway truy cập vào thư viện phim và truyền hình của mình để huấn luyện mô hình AI. Đổi lại, Lions Gate Entertainment và các nhà làm phim của họ có thể sử dụng mô hình AI này để hỗ trợ công việc.

Hôm 26.9, Meta Platforms giới thiệu nguyên mẫu đầu tiên của kính thực tế tăng cường (AR) có tên Orion tại hội nghị Connect thường niên, khi công ty mẹ Facebook phác thảo tham vọng của mình về các sản phẩm sẽ đưa thế giới ảo vào thế giới thực.

"Đây là thế giới vật lý với các hình ảnh ba chiều (3D) được phủ lên trên đó", Giám đốc điều hành Meta Platforms - Mark Zuckerberg nói sau khi rút chiếc kính đen dày ra khỏi hộp kim loại.

"Hiện tại, tôi nghĩ cách đúng đắn để nhìn nhận Orion là như một cỗ máy thời gian. Những chiếc kính này tồn tại, chúng thật tuyệt vời và là cái nhìn thoáng qua về tương lai mà tôi nghĩ sẽ rất thú vị", tỷ phú 40 tuổi người Mỹ phát biểu.

Kính Orion làm bằng hợp kim magiê và được cung cấp sức mạnh bởi silicon tùy chỉnh do Meta Platforms thiết kế. Người dùng sẽ có thể tương tác với kính Orion thông qua theo dõi bằng tay, giọng nói và giao diện thần kinh dựa trên cổ tay. Mark Zuckerberg cho biết Meta Platforms có kế hoạch làm cho kính Orion nhỏ hơn, đẹp hơn và chi phí thấp hơn trước khi phát hành cho người tiêu dùng sau này.

Các hãng công nghệ lớn phát triển thiết bị AR trong nhiều năm, nhưng một số sản phẩm đáng chú ý đã thất bại, chẳng hạn kính Google Glass.

Mark Zuckerberg định vị công nghệ AR như một kiệt tác khi chuyển hướng công ty truyền thông xã hội lớn nhất thế giới sang xây dựng các hệ thống metaverse nhập vai vào năm 2021. Tuy nhiên, việc cung cấp sản phẩm đã bị cản trở bởi chi phí phát triển cao và các rào cản công nghệ.

Paolo Pescatore, nhà phân tích tại hãng PP Foresight, nói không có nghi ngờ gì về tham vọng của Meta Platforms trong việc tạo ra các sản phẩm thực tế ảo (VR) và AR trở nên phổ biến với giá cả phải chăng nhất có thể. Thế nhưng, ông nói thêm rằng người dùng "vẫn e ngại với AI" và cần được thuyết phục.

Meta Platforms đặt mục tiêu giao chiếc kính AR thương mại đầu tiên đến tay người tiêu dùng vào năm 2027, thời điểm mà những đột phá về mặt kỹ thuật sẽ giúp giảm chi phí sản xuất, một nguồn tin cho biết trước sự kiện.

Mark Zuckerberg không trình diễn trực tiếp khả năng của kính Orion trong hội nghị Connect, thay vào đó ông phát một video cho thấy nhiều người phản ứng như thế nào với thiết bị này khi họ dùng thử. Video cho thấy vài hình ảnh thoáng qua về tin nhắn văn bản, hình ảnh được hiển thị qua kính và Jensen Huang (Giám đốc điều hành Nvidia) là cái tên nổi bật trong số những người thử nghiệm.

Sản phẩm gần giống Orion nhất hiện tại là kính thông minh Ray-Ban Meta, ban đầu không được quan tâm nhiều nhưng đã gây sự chú ý vào năm ngoái sau khi được Meta Platforms bổ sung trợ lý AI. Công ty mẹ Facebook đã công bố những cải tiến về AI cho kính Ray-Ban Meta trong năm nay, chẳng hạn giúp người dùng có thể quét mã QR và phát nhạc từ Spotify để phản hồi gợi ý bằng giọng nói.

Cuối năm nay, Meta Platforms có kế hoạch bổ sung khả năng tạo video và dịch ngôn ngữ theo thời gian thực giữa tiếng Anh và tiếng Pháp, tiếng Ý hoặc tiếng Tây Ban Nha cho kính Ray-Ban Meta.

Mark Zuckerberg đã trò chuyện trực tiếp với võ sĩ MMA Brandon Moreno (Mexico) để trình diễn công cụ ngôn ngữ, trong đó chiếc kính có thể dịch từ tiếng Anh sang tiếng Tây Ban Nha và ngược lại.

Tại hội nghị Connect, Meta Platforms giới thiệu các khả năng chatbot AI mới cho các dịch vụ của mình và chiếc kính thực tế hỗn hợp Quest mới.

Ngoài ra, Meta Platforms còn trình làng Quest 3S, phiên bản cấp thấp của dòng kính thực tế hỗn hợp Quest, có giá khởi điểm 300 USD, đồng thời giảm giá Quest 3 (bán ra năm ngoái).

Bài liên quan

CEO Google DeepMind: Trình chuyển văn bản thành video Lumiere khó sánh kịp Sora của OpenAI

Demis Hassabis cho rằng Sora, mô hình trí tuệ nhân tạo (AI) chuyển văn bản thành video của OpenAI, tiên tiến hơn công cụ Lumiere do Google DeepMind của ông sản xuất.

Đọc tiếp

Đằng sau việc CEO Nvidia ca ngợi kính thực tế tăng cường Orion của Meta

Giám đốc công nghệ Meta nêu lý do Mark Zuckerberg muốn giới thiệu kính AR 10.000 USD mà người dùng chưa thể mua

Kính AR của Meta cho thấy Apple đã lạc lối với Vision Pro

(0) Bình luận

Xếp theo:

Đọc thêm Nhịp đập khoa học

Nổi bật Một thế giới

Cuộc họp thủ tướng ba nước Việt Nam, Lào, Campuchia

3 phút trước Sự kiện

Chiều 22.2, nhân dịp tham dự Cuộc gặp giữa ba người đứng đầu ba Đảng Việt Nam, Campuchia và Lào tại TP.HCM, Thủ tướng Chính phủ Phạm Minh Chính đã có cuộc gặp làm việc với Thủ tướng Campuchia Hun Manet và Thủ tướng Lào Sonexay Siphandone nhằm quán triệt các nội dung thỏa thuận tại kết luận của cuộc gặp giữa ba người đứng đầu ba đảng.

TP.HCM: Người nhận hỗ trợ 2,7 tỉ đồng do sắp xếp bộ máy phải đáp ứng điều kiện gì?

Kỳ họp lần thứ 21 (kỳ họp chuyên đề), HĐND TP.HCM chiều 20.2 đã thông qua Nghị quyết về chế...
Kiện toàn Ban Chỉ đạo xây dựng Luật KH-CN (sửa đổi): Phó thủ tướng Bùi Thanh Sơn làm trưởng ban

Thủ tướng Chính phủ Phạm Minh Chính vừa ký Quyết định số 380/QĐ-TTg ngày 20.2.2025 về việc...
Thủ tướng yêu cầu khắc phục hậu quả vụ TNGT đặc biệt nghiêm trọng tại Sơn La

Ngày 22.2, Thủ tướng Phạm Minh Chính đã có Công điện chỉ đạo khắc phục hậu quả vụ tai nạn giao...

Đừng bỏ lỡ

Thành công nhờ... không học đạo diễn chính quy

21 phút trước Văn hóa

Lý Hải, Trấn Thành, Thu Trang là những đạo diễn thành công với điện ảnh, ít nhất là về mặt doanh thu phòng vé khi phim thu về trên 100 tỉ.
Những khác biệt chính của iPhone 16e và iPhone 16: Nên chọn máy nào?

một giờ trước Thế giới số

iPhone 16e là lựa chọn kinh tế hơn iPhone 16, nhưng đi kèm với một số hạn chế nhất định.
Ai mì Quảng không - ca khúc hay nhất về món ăn của một vùng quê

2 giờ trước Văn hóa

Có thể nói ca khúc Ai mì quảng không của cố nhạc sĩ Trần Phú Thiên là bài hát hay nhất viết về ẩm thực vùng miền.
Kiểm định cầu Đồng Nai, hạn chế lưu thông

2 giờ trước Hạ tầng và bất động sản

Ngày 22.2, Khu Quản lý đường bộ IV (Cục Đường bộ Việt Nam) cho biết đang triển khai công tác kiểm định cầu Đồng Nai cũ theo hướng từ TP.HCM đi Đồng Nai.
'Áo giáp' cho tài xế công nghệ

4 giờ trước Góc bình luận

Nhiều vụ việc xâm phạm sức khỏe, tính mạng và tài sản của shipper, tài xế công nghệ trong thời gian gần đây cho thấy dường như lái xe công nghệ cũng là “nghề nguy hiểm”, nhất là khi nữ giới cầm lái.

Mới nhất

Cuộc họp thủ tướng ba nước Việt Nam, Lào, Campuchia

3 phút trước Sự kiện

Chiều 22.2, nhân dịp tham dự Cuộc gặp giữa ba người đứng đầu ba Đảng Việt Nam, Campuchia và Lào tại TP.HCM, Thủ tướng Chính phủ Phạm Minh Chính đã có cuộc gặp làm việc với Thủ tướng Campuchia Hun Manet và Thủ tướng Lào Sonexay Siphandone nhằm quán triệt các nội dung thỏa thuận tại kết luận của cuộc gặp giữa ba người đứng đầu ba đảng.
TP.HCM: Người nhận hỗ trợ 2,7 tỉ đồng do sắp xếp bộ máy phải đáp ứng điều kiện gì?

3 giờ trước Theo dòng thời sự

Kỳ họp lần thứ 21 (kỳ họp chuyên đề), HĐND TP.HCM chiều 20.2 đã thông qua Nghị quyết về chế độ hỗ trợ thêm đối với cán bộ, công chức, viên chức, người lao động khi thực hiện sắp xếp tổ chức bộ máy.
Kiện toàn Ban Chỉ đạo xây dựng Luật KH-CN (sửa đổi): Phó thủ tướng Bùi Thanh Sơn làm trưởng ban

5 giờ trước Theo dòng thời sự

Thủ tướng Chính phủ Phạm Minh Chính vừa ký Quyết định số 380/QĐ-TTg ngày 20.2.2025 về việc kiện toàn Ban Chỉ đạo xây dựng Luật Khoa học và Công nghệ (KH-CN) (sửa đổi).
Chỉ 17% công dân Nhật có hộ chiếu

6 giờ trước Du lịch

Hãng AFP dẫn lời Bộ Ngoại giao Nhật Bản cho biết tính đến tháng 12.2024, số hộ chiếu hợp lệ đang lưu hành là 21,6 triệu - tương đương 17,5% dân số đất nước.
Thủ tướng yêu cầu khắc phục hậu quả vụ TNGT đặc biệt nghiêm trọng tại Sơn La

6 giờ trước Theo dòng thời sự

Ngày 22.2, Thủ tướng Phạm Minh Chính đã có Công điện chỉ đạo khắc phục hậu quả vụ tai nạn giao thông (TNGT) đặc biệt nghiêm trọng tại huyện Yên Châu, tỉnh Sơn La.

Xem thêm

Cơ quan chủ quản: Hội Thông tin Khoa học và Công nghệ Việt Nam.

ĐC: 24 Lý Thường Kiệt, Hàng Bài, Hoàn Kiếm, Hà Nội.

ĐT: 024.38256203

Hotline nội dung : 0934999945

Tổng biên tập: Hoàng Đại Thanh

Tổng Thư ký Tòa soạn: Nguyễn Đình Mười

Giấy phép số 77/GP-BTTTT do Bộ Thông tin và Truyền thông cấp ngày 26 tháng 2 năm 2020.

Tòa nhà SIMCO Sông Đà, Tiểu KĐT mới Vạn Phúc, Phường Vạn Phúc, Quận Hà Đông, TP. Hà Nội

ĐT: 0984708866

TPHCM: 345/134 Trần Hưng Đạo, phường Cầu Kho, Quận 1

ĐT: 028.38389241

Email: toasoan@1thegioi.vn

Hotline quảng cáo: 0764575985

Email quảng cáo: sales@1thegioi.vn

Báo giá quảng cáo:

Công ty Cổ phần Truyền thông Một Thế Giới

Movie Gen - mô hình AI tạo video từ văn bản được Meta quảng cáo tốt hơn Sora của OpenAI

CEO Google DeepMind: Trình chuyển văn bản thành video Lumiere khó sánh kịp Sora của OpenAI

Movie Gen

mô hình AI

tạo video từ văn bản

Meta

Sora

OpenAI

Đằng sau việc CEO Nvidia ca ngợi kính thực tế tăng cường Orion của Meta

Giám đốc công nghệ Meta nêu lý do Mark Zuckerberg muốn giới thiệu kính AR 10.000 USD mà người dùng chưa thể mua

Kính AR của Meta cho thấy Apple đã lạc lối với Vision Pro

Đằng sau việc CEO Nvidia ca ngợi kính thực tế tăng cường Orion của Meta

Giám đốc công nghệ Meta nêu lý do Mark Zuckerberg muốn giới thiệu kính AR 10.000 USD mà người dùng chưa thể mua

Kính AR của Meta cho thấy Apple đã lạc lối với Vision Pro

Tesla muốn sản xuất 4 loại pin mới vào năm 2026, cho cả robotaxi sắp ra mắt

TSMC, Samsung và nhiều hãng chip theo dõi nguồn cung thạch anh tinh khiết cao từ Mỹ sau siêu bão Helene

Google nghiên cứu AI có khả năng lý luận giống con người, cố gắng bám đuổi OpenAI

Startup ở thành phố có nhiều quán cà phê nhất cung cấp robot pha chế giúp giảm 90% chi phí vận hành

Tiết kiệm 1.150 tỉ đồng/năm nhờ triển khai sổ sức khỏe điện tử

Thủ tướng: Thiên tai ngày càng khốc liệt, ứng phó với biến đổi khí hậu cần nhanh hơn nữa

Cuộc họp thủ tướng ba nước Việt Nam, Lào, Campuchia

TP.HCM: Người nhận hỗ trợ 2,7 tỉ đồng do sắp xếp bộ máy phải đáp ứng điều kiện gì?

Kiện toàn Ban Chỉ đạo xây dựng Luật KH-CN (sửa đổi): Phó thủ tướng Bùi Thanh Sơn làm trưởng ban

Thủ tướng yêu cầu khắc phục hậu quả vụ TNGT đặc biệt nghiêm trọng tại Sơn La

Thành công nhờ... không học đạo diễn chính quy

Những khác biệt chính của iPhone 16e và iPhone 16: Nên chọn máy nào?

Ai mì Quảng không - ca khúc hay nhất về món ăn của một vùng quê

Kiểm định cầu Đồng Nai, hạn chế lưu thông

'Áo giáp' cho tài xế công nghệ

Cuộc họp thủ tướng ba nước Việt Nam, Lào, Campuchia

TP.HCM: Người nhận hỗ trợ 2,7 tỉ đồng do sắp xếp bộ máy phải đáp ứng điều kiện gì?

Kiện toàn Ban Chỉ đạo xây dựng Luật KH-CN (sửa đổi): Phó thủ tướng Bùi Thanh Sơn làm trưởng ban

Chỉ 17% công dân Nhật có hộ chiếu

Thủ tướng yêu cầu khắc phục hậu quả vụ TNGT đặc biệt nghiêm trọng tại Sơn La

Lực lượng Nga tiến gần đến mỏ đất hiếm lớn của Ukraine

Toàn bộ dòng iPhone 17 sẽ sở hữu màn hình OLED tốt nhất của Samsung mà Galaxy S25 Ultra không có

Nữ tướng dẫn dắt việc phát triển ChatGPT lập startup AI mới, thu hút 20 nhà nghiên cứu OpenAI

Hơn 20 hãng Trung Quốc đua nhau tích hợp AI DeepSeek vào ô tô điện thông minh vì sợ mất thị phần

Elon Musk: Grok-3 vượt Google Gemini, DeepSeek-V3 và GPT-4o trong các bài kiểm tra