Meta Platforms, gã khổng lồ truyền thông xã hội đứng sau Facebook, đang tăng cường nỗ lực trong lĩnh vực trí tuệ nhân tạo (AI) hỗ trợ giọng nói.
Nhịp đập khoa học

Meta đưa các tính năng trò chuyện bằng giọng nói được cải tiến vào mô hình mới Llama 4

Sơn Vân 17:38 08/03/2025

Meta Platforms, gã khổng lồ truyền thông xã hội đứng sau Facebook, đang tăng cường nỗ lực trong lĩnh vực trí tuệ nhân tạo (AI) hỗ trợ giọng nói.

Theo trang Financial Times, Meta Platforms lên kế hoạch giới thiệu các tính năng trò chuyện bằng giọng nói được cải tiến trong Llama 4, mô hình ngôn ngữ lớn mới nhất của mình. Công ty tin rằng tương lai của các tác tử AI sẽ là đàm thoại, thay vì dựa trên văn bản.

Meta Platforms đã đầu tư mạnh vào AI trong hai năm qua, với việc Giám đốc điều hành Mark Zuckerberg công bố kế hoạch chi 60 - 65 tỉ USD vào 2025 để củng cố các dịch vụ AI của mình. Công ty đang tìm cách mở rộng khả năng AI của mình vượt ra ngoài các nền tảng truyền thông xã hội và cân nhắc dùng thử những gói đăng ký cao cấp cho Meta AI (trợ lý AI của mình) cho các mục đích như đặt chỗ và tạo video.

Việc Meta Platforms thúc đẩy AI hỗ trợ giọng nói diễn ra khi công ty cạnh tranh với các gã khổng lồ công nghệ khác trong ngành như OpenAI, Microsoft và Google. Tất cả đều đang chạy đua để thương mại hóa AI và tạo doanh thu từ công nghệ này. Meta Platforms cũng đang khám phá khả năng đưa quảng cáo trả phí hoặc bài đăng được tài trợ vào kết quả tìm kiếm của trợ lý AI.

Khả năng giọng nói là trọng tâm của Meta Platforms, với kế hoạch làm cho cuộc trò chuyện giữa người dùng và mô hình AI trở nên tự nhiên và hai chiều hơn. Meta Platforms muốn người dùng có thể ngắt lời mô hình AI và có cuộc đối thoại trôi chảy hơn, thay vì định dạng hỏi đáp cứng nhắc.

Chris Cox, Giám đốc sản phẩm của Meta Platforms, mô tả Llama 4 sắp ra mắt là "mô hình đa năng" cho phép sử dụng giọng nói tự nhiên thay vì dịch giọng nói thành văn bản. Ông tin rằng khả năng nói chuyện với internet và hỏi bất cứ điều gì là tính năng mạnh mẽ vẫn đang được hiện thực hóa đầy đủ.

Công ty mẹ Facebook đã thảo luận về rào cản với các mô hình AI của mình, gồm cả Llama 4. Meta Platforms đang xem xét liệu có nên giảm bớt các hạn chế về những gì mô hình AI có thể đưa ra hay không.

Việc Meta Platforms thúc đẩy AI hỗ trợ giọng nói phù hợp với chiến lược rộng hơn của công ty là chế tạo headset nhẹ, chẳng hạn kính thông minh Ray Bans, có thể thay thế smartphone làm thiết bị điện toán chính cho người tiêu dùng. Công ty coi tương tác bằng giọng nói là một tính năng chính của các thiết bị này.

meta-dua-cac-tinh-nang-giong-noi-duoc-cai-tien-vao-mo-hinh-moi-llama-4.jpg
Meta mở rộng AI hỗ trợ giọng nói với Llama 4 - Ảnh: Internet

Clara Shih, Giám đốc mảng kinh doanh AI của Meta Platforms, hy vọng sẽ cung cấp tác tử AI cho hàng trăm triệu doanh nghiệp.

"Chúng tôi đang nhanh chóng tiến đến nơi mà mọi doanh nghiệp, từ rất lớn đến rất nhỏ, đều sẽ có một tác tử AI đại diện và hành động thay mặt cho họ, bằng tiếng nói của họ, giống cách các doanh nghiệp ngày nay có trang web và địa chỉ email", Clara Shih nói.

Clara Shih muốn tác tử AI trở nên dễ tiếp cận hơn với các doanh nghiệp nhỏ hiện dựa vào trang Facebook hoặc trang web làm phương tiện chính để thu hút và tương tác với khách hàng.

"Rất sớm thôi, mỗi doanh nghiệp trong số đó sẽ có những AI có thể đại diện cho họ và giúp tự động hóa các tác vụ dư thừa, giúp họ nói lên tiếng nói của mình, tìm thêm khách hàng và cung cấp gần giống như dịch vụ trợ giúp cho từng khách hàng của họ, 24/7", Clara Shih nói thêm.

Tác tử AI là hệ thống hoặc chương trình máy tính được thiết kế để thực hiện các tác vụ tự động bằng cách sử dụng AI. Các tác tử AI có khả năng tương tác với môi trường, thu thập thông tin, xử lý dữ liệu, ra quyết định và thực hiện các hành động dựa trên mục tiêu được đặt ra.

Đặc điểm của một tác tử AI

Tự động: Có khả năng hoạt động độc lập mà không cần sự can thiệp của con người trong suốt quá trình xử lý.

Nhận thức môi trường: Có thể cảm nhận hoặc thu thập dữ liệu từ môi trường thông qua các cảm biến, API, hoặc dữ liệu được cung cấp.

Ra quyết định: Dựa trên các thuật toán hoặc mô hình học máy, tác tử AI có thể phân tích dữ liệu và chọn hành động phù hợp.

Hành động: Tác tử thực hiện các hành động cụ thể để đạt được mục tiêu, ví dụ như gửi thông báo, điều khiển thiết bị, hoặc cập nhật dữ liệu.

Các loại tác tử AI phổ biến

Reactive Agent (tác tử phản ứng): Hoạt động dựa trên các quy tắc đơn giản và phản ứng ngay lập tức với những thay đổi trong môi trường.

Goal-based Agent (tác tử dựa trên mục tiêu): Được thiết kế để đạt được một hoặc nhiều mục tiêu cụ thể thông qua việc lập kế hoạch và hành động.

Learning Agent (tác tử học tập): Sử dụng các kỹ thuật học máy để tự cải thiện hiệu suất và khả năng ra quyết định qua thời gian.

Multi-agent Systems (hệ thống đa tác tử): Một nhóm các tác tử AI hoạt động cùng nhau để giải quyết các nhiệm vụ phức tạp.

Ứng dụng của tác tử AI

Trợ lý ảo: Siri, Alexa, Google Assistant.

Tác tử tìm kiếm: Công cụ thu thập dữ liệu và cung cấp thông tin từ internet.

Tự động hóa công việc: Robot xử lý tài liệu, chatbot trả lời khách hàng.

Điều khiển hệ thống: Tác tử AI trong các hệ thống thông minh như nhà thông minh, ô tô tự hành.

Tác tử AI là một phần quan trọng trong sự phát triển của AI, được ứng dụng rộng rãi trong nhiều lĩnh vực như chăm sóc sức khỏe, giáo dục, dịch vụ khách hàng và công nghiệp.

Cuối tháng 1, Mark Zuckerberg tiết lộ Meta Platforms dự kiến chi từ 60 tỉ đến 65 tỉ USD trong năm 2025 để phát triển cơ sở hạ tầng AI, tham gia làn sóng các hãng công nghệ lớn công bố các khoản đầu tư khổng lồ nhằm tận dụng công nghệ này.

Trên Facebook cá nhân, Mark Zuckerberg vừa tiết lộ những thông tin thú vị liên quan đến Meta Platforms trong năm 2025: "Đây sẽ là một năm mang tính bước ngoặt cho AI. Trong năm 2025, tôi kỳ vọng Meta AI sẽ trở thành trợ lý hàng đầu phục vụ hơn 1 tỉ người, Llama 4 sẽ trở thành mô hình tiên tiến hàng đầu. Chúng tôi sẽ phát triển một kỹ sư AI có khả năng đóng góp ngày càng nhiều mã nguồn cho các nỗ lực nghiên cứu và phát triển của mình.

Để hỗ trợ điều này, Meta đang xây dựng một trung tâm dữ liệu có công suất hơn 2GW, lớn đến mức có thể bao phủ một phần đáng kể của Manhattan (quận có mật độ dân số đông nhất thành phố New York, Mỹ). Chúng tôi sẽ đưa vào hoạt động khoảng 1GW năng lực tính toán trong năm 2025 và kết thúc năm với hơn 1,3 triệu GPU (bộ xử lý đồ họa)".

Meta Platforms là một trong những khách hàng lớn nhất của Nvidia, hãng cung cấp các GPU được thèm muốn.

Ngoài ra, tỷ phú 40 tuổi người Mỹ còn cho biết thêm: "Chúng tôi đang có kế hoạch đầu tư 60 - 65 tỉ USD vào chi phí vốn trong năm nay, đồng thời mở rộng đáng kể các đội ngũ AI. Chúng tôi có đủ nguồn vốn để tiếp tục đầu tư trong những năm tới. Đây là nỗ lực khổng lồ, và trong những năm tới, nó sẽ thúc đẩy các sản phẩm và hoạt động kinh doanh cốt lõi của chúng tôi, mở ra những đổi mới lịch sử và củng cố vị thế dẫn đầu công nghệ của Mỹ".

Các hãng công nghệ lớn đã đầu tư hàng chục tỉ USD để phát triển cơ sở hạ tầng liên quan đến AI sau thành công vang dội của ChatGPT do OpenAI phát triển, làm nổi bật tiềm năng của công nghệ này.

Tổng thống Mỹ Donald Trump hôm 21.1 thông báo rằng OpenAI, SoftBank và Oracle sẽ hợp tác thành lập một liên doanh mang tên Stargate, đầu tư 500 tỉ USD vào cơ sở hạ tầng AI trên toàn nước Mỹ.

Đầu tháng 1, Microsoft cho biết dự định đầu tư khoảng 80 tỉ USD trong năm tài chính 2025 để phát triển các trung tâm dữ liệu. Trong khi Amazon tiết lộ chi phí vốn của họ cho năm 2025 sẽ cao hơn so với mức ước tính 75 tỉ USD năm 2024.

Kế hoạch chi phí vốn 60 - 65 tỉ USD của Meta Platforms sẽ đánh dấu bước nhảy đáng kể so với mức từ 38 tỉ đến 40 tỉ USD vào năm ngoái.

Bài liên quan
Meta giành được chiến thắng nhỏ trong cuộc đối đầu với Apple
Những cuộc đối đầu của Meta Platforms với Apple diễn ra từ lâu và căng thẳng đến mức khó có thể nhớ hết những lần xung đột giữa hai bên.

(0) Bình luận
Nổi bật Một thế giới
Thủ tướng: Tạo mọi điều kiện để phụ nữ ứng dụng KH-CN, đổi mới sáng tạo
3 giờ trước Nhịp đập khoa học
Thủ tướng Phạm Minh Chính khẳng định lịch sử dân tộc Việt Nam gắn liền với những dấu ấn sáng ngời của người phụ nữ Việt Nam anh hùng; cần tạo mọi điều kiện để phụ nữ tiếp cận, ứng dụng khoa học công nghệ, đổi mới sáng tạo.
Đừng bỏ lỡ
Mới nhất
POWERED BY ONECMS - A PRODUCT OF NEKO
Meta đưa các tính năng trò chuyện bằng giọng nói được cải tiến vào mô hình mới Llama 4