Meta cung cấp miễn phí mô hình AI nguồn mở, hợp tác với Microsoft và Qualcomm

Nhịp đập khoa học - Ngày đăng : 15:32, 19/07/2023

Meta Platforms đã xây dựng mô hình ngôn ngữ lớn để cạnh tranh với OpenAI và Google, nhưng đang thực hiện cách tiếp cận khác là phát hành miễn phí.

Mark Zuckerberg, Giám đốc điều hành Meta Platforms, cho biết công ty đang hợp tác với Microsoft để giới thiệu phiên bản tiếp theo của mô hình ngôn ngữ lớn nguồn mở (Llama 2), đồng thời đưa công nghệ này sử dụng miễn phí cho mục đích nghiên cứu và thương mại.

Giống Google và Microsoft, Meta Platforms từ lâu đã có một nhóm nghiên cứu lớn gồm các nhà khoa học máy tính chuyên phát triển trí tuệ nhân tạo (AI). Thế nhưng, Meta Platforms bị lu mờ khi OpenAI phát hành chatbot ChatGPT và gây ra cơn sốt tìm kiếm lợi nhuận từ các công cụ generative AI.

Generative AI là một loại trí tuệ nhân tạo được lập trình để tự động tạo ra nội dung mới, như văn bản, hình ảnh, âm thanh và video. Nó khác với các hệ thống AI khác như máy học sâu (deep learning) hoặc học máy (machine learning) trong việc dự đoán kết quả từ dữ liệu đã có sẵn. Thay vì dựa trên dữ liệu huấn luyện, hệ thống generative AI có khả năng tự tạo ra dữ liệu mới và phong phú hơn.

Meta Platforms cũng cố gắng tạo sự khác biệt khi cởi mở hơn một số đối thủ bằng việc cung cấp dữ liệu và mã nguồn mà công ty sử dụng để xây dựng hệ thống AI. Nhiều người lập luận rằng sự cởi mở như vậy giúp các nhà nghiên cứu bên ngoài dễ dàng xác định và giảm thiểu sự thiên vị, độc hại mà các hệ thống AI thấp thụ thông qua cách viết và giao tiếp của con người.

Nguồn mở thúc đẩy sự đổi mới vì cho phép nhiều nhà phát triển hơn xây dựng mô hình AI bằng công nghệ mới. Nó cũng cải thiện tính an toàn và bảo mật vì khi phần mềm được mở, nhiều người hơn có thể xem xét kỹ lưỡng nó để xác định và khắc phục các sự cố tiềm ẩn. Tôi tin rằng điều này sẽ mở ra nhiều tiến bộ hơn nếu hệ sinh thái cởi mở hơn. Đó là lý do tại sao chúng tôi đang mở mã nguồn Llama 2”, Mark Zuckerberg cho biết trong một bài đăng trên Facebook tối 18.7.

Tỷ phú 39 tuổi người Mỹ chỉ ra lịch sử mã nguồn mở trong công việc AI của Meta Platforms, chẳng hạn việc phát triển khung máy học PyTorch rất phổ biến.

Tuy nhiên, bài viết giới thiệu Llama 2 phản ánh ít tính minh bạch hơn so với những gì Meta Platforms thể hiện trước đây trong công việc xây dựng các mô hình AI yêu cầu hấp thụ lượng lớn văn bản số hóa như sách, bài báo tin tức và dữ liệu truyền thông xã hội.

Bài viết nêu rõ rằng Llama 2 được đào tạo trên "tập dữ liệu từ các nguồn có sẵn công khai, không bao gồm dữ liệu từ các sản phẩm hoặc dịch vụ của Meta Platforms", nhưng không xác định rõ dữ liệu nào được sử dụng.

Ngoài ra, bài viết cũng cho biết Meta Platforms đã loại bỏ dữ liệu từ các trang web được biết đến chứa "một lượng lớn thông tin cá nhân riêng tư".

meta-cung-cap-mien-phi-llama-2-mo-hinh-ai-ma-nguon-mo.jpg
Llama 2 được đào tạo trên dữ liệu lớn hơn 40% so với LlaMA nhưng được cung cấp miễn phí dưới dạng mã nguồn mở - Ảnh: Internet

Meta Platforms từng sử dụng LlaMA (từ viết tắt của Large Language Model Meta AI) để miêu tả phiên bản đầu tiên mô hình ngôn ngữ lớn này, được công bố hồi tháng 2. Hiện tại, công ty mẹ Facebook đã bỏ chữ cái viết hoa cho phiên bản thứ hai và gọi là Llama 2.

LlaMA cạnh tranh với các mô hình ngôn ngữ lớn làm nền tảng cho ChatGPT và Google Bard. Trong khi Llama 2 được đào tạo trên dữ liệu lớn hơn 40% so với LlaMA, với hơn 1 triệu chú thích do con người thực hiện để điều chỉnh chất lượng đầu ra, Mark Zuckerberg nói.

Ông cho biết mọi người có thể tải xuống trực tiếp Llama 2. Ngoài ra, Llama 2 sẽ được phân phối bởi Microsoft thông qua dịch vụ đám mây Azure và sẽ chạy trên hệ điều hành Windows. Khách hàng có thể tinh chỉnh và triển khai Llama 2 với 7 tỉ, 13 tỉ và 70 tỉ tham số một cách dễ dàng và an toàn hơn trên Azure.

Các điều khoản tài chính của mối quan hệ giữa Meta Platforms và Microsoft chưa được tiết lộ.

Microsoft được Meta Platforms mô tả là đối tác “ưu tiên”. Thế nhưng, Meta Platforms cho biết các mô hình AI này cũng có sẵn thông qua Amazon Web Services, đối thủ chính của Microsoft trong lĩnh vực đám mây, cũng như Hugging Face (công ty khởi nghiệp AI) và các đối tác khác.

Microsoft cũng là nhà tài trợ chính và là đối tác của OpenAI, nhà sản xuất ChatGPT. ChatGPT cũng như các dịch vụ tương tự từ Microsoft hoặc Google đều không phải là mã nguồn mở.

Hôm 18.7, Microsoft cũng tiết lộ quan hệ đối tác AI mới với Meta Platforms tại sự kiện thường niên của công ty dành cho khách hàng doanh nghiệp.

Ngoài ra, Microsoft thông báo rằng: “Hai công ty chia sẻ cam kết phổ cập AI cùng các lợi ích của nó và chúng tôi rất vui khi Meta đang thực hiện một cách tiếp cận cởi mở”. Meta Platforms đang là khách hàng của nền tảng điện toán đám mây Microsoft Azure.

Microsoft cũng sử dụng sự kiện trực tuyến có tên là Inspire để tiết lộ rằng sẽ tính phí doanh nghiệp hàng tháng là 30 USD cho mỗi người dùng 365 Copilot (công cụ generative AI hàng đầu của mình).

Đến nay, Microsoft đã tập trung vào việc đưa công nghệ từ OpenAI vào Azure.

Khi được hỏi tại sao Microsoft lại hỗ trợ một sản phẩm có thể làm giảm giá trị của OpenAI, người phát ngôn gã khổng lồ phần mềm nói rằng việc cung cấp sự lựa chọn cho các nhà phát triển trong việc sử dụng các mô hình khác nhau sẽ giúp mở rộng vị thế của họ như nền tảng đám mây hàng đầu cho công việc AI.

Qualcomm cũng thông báo đang hợp tác với Meta Platforms để đưa Llama 2 lên máy tính xách tay, smartphone và headset bắt đầu từ năm 2024 trở đi, để phát triển các ứng dụng AI hoạt động mà không cần dựa vào các dịch vụ đám mây.

Với Qualcomm (nhà thiết kế chip hàng đầu Mỹ), khả năng chạy các mô hình AI như Llama 2 trên các thiết bị như smartphone, PC, kính VR/AR cho phép nhà phát triển tiết kiệm chi phí đám mây và cung cấp cho người dùng trải nghiệm cá nhân hóa, riêng tư, đáng tin cậy hơn.

Qualcomm dự kiến sẽ triển khai AI dựa trên Llama 2 trên các thiết bị dùng chip Snapdragon từ năm 2024 trở đi.

Sơn Vân