Lý do nhiều nhà phát triển phần mềm chuyển sang các mô hình nền tảng AI thay OpenAI
Nhịp đập khoa học - Ngày đăng : 22:55, 29/03/2023
Với mong muốn có các mô hình phù hợp với các nhiệm vụ cụ thể và cơ hội cắt giảm chi phí mà không phải phụ thuộc vào một công ty duy nhất, nhiều nhà đầu tư và công ty khởi nghiệp ủng hộ các đối thủ cạnh tranh với OpenAI. Điều này phủ bóng đen lên tham vọng chiếm ưu thế trong lĩnh vực AI của OpenAI và Microsoft.
Một số nhà phát triển phần mềm chuyển sang các mô hình nền tảng AI thay thế GPT của OpenAI cho thấy chương tiếp theo của generative AI có thể mở ra.
Generative AI là loại trí tuệ nhân tạo mà máy tính được lập trình để tự động tạo ra nội dung mới như văn bản, hình ảnh, âm thanh và video. Nó khác với các hệ thống AI khác như máy học sâu hoặc học máy trong việc dự đoán kết quả từ dữ liệu đã có sẵn. Thay vì dựa trên dữ liệu huấn luyện, hệ thống generative AI có khả năng tự tạo ra dữ liệu mới và phong phú hơn. Các ví dụ của generative AI bao gồm các mô hình ngôn ngữ tự động tạo văn bản, các hệ thống nhận dạng hình ảnh, video và âm thanh.
GPT (Generative Pre-training Transformer) là mô hình ngôn ngữ lớn do nhà nghiên cứu AI có tên Alec Radford viết, sau đó được OpenAI phát triển làm nền tảng cho ChatGPT và gần đây nâng cấp lên phiên bản GPT-4 mạnh mẽ.
George Mathew, nhà đầu tư AI tại hãng Insight Partners, đã so sánh các mô hình nền tảng AI với những đột phá công nghệ khác đã tạo ra sự cạnh tranh. Mô hình nền tảng là hệ thống AI được đào tạo trên các tập dữ liệu lớn với khả năng học hỏi để thực hiện nhiều nhiệm vụ khác nhau.
George Mathew nói: “Có phải chúng ta chỉ có một nhà cung cấp dịch vụ internet duy nhất không? Chúng ta sẽ cần nhiều nhà cung cấp mô hình nền tảng để có một hệ sinh thái hoạt động khỏe mạnh. Lợi thế hiện tại mà OpenAI đang có sẽ không khiến nó trở thành lựa chọn duy nhất”.
Tome, công ty khởi nghiệp kể chuyện AI giúp người dùng tạo các trang trình chiếu nhanh hơn, ban đầu được xây dựng trên GPT-3, mô hình nền tảng được OpenAI phát hành lần đầu tiên vào năm 2020. Tome cho biết đã đạt 3 triệu người dùng trong tháng này và bắt đầu thử nghiệm các mô hình khác.
Tome đã thêm một mô hình văn bản từ đối thủ của OpenAI là Anthropic và có kế hoạch chuyển từ DALL-E (mô hình tạo ảnh từ văn bản của OpenAI) sang mô hình nguồn mở Stable Diffusion (do Stability AI tạo ra).
Keith Peiris, Giám đốc điều hành Tome, nói mục tiêu là tìm ra mô hình hoạt động tốt nhất cho từng hành động với độ trễ ít nhất và chất lượng tốt nhất.
Các nhà đầu tư và phát triển AI cho biết có một sự đồng thuận mới trong ngành nhằm giảm sự phụ thuộc vào một mô hình duy nhất, nhằm cung cấp các dịch vụ đáng tin cậy hơn, giảm chi phí và tận dụng lợi thế chuyên môn hóa của các mô hình khác nhau.
OpenAI đã trở nên nổi tiếng sau khi tung ra chatbot ChatGPT khiến nhiều người choáng váng với khả năng trả lời các câu hỏi phức tạp bằng ngôn ngữ rõ ràng, đúng ngữ pháp giống con người. OpenAI đã thu hút được khoản đầu tư 10 tỉ USD từ Microsoft, khi các đối thủ lớn bao gồm cả Google cùng các công ty nhỏ hơn đang gấp rút tạo ra các mô hình mới.
GPT-4 của OpenAI vẫn là mô hình nền tảng AI mạnh nhất theo nhiều tiêu chuẩn. Sam Altman, Giám đốc điều hành OpenAI, cho biết GPT-4 được cải tiến theo hướng sáng tạo hơn và ít thiên vị hơn so với bản trước đó. Ông nhấn mạnh đây là công nghệ AI tiên tiến chưa từng có, được đào tạo bằng cách sử dụng phản hồi của con người kết hợp công nghệ học sâu. GPT-4 có khả năng xử lý đa phương thức đầu vào, gồm cả hình ảnh, giúp người dùng tương tác với nhiều chế độ.
Giải pháp thay thế OpenAI
Theo công ty PitchBook, thị trường generative AI dự kiến sẽ tăng lên 98,1 tỉ USD vào năm 2026.
Là lớp cơ sở hạ tầng của các ứng dụng AI, các mô hình nền tảng AI đã thu hút nhiều đầu tư nhất từ các nhà đầu tư mạo hiểm và chiến lược. Cách các ứng dụng sử dụng các mô hình nền tảng AU và trả tiền cho các dịch vụ này là rất quan trọng cho các nhà cung cấp như OpenAI. Công ty này tuyên bố muốn đạt doanh thu 1 tỉ USD vào năm 2024.
OpenAI đã dự kiến có doanh thu 200 triệu USD trong năm 2023. Như một ví dụ về cách kiếm tiền, OpenAI tính phí 6 cent để xử lý 1.000 mã gợi ý trong mô hình GPT-4 và tính phí 20 USD/tháng với phiên bản ChatGPT Pro cho người dùng.
Một số công ty khởi nghiệp lo lắng rằng Microsoft có thể cạnh tranh với các khách hàng AI của mình khi gã khổng lồ công nghệ đưa các mô hình từ OpenAI vào các sản phẩm từ công cụ tìm kiếm Bing đến bộ sản phẩm Office.
"Một số ứng dụng này sẽ sử dụng dữ liệu nhạy cảm của các công ty. Các mô hình nền tảng sẽ thấy tương tác giữa các công ty này với khách hàng của họ. Nhiều công ty trong số này sẽ cảm thấy không thoải mái khi phụ thuộc vào Microsoft hoặc một công ty thường do Microsoft kiểm soát", theo Mike Volpi, đối tác tại Index Ventures - nhà đầu tư cho Cohere, đối thủ của OpenAI.
OpenAI và Microsoft từ chối bình luận.
Công ty Jasper.ai (trợ lý viết) đã bắt đầu với GPT nhưng không muốn dựa vào một mô hình duy nhất, Giám đốc điều hành Dave Rogenmoser tiết lộ nói với Reuters.
Jasper.ai đã thêm Cohere và Anthropic, hai công ty cung cấp mô hình ngôn ngữ lớn khác có quan hệ đối tác điện toán đám mây với Google, và đang tung ra công cụ AI để giúp các nhà tiếp thị tùy chỉnh giọng nói bằng cách sử dụng kết hợp nhiều mô hình.
Giám đốc điều hành Matt Shumer cho biết HyperWrite (trợ lý viết khác) chọn ra mô hình phù hợp với từng hành động của người dùng dựa trên nhiều yếu tố khác nhau. Ví dụ HyperWrite sử dụng mô hình của OpenAI để tạo các bài viết dài và mô hình của Cohere để tự động hoàn thành các câu với tốc độ nhanh hơn, chi phí thấp hơn.
Các công ty khởi nghiệp khác đã chuyển sang mô hình nền tảng thay thế chỉ vì OpenAI gặp khó khăn trong việc đáp ứng nhu cầu tăng cao. "Các máy chủ của OpenAI thường xuyên bị sập. Chúng tôi muốn người dùng của mình có trải nghiệm tốt hơn và việc sử dụng nhiều mô hình giúp chúng tôi xử lý các yêu cầu với chi phí thấp hơn", theo Srinath Sridhar, Giám đốc điều hành Regie.ai, trợ lý viết bài phục vụ nhóm bán hàng.
Để chắc chắn, một số công ty khởi nghiệp, gồm cả hãng phần mềm dịch vụ khách hàng Intercom, vẫn hợp tác với OpenAI.
Fergal Reid, Giám đốc học máy của Intercom, thừa nhận rằng chi phí trả cho GPT-4 rất đắt. Tuy nhiên, ông nói thêm: "Chúng tôi hiện tin rằng phải sử dụng GPT-4 để có được mức độ chính xác cần có cho dịch vụ khách hàng”.
Cerebra tung 7 mô hình mã nguồn mở giống GPT để cộng đồng nghiên cứu và dùng miễn phí
Hôm 28.3, Cerebras Systems (công ty khởi nghiệp chip AI) cho biết đã phát hành 7 mô hình nền tảng AI mã nguồn mở giống GPT để cộng đồng nghiên cứu và doanh nghiệp sử dụng miễn phí trong nỗ lực thúc đẩy cộng tác nhiều hơn.
Có trụ sở tại Thung lũng Silicon (Mỹ), Cerebra Systems đã phát hành 7 mô hình nền tảng AI, tất cả đều được đào tạo trên siêu máy tính AI có tên Andromeda, gồm các mô hình ngôn ngữ nhỏ hơn 111 triệu tham số cho đến một mô hình ngôn ngữ lớn hơn với 13 tỉ tham số.
Andrew Feldman, người sáng lập và Giám đốc điều hành Cerebras Systems, cho biết: “Hiện nay có một phong trào lớn để đóng lại những gì được chia sẻ về mã nguồn mở trong AI. Điều này không ngạc nhiên khi có rất nhiều tiền đang được đầu tư vào lĩnh vực này. Sự phấn khích trong cộng đồng và sự tiến bộ mà chúng ta đạt được phần lớn là vì mã nguồn mở trong AI được chia sẻ rộng rãi”.
Các mô hình với nhiều tham số hơn có thể thực hiện các chức năng generative (tạo sinh) phức tạp hơn. Ví dụ, ChatGPT của OpenAI ra mắt vào tháng 11.2022 với 175 tỉ tham số, có thể tạo thơ, đơn xin việc và thôi việc, sách điện tử, mã phần mềm… Điều này giúp thu hút sự quan tâm và tài trợ lớn cho AI trên diện rộng hơn.
Cerebras Systems nói các mô hình nhỏ hơn có thể được triển khai trên smartphone hoặc loa thông minh, trong khi các mô hình lớn hơn chạy trên PC hoặc máy chủ, dù các tác vụ phức tạp như tóm tắt đoạn văn lớn yêu cầu các mô hình lớn hơn. Tuy nhiên, Karl Freund, nhà tư vấn chip tại công ty Cambrian AI, cho biết mô hình lớn hơn không phải lúc nào cũng tốt hơn.
Karl Freund lý giải: “Đã có một số bài viết thú vị được xuất bản cho thấy một mô hình nhỏ hơn có thể chính xác nếu được bạn huấn luyện nhiều hơn. Vì vậy, có sự đánh đổi giữa mô hình lớn hơn và được đào tạo tốt hơn".
Andrew Feldman cho biết mô hình lớn nhất của ông mất hơn một tuần để huấn luyện, công việc thường có thể mất vài tháng, nhờ kiến trúc của Cerebras Systems, bao gồm chip có kích thước bằng chiếc đĩa ăn được chế tạo để huấn luyện AI.
Hầu hết mô hình AI ngày nay đều được huấn luyện trên chip của Nvidia, nhưng ngày càng có nhiều công ty khởi nghiệp như Cerebras Systems đang cố gắng giành thị phần trong thị trường đó.
Theo Andrew Feldman, các mô hình được huấn luyện trên máy Cerebras Systems cũng có thể được sử dụng trên các hệ thống Nvidia để huấn luyện hoặc tùy chỉnh thêm.