Ông Li Zhifei, cựu nhà khoa học máy tính của Google, trước đây thường thức dậy lúc 8 giờ sáng các ngày trong tuần nhưng ở trên giường lâu hơn một chút để ngủ nhiều hơn. Song, Li Zhifei không còn làm như vậy nữa.
Li Zhifei, Giám đốc điều hành và người sáng lập công ty Mobvoi Information Technology, cho biết: “Bây giờ, tôi ngay lập tức đứng dậy và bắt đầu làm việc”.
Điều gì khiến Li Zhifei ra khỏi giường sớm hơn những ngày này? Các công ty khởi nghiệp về trí tuệ nhân tạo (AI) của Trung Quốc nhận được cú hích sau sự bùng nổ về mức độ phổ biến của công nghệ generative AI do ChatGPT dẫn đầu. Không có thời gian để lãng phí, Li Zhifei là ví dụ điển hình của các doanh nhân công nghệ địa phương đang cố gắng chạy theo làn sóng này.
Hành trình điều hành một công ty khởi nghiệp kéo dài hàng thập kỷ của Li Zhifei không phải lúc nào cũng thuận buồm xuôi gió, nhưng sự phổ biến của of generative AI đã mở ra những cơ hội mới.
“Trên thực tế, tôi đã làm việc khá chăm chỉ trong 5 tháng qua”, Li Zhifei nói trong một cuộc phỏng vấn gần đây với tờ SCMP.
Li Zhifei tốt nghiệp Đại học Johns Hopkins (Mỹ) với bằng tiến sĩ khoa học máy tính trước khi gia nhập Google với tư cách là nhà khoa học nghiên cứu vào tháng 5.2010. Sau khi rời Google, ông thành lập Mobvoi Information Technology, công ty AI tập trung vào tương tác giọng nói nâng cao và tích hợp phần cứng - phần cứng, thu hút vốn từ các nhà đầu tư nổi tiếng như Sequoia Capital và ZhenFund.
“Tôi cảm thấy không thể ở lại Google dù chỉ một ngày nữa vì thấy rất rõ ràng về sứ mệnh của mình. Tôi cảm thấy rằng sự tương tác giữa con người với thiết bị là rất quan trọng. Đó là điều tôi làm tốt và thị trường lớn có tiềm năng. Nếu tôi tham gia lĩnh vực này muộn một tuần, tình hình thị trường có thể rất khác", Li Zhifei nói.
Có trụ sở tại Bắc Kinh (thủ đô Trung Quốc), Mobvoi Information Technology là một trong nhiều công ty khởi nghiệp Trung Quốc đã nhảy vào chơi các mô hình ngôn ngữ lớn (LLM) trong năm nay. Mobvoi Information Technology tận dụng sự náo nhiệt của thị trường xung quanh ChatGPT và cạnh tranh với các hãng công nghệ lớn Trung Quốc như Baidu để chiếm lĩnh một phần thị trường Trung Quốc.
Theo báo cáo được công bố trong tuần này bởi Viện Thông tin Khoa học và Kỹ thuật Trung Quốc, cơ quan nghiên cứu của chính phủ, Trung Quốc có ít nhất 79 mô hình AI lớn với hơn 1 tỉ tham số, chủ yếu tập trung vào các lĩnh vực ngôn ngữ và nhận dạng hình ảnh.
Mô hình AI của Mobvoi Information Technology có tên là Xuliehouzi. Theo công ty, Xuliehouzi có hàng chục tỉ tham số, so sánh với 175 tỉ tham số của GPT-3 được Open AI phát triển.
Mobvoi Information Technology đã đệ trình kế hoạch phát hành cổ phiếu lần đầu ra công chúng (IPO) lên sàn giao dịch chứng khoán Hồng Kông vào tuần trước. Theo bản cáo bạch, doanh thu Mobvoi Information Technology tăng từ 264,5 triệu nhân dân tệ (37,3 triệu USD) vào năm 2020 lên 397,9 triệu nhân dân tệ trong năm 2021 và đạt 500,2 triệu nhân dân tệ năm 2022. Tuy nhiên, khoản lỗ của Mobvoi Information Technology trong năm 2022 lên tới 670 triệu nhân dân tệ.
Mobvoi Information Technology đang hợp tác với China International Capital Corporation và China Merchants Bank International để huy động tới 300 triệu USD trong đợt IPO, trang Bloomberg đưa tin vào tháng trước.
Ngoài mô hình ngôn ngữ lớn, Mobvoi Information Technology tung ra các sản phẩm tiêu dùng gồm ứng dụng di động Mobvoi, dòng đồng hồ thông minh TicWatch và dòng tai nghe thông minh không dây TicPods, với mục tiêu trở thành một thương hiệu có thể đeo công nghệ AI. Công ty cũng đã phát triển một trợ lý lồng tiếng AI cho các trình tạo nội dung.
“Khi bắt đầu vào năm 2012, chúng tôi chủ yếu làm việc trên phần mềm và nhanh chóng có được nguồn tài trợ, nhưng khoảng năm 2014 và 2015, tôi mất hướng về cách khai thác kỹ thuật này, sau đó chúng tôi chuyển sang phần cứng. Chúng tôi đã thử nhiều cách tiếp cận trong 10 năm qua và chúng trở thành nền tảng cho chúng tôi ngày nay”, Li Zhifei nói.
Các hãng công nghệ lớn Trung Quốc đều đang làm việc trên mô hình ngôn ngữ lớn. Baidu, gã khổng lồ công cụ tìm kiếm có trụ sở tại Bắc Kinh, đã tiết lộ Ernie Bot vào tháng 3. Trong khi Alibaba đang lên kế hoạch tích hợp chatbot Tongyi Qianwen vào tất cả sản phẩm của mình. Hồi tháng 4, công ty SenseTime đã ra mắt SenseNova, mô hình AI lớn mới nhất của họ.
Li Zhifei so sánh mô hình GPT của OpenAI với cảm giác về internet vào năm 2010, khi người dân ở Trung Quốc coi đó là điều lớn lao tiếp theo.
“Vào năm 2010, bạn đã biết rằng phần cứng smartphone không còn là vấn đề nữa… Bây giờ, nếu bạn có thể tạo ra một mô hình tốt như GPT-3.5, tôi nghĩ điều tiếp theo là tìm một kịch bản tốt để áp dụng nó. Tất nhiên sẽ có quá trình sàng lọc. Bây giờ là sự bùng nổ của các mô hình ngôn ngữ lớn và một số người chơi sẽ bị bỏ lại phía sau. Điều quan trọng là mỗi người chơi đều có những ưu điểm và hạn chế, nên tất cả chúng ta cần tìm ra vị trí của riêng mình”, Li Zhifei nói.
Hồi tháng 4, Cục Quản lý không gian mạng Trung Quốc (CAC), cơ quan giám sát internet nước này, đã tiết lộ một bộ quy tắc dự thảo mới nhắm mục tiêu vào các dịch vụ tương tự ChatGPT.
Các công ty cung cấp dịch vụ generative AI ở Trung Quốc phải thực hiện biện pháp ngăn chặn nội dung phân biệt đối xử, thông tin sai lệch và nội dung gây hại cho quyền riêng tư cá nhân hoặc sở hữu trí tuệ, theo quy định đề xuất do CAC công bố.
CAC cho biết các doanh nghiệp cũng nên đảm bảo rằng các sản phẩm của họ tôn trọng giá trị xã hội chủ nghĩa của Trung Quốc và không tạo ra nội dung gợi ý lật đổ chế độ, bạo lực, nội dung khiêu dâm hoặc phá vỡ trật tự kinh tế và xã hội.
Tất cả sản phẩm generative AI phải vượt qua đánh giá bảo mật của CAC trước khi phục vụ công chúng, theo yêu cầu từ quy định năm 2018 về các dịch vụ thông tin trực tuyến có khả năng gây ảnh hưởng đến dư luận.
Li Zhifei cho biết các công ty Trung Quốc đang ở giai đoạn khác nhau trong việc phát triển các mô hình ngôn ngữ lớn.
“Mỹ không có nhiều công ty làm việc trên các mô hình ngôn ngữ lớn, nhưng họ có một hệ sinh thái. Một số trong số họ đang làm việc trên các mô hình ngôn ngữ lớn, một số đang làm việc ở trên tầng trung gian và một số đang làm việc trên ứng dụng. Tuy nhiên, Trung Quốc vẫn đang ở giai đoạn đầu tiên… Vì vậy, chúng tôi đi sau Mỹ khoảng một hoặc hai năm trong lĩnh vực này”, Li Zhifei nói.
Với Li Zhifei, bước tiếp theo là làm cho mô hình ngôn ngữ lớn của công ty trở nên hữu dụng bằng cách kết nối nó với các ứng dụng.
“Khi mô hình mang đến cho người dùng của chúng tôi trải nghiệm tốt hơn, công ty sẽ có nhiều người dùng hơn, nhiều hoạt động kinh doanh hơn và mô hình của chúng tôi cũng sẽ nhận được nhiều dữ liệu hơn”, Li Zhifei nói.