Liang Wenfeng, nhà sáng lập kiêm Giám đốc điều hành DeepSeek, đã không tham dự Hội nghị Hành động về AI kéo dài hai ngày tại Paris (thủ đô Pháp) dù được mời, khi các chuyên gia AI hàng đầu Trung Quốc nhấn mạnh vai trò của nước này trong ngành công nghiệp AI toàn cầu.
Các học giả Trung Quốc phát biểu tại Hội nghị Hành động về AI (diễn ra hôm 10.2 và 11.2) rằng tiến bộ của nước này trong lĩnh vực AI, được thể hiện qua các mô hình mã nguồn mở của DeepSeek, đã đóng góp cho cộng đồng công nghệ toàn cầu và thúc đẩy việc áp dụng AI rộng rãi hơn.
Kể từ khi công ty khởi nghiệp OpenAI (Mỹ) ra mắt ChatGPT và mở ra một kỷ nguyên AI mới, lĩnh vực này đã phát triển nhanh chóng. DeepSeek đã chỉ ra cách xây dựng hệ thống AI với chi phí thấp, theo lời Andrew Yao Chi-chih, nhà khoa học máy tính đoạt giải Turing từ Đại học Thanh Hoa ở Bắc Kinh (thủ đô Trung Quốc), trong một sự kiện bên lề hội nghị.
Giải Turing là giải thưởng danh giá trong lĩnh vực khoa học máy tính, được ví như "Giải Nobel của ngành máy tính".
"Vì các mô hình AI của DeepSeek là mã nguồn mở, chúng sẽ có thể mang lại lợi ích cho cộng đồng AI toàn cầu bằng cách cho phép tất cả chúng ta cùng nhau phát triển công nghệ", Andrew Yao Chi-chih nói.
DeepSeek đã thúc đẩy làn sóng áp dụng các mô hình AI hiệu suất cao, chi phí thấp của công ty khởi nghiệp này trong nhiều ngành, từ sản xuất tiên tiến đến dịch vụ internet.
Các tập đoàn lớn như gã khổng lồ sản xuất PC Lenovo, công ty robot hình người UBTech và nhà sản xuất xe điện Geely nằm trong số những doanh nghiệp Trung Quốc đầu tiên tích hợp các mô hình AI DeepSeek vào sản phẩm của họ những tuần gần đây.
Bất chấp sự nổi tiếng, DeepSeek và Liang Wenfeng vẫn giữ im lặng về các bước tiếp theo, từ chối các yêu cầu phỏng vấn từ truyền thông.
Với tốc độ phát triển của công nghệ AI, việc ứng dụng rộng rãi AI trong nhiều ngành công nghiệp có thể diễn ra sớm hơn dự đoán, kéo theo những lo ngại nghiêm trọng về an toàn và các vấn đề liên quan, theo Andrew Yao Chi-chih.
Thế giới vẫn chưa nắm bắt rõ về các rủi ro và cần cảnh giác trước bất kỳ sự lạm dụng AI nào, cũng như khả năng công nghệ này có thể vượt khỏi tầm kiểm soát của con người, ông nói.
"Chúng ta cần chuẩn bị và hiểu rõ những rủi ro tiềm ẩn để có thể giảm thiểu chúng", Andrew Yao Chi-chih nhấn mạnh, đồng thời cho rằng sự hợp tác quốc tế chặt chẽ sẽ đóng vai trò quan trọng trong việc giải quyết những thách thức này.
Việc quản trị an toàn AI là một vấn đề ảnh hưởng đến toàn thể nhân loại và cần có sự quan tâm, tham gia của toàn cầu, theo lời Xue Lan, hiệu trưởng Trường Schwarzman và Viện Quản trị Quốc tế về AI thuộc Đại học Thanh Hoa.
Xue Lan cũng cho biết Trung Quốc đã khởi xướng một sáng kiến quản trị AI toàn cầu vào năm 2023 và đang kêu gọi sự tham gia rộng rãi hơn từ các quốc gia khác. Ông nhấn mạnh rằng Trung Quốc tôn trọng sự khác biệt trong chính sách và thực tiễn giữa các quốc gia.
Ngoài ra, Hiệp hội An toàn & Phát triển AI Trung Quốc, viện nghiên cứu về an toàn AI, sẽ đại diện cho nước này trong các cuộc đối thoại toàn cầu về AI, Xue Lan cho biết.
Tại Hội nghị thượng đỉnh AI ở Paris, ban tổ chức cũng thông báo thành lập Liên minh AI Bền vững nhằm thúc đẩy con đường phát triển công nghệ này thân thiện với môi trường hơn. Các thành viên sáng lập gồm Lenovo, Baidu (hãng tìm kiếm hàng đầu Trung Quốc) cũng như hai gã khổng lồ chip Mỹ là Nvidia và AMD.
"Châu Âu nên giữ mô hình mã nguồn mở như DeepSeek hoặc có nguy cơ bị tụt hậu"
Tại hội nghị này hôm 11.2, Yann LeCun (Giám đốc khoa học AI tại Meta Platforms được mệnh danh là "cha đẻ AI”) khuyên châu Âu nên giữ các mô hình AI mã nguồn mở hoặc có nguy cơ bị tụt lại phía sau.
Yann LeCun cho biết châu Âu và một số quốc gia đang cố gắng làm cho các mô hình AI mã nguồn mở trở thành bất hợp pháp vì muốn duy trì lợi thế trước các đối thủ chính trị, điều mà ông gọi là "sai lầm nghiêm trọng".
"Khi nghiên cứu trong bí mật, bạn sẽ bị tụt lại phía sau. Phần còn lại của thế giới sẽ đi theo hướng mã nguồn mở và vượt qua bạn. Điều đó đang diễn ra ngay lúc này", ông nói.
Các mô hình AI mã nguồn mở cho phép chia sẻ phần mềm miễn phí và công khai cho bất kỳ ai với bất kỳ mục đích nào.
Yann LeCun từ lâu đã ủng hộ các mô hình ngôn ngữ lớn mã nguồn mở và nhấn mạnh rằng những hệ thống này không nên bị kiểm soát bởi một số ít người hoặc công ty. Nhà khoa học này cho rằng một mô hình mã nguồn mở giúp nhiều người hưởng lợi vì tốc độ phát triển nhanh hơn.
"Chúng ta không thể để những hệ thống này chỉ đến từ một số ít công ty ở bờ Tây nước Mỹ hoặc Trung Quốc", Yann LeCun nhấn mạnh.
Nhận xét của ông được đưa ra sau khi DeepSeek cuối tháng 1 ra mắt mô hình suy luận R1 mạnh mẽ với chi phí đào tạo thấp, khiến các hãng công nghệ và AI Mỹ lo ngại. Các bài kiểm tra từ bên thứ ba cho thấy R1 có hiệu suất tương đương hoặc vượt sản phẩm từ OpenAI, Meta Platforms và những nhà phát triển hàng đầu khác, đồng thời DeepSeek tuyên bố xây dựng nó với chi phí thấp hơn.
Mô hình R1 là mã nguồn mở, cho phép những người khác tải xuống và xây dựng trên nền tảng đó.
"DeepSeek đã hưởng lợi từ nghiên cứu và mã nguồn mở, chẳng hạn thư viện PyTorch và mô hình Llama từ Meta. Họ đã đưa ra những ý tưởng mới và phát triển dựa trên công trình của người khác. Vì công trình của DeepSeek được công bố là nguồn mở nên mọi người đều có thể hưởng lợi từ nó. Đó là sức mạnh của nghiên cứu mở và nguồn mở", Yann LeCun viết trong một bài đăng trên mạng xã hội Threads.
PyTorch là thư viện mã nguồn mở về học máy, được phát triển bởi Meta Platforms. PyTorch được sử dụng rộng rãi trong lĩnh vực AI và học sâu nhờ tính linh hoạt, dễ sử dụng và khả năng tính toán mạnh mẽ trên cả CPU (bộ xử lý trung tâm) và GPU (bộ xử lý đồ họa).
Các mô hình Llama của Meta Platforms chủ yếu là mã nguồn mở, điều mà Yann LeCun luôn ủng hộ trong công ty. OpenAI ban đầu được thành lập như một công ty AI mã nguồn mở, nhưng gần đây đã chuyển sang mô hình mã nguồn đóng.
Sam Altman, Giám đốc điều hành OpenAI, thừa nhận công ty có thể đang ở "phía sai của lịch sử" khi bám vào các mô hình nguồn đóng, đồng thời thừa nhận sự tiến bộ của các mô hình mã nguồn mở. Doanh nhân 39 tuổi người Mỹ nói rằng OpenAI cần một "chiến lược mã nguồn mở khác", nhưng điều này chưa phải ưu tiên hàng đầu.
Sam Altman thừa nhận rằng DeepSeek đã "làm tốt" trong việc tạo ra chatbot AI để cạnh tranh với ChatGPT.
Dù OpenAI tuyên bố có bằng chứng rằng DeepSeek đã sử dụng quy trình distillation (chưng cất) để huấn luyện mô hình của mình dựa trên dữ liệu công ty Mỹ mà không có sự cho phép, Sam Altman vẫn không có kế hoạch khởi kiện đối thủ. Ông nhấn mạnh OpenAI sẽ tiếp tục đổi mới và duy trì vị thế dẫn đầu, thay vì vướng vào các tranh chấp pháp lý.
"Không, chúng tôi không có kế hoạch kiện DeepSeek vào thời điểm này. Chúng tôi sẽ tiếp tục xây dựng những sản phẩm tuyệt vời và dẫn đầu thế giới với khả năng mô hình của mình. Tôi nghĩ điều đó sẽ ổn thôi", Sam Altman phát biểu trước báo giới hôm 3.2.
Các công ty AI châu Âu đang sử dụng mô hình AI mã nguồn mở có Mistral (Pháp) và Aleph Alpha (Đức). Cả hai công ty này đã chỉ trích đề xuất của châu Âu nhằm điều chỉnh các nhà phát triển mô hình nền tảng. Các nhà làm luật ở Pháp, Đức và Ý đã thúc đẩy một framework (khung làm việc) cho phép nhà phát triển mô hình AI tự điều chỉnh để có thể cạnh tranh với các tập đoàn công nghệ Mỹ.
Framework là bộ công cụ hoặc nền tảng được thiết kế để hỗ trợ các lập trình viên phát triển phần mềm nhanh chóng và hiệu quả hơn. Nó cung cấp sẵn cấu trúc, thư viện, hàm và quy tắc lập trình, giúp giảm bớt công sức viết mã từ đầu.
Đạo luật AI của Liên minh châu Âu, được thông qua vào năm 2024, nhằm giải quyết rủi ro liên quan đến công nghệ AI mạnh mẽ. Gần đây, đã có nhiều tranh luận về cách điều chỉnh các mô hình nền tảng, chẳng hạn mô hình ngôn ngữ lớn, theo đạo luật này.
DeepSeek kín tiếng giữa ánh hào quang
Giữa vô số sự quan tâm từ công chúng, DeepSeek vẫn duy trì phong cách khiêm tốn và kín tiếng.
Văn phòng của DeepSeek, nằm trong một tòa nhà thương mại ở trung tâm thành phố Hàng Châu (Trung Quốc), đã trở thành "thánh địa" cho các nhà báo công nghệ và những người tìm kiếm việc làm.
Trong khi đó, quê hương của Liang Wenfeng ở thành phố cảng Trạm Giang, tỉnh Quảng Đông đã chào đón nhà sáng lập kiêm giám đốc điều hành DeepSeek như người hùng khi ông trở về vào dịp Tết Nguyên đán. Tuy nhiên, DeepSeek vẫn tránh quảng bá bản thân, giữ im lặng trước nhiều tin đồn và thậm chí cả những thành tựu của chính mình.
Trong cuộc phỏng vấn với trang tin công nghệ 36Kr (Trung Quốc) sau khi ra mắt mô hình V2 vào tháng 5.2024, Liang Wenfeng bày tỏ sự thất vọng khi thấy các công ty Trung Quốc ngại tiến hành nghiên cứu đột phá. "Trung Quốc phải là nước đóng góp cho đổi mới toàn cầu, chứ không thể mãi đi nhờ miễn phí", ông nói.
Liang Wenfeng nhấn mạnh rằng đổi mới phải xuất phát từ sự tò mò và khát khao sáng tạo, chứ không chỉ đơn thuần là đáp ứng nhu cầu kinh doanh.
Trong một bài viết lan truyền rộng rãi về Liang Wenfeng và DeepSeek, công ty khởi nghiệp này được mô tả như "trường hợp của chủ nghĩa lý tưởng công nghệ", với nhà sáng lập có tầm nhìn rõ ràng về việc thay đổi thế giới thông qua đổi mới.