Microsoft đang điều tra liệu dữ liệu đầu ra từ công nghệ của OpenAI có bị thu thập trái phép bởi một nhóm liên kết với DeepSeek hay không, trang Bloomberg đưa tin. Microsoft là nhà đầu tư lớn nhất vào OpenAI (khoảng 13 tỉ USD).
Thế giới số

Microsoft và quan chức AI ở Nhà Trắng nghi DeepSeek thu thập trái phép dữ liệu của OpenAI

Sơn Vân 12:28 29/01/2025

Microsoft đang điều tra liệu dữ liệu đầu ra từ công nghệ của OpenAI có bị thu thập trái phép bởi một nhóm liên kết với DeepSeek hay không, trang Bloomberg đưa tin. Microsoft là nhà đầu tư lớn nhất vào OpenAI (khoảng 13 tỉ USD).

Tuần trước, công ty khởi nghiệp DeepSeek (Trung Quốc) ra mắt R1, mô hình AI nguồn mở mạnh mẽ được cho là sử dụng ít dữ liệu hơn với chi phí đào tạo chỉ bằng một phần nhỏ so với các mô hình của các hãng công nghệ hàng đầu Mỹ như OpenAI ("cha đẻ" ChatGPT), Meta Platforms (chủ sở hữu Facebook) và Anthropic. Điều này có thể đánh dấu bước ngoặt trong mức đầu tư cần thiết cho AI.

Thung lũng Silicon rất lo lắng vì trong các bài đánh giá từ bên thứ ba, R1 đã vượt trội mô hình AI của OpenAI, Meta Platforms và Anthropic. Được vận hành bởi mô hình V3, phiên bản đời trước của R1, ứng dụng AI miễn phí của DeepSeek đã nhanh chóng trở nên phổ biến trong số người dùng tại Mỹ kể từ khi ra mắt vào ngày 10.1, theo hãng Sensor Tower.

Cột mốc này nhấn mạnh cách DeepSeek đã để lại ấn tượng sâu sắc tại Thung lũng Silicon, làm lung lay quan niệm phổ biến về sự thống trị của Mỹ trong lĩnh vực AI cùng hiệu quả từ các biện pháp kiểm soát xuất khẩu nhằm vào chip tiên tiến và năng lực AI của Trung Quốc.

Các nhà đầu tư toàn cầu đã bán tháo cổ phiếu công nghệ hôm 27.1 vì lo ngại R1 sẽ đe dọa sự thống trị của các công ty AI hàng đầu. Cổ phiếu Nvidia giảm gần 17% hôm 27.1, khiến vốn hóa thị trường mất 593 tỉ USD, mức giảm kỷ lục trong một ngày với bất kỳ công ty nào ở Phố Wall.

Vào mùa thu năm ngoái, các nhà nghiên cứu bảo mật thuộc Microsoft đã phát hiện các cá nhân mà họ tin rằng có liên quan đến DeepSeek đang trích xuất lượng lớn dữ liệu bằng cách sử dụng giao diện lập trình ứng dụng (API) của OpenAI, theo Bloomberg.

API của OpenAI là cách chính để các nhà phát triển phần mềm và khách hàng doanh nghiệp mua dịch vụ của công ty khởi nghiệp AI này. Chẳng hạn, nếu một công ty hoặc lập trình viên muốn sử dụng công nghệ của OpenAI như GPT, họ thường mua và truy cập thông qua API chứ không trực tiếp cài đặt hay sở hữu mô hình AI.

Microsoft đã thông báo cho OpenAI về hoạt động đáng ngờ này, Bloomberg đưa tin.

Microsoft từ chối bình luận. OpenAI không phản hồi ngay lập tức câu hỏi của Reuters. Reuters cũng không thể liên lạc ngay được với DeepSeek để tìm kiếm bình luận.

OpenAI cho biết các công ty Trung Quốc đang liên tục cố gắng khai thác công nghệ của những đối thủ Mỹ nhằm cải thiện các mô hình AI của họ.

"Là nhà phát triển AI hàng đầu, chúng tôi thực hiện các biện pháp đối phó để bảo vệ tài sản trí tuệ (IP), gồm cả một quy trình cẩn trọng để quyết định những năng lực tiên tiến nào sẽ được đưa vào các mô hình phát hành. Chúng tôi tin rằng, khi tiến về phía trước, điều quan trọng là chúng tôi phải hợp tác chặt chẽ với chính phủ Mỹ để bảo vệ tốt nhất các mô hình tiên tiến nhất khỏi nỗ lực của kẻ thù và đối thủ cạnh tranh nhằm chiếm đoạt công nghệ Mỹ", OpenAI tuyên bố.

OpenAI đưa ra bình luận này sau khi Nhà Trắng cho biết đang đánh giá những lo ngại về an ninh quốc gia có thể phát sinh từ DeepSeek.

Hội đồng An ninh Quốc gia đang xem xét các tác động của ứng dụng AI do DeepSeek cung cấp, theo Thư ký báo chí Nhà Trắng - Karoline Leavitt. "Đây là một lời cảnh tỉnh cho ngành AI của Mỹ", bà Karoline Leavitt lặp lại tuyên bố của ông Trump một ngày trước đó, đồng thời cho biết Nhà Trắng đang làm việc để "đảm bảo sự thống trị của AI Mỹ."

Khi được hỏi trên Fox News liệu sự thăng tiến của DeepSeek có liên quan đến hành vi đánh cắp tài sản trí tuệ hay không, David Sacks (quan chức Nhà Trắng phụ trách AI và tiền điện tử) đáp: "Chà, điều đó có thể xảy ra. Có một kỹ thuật trong AI gọi là distillation mà bạn sẽ nghe nói rất nhiều. Đây là quá trình một mô hình học hỏi từ một mô hình khác".

"Tôi nghĩ rằng trong vài tháng tới, các công ty AI hàng đầu của chúng tôi sẽ thực hiện các biện pháp để ngăn chặn distillation... Điều đó chắc chắn sẽ làm chậm lại sự phát triển của các mô hình bắt chước", David Sacks nói thêm.

Distillation trong AI là kỹ thuật học máy trong đó một mô hình nhỏ hơn, đơn giản hơn (gọi là student model – mô hình học sinh) được huấn luyện để bắt chước hiệu suất của mô hình lớn hơn, phức tạp hơn (gọi là teacher model – mô hình giáo viên).

Cách hoạt động của distillation

Mô hình giáo viên: Một mô hình AI lớn, mạnh mẽ được huấn luyện trước trên một lượng dữ liệu lớn.

Mô hình học sinh: Một mô hình nhỏ hơn được huấn luyện bằng cách học lại từ đầu ra của mô hình giáo viên thay vì chỉ dựa vào dữ liệu gốc.

Chuyển giao kiến thức: Mô hình học sinh học cách đưa ra các dự đoán tương tự như mô hình giáo viên nhưng với ít tài nguyên tính toán hơn.

Lợi ích của distillation

- Tăng hiệu suất: Giúp tạo ra các mô hình nhỏ gọn hơn nhưng vẫn duy trì độ chính xác cao.

- Tiết kiệm tài nguyên: Giúp AI chạy nhanh hơn trên các thiết bị có tài nguyên hạn chế như điện thoại, IoT (internet vạn vật).

- Bảo mật & tối ưu hóa: Có thể dùng để tạo ra các bản sao tối ưu hóa của mô hình AI mà không cần truy cập trực tiếp vào mô hình gốc.

Mối lo ngại về bảo mật

Distillation có thể được sử dụng để sao chép hoặc tái tạo mô hình AI mạnh mẽ từ các công ty đối thủ, dẫn đến lo ngại về đánh cắp tài sản trí tuệ. Đây là lý do tại sao Mỹ đang lo ngại rằng các công ty Trung Quốc có thể đang sử dụng kỹ thuật này để học từ mô hình AI tiên tiến của OpenAI.

Hôm 27.1, ông Trump nói ứng dụng AI của DeepSeek là động lực thúc đẩy các công ty Mỹ và cho rằng việc Trung Quốc tìm ra phương pháp phát triển AI nhanh hơn, rẻ hơn là điều tốt.

"Việc công ty Trung Quốc phát hành AI DeepSeek nên là lời cảnh tỉnh cho ngành công nghiệp của Mỹ rằng chúng ta cần tập trung tối đa vào cạnh tranh để giành chiến thắng", ông Trump nói.

David Sacks nói với Fox News hôm 28.1 rằng các công ty AI của Mỹ đã "bị xao lãng" và "có thể trở nên hơi tự mãn."

Theo Tổng thống Trump, các lãnh đạo Trung Quốc từng nói với ông rằng Mỹ có những nhà khoa học xuất sắc nhất thế giới. Ông cũng cho rằng nếu ngành công nghiệp Trung Quốc có thể phát triển công nghệ AI rẻ hơn thì các công ty Mỹ cũng sẽ làm theo.

"Chúng ta luôn có ý tưởng. Chúng ta luôn đi đầu. Vì vậy, tôi nghĩ rằng đây có thể là một bước phát triển rất tích cực. Thay vì bỏ ra hàng tỉ USD, bạn sẽ chi ít hơn và hy vọng đạt được kết quả tương tự", ông Trump nhấn mạnh.

Các mô hình AI thường cần các chip tiên tiến cho quá trình huấn luyện. Từ năm 2021, chính quyền Biden đã mở rộng phạm vi các lệnh cấm nhằm ngăn những chip tiên tiến được xuất khẩu sang Trung Quốc và sử dụng để đào tạo mô hình AI cho các công ty nước này.

Nỗ lực ngăn chặn dòng chảy chip AI đến Trung Quốc từ các công ty Mỹ như Nvidia và Advanced Micro Devices (AMD) do Bộ Thương mại Mỹ dẫn dắt. Được ông Trump đề cử lãnh đạo cơ quan này, doanh nhân Howard Lutnick dự kiến ​​sẽ xuất hiện trong phiên điều trần hôm 29.1.

microsoft-va-quan-chuc-nha-trang-nghi-deepseek-thu-thap-du-lieu-cua-openai-trai-phep.jpg
Microsoft đang điều tra liệu dữ liệu đầu ra từ công nghệ của OpenAI có bị thu thập trái phép bởi một nhóm liên kết với DeepSeek hay không - Ảnh: Internet

Trong một bài báo vào tháng 12.2024, các nhà nghiên cứu DeepSeek viết rằng mô hình V3, phiên bản đời trước R1, được đào tạo trong vòng hai tháng bằng khoảng 2.000 chip Nvidia H800 kém mạnh mẽ hơn, với chi phí chỉ 6 triệu USD. Andrej Karpathy, thành viên sáng lập của OpenAI, đã gọi đây là "ngân sách nực cười".

V3 được DeepSeek đào tạo với lượng tài nguyên ít hơn nhưng vẫn ngang bằng hoặc thậm chí vượt trội về hiệu suất ở một số lĩnh vực so với các mô hình AI từ các công ty Mỹ như Meta Platforms và OpenAI.

Nvidia H800 không phải là loại chip hàng đầu. Ban đầu H800 được Nvidia phát triển như một sản phẩm giảm hiệu năng để vượt qua các hạn chế từ chính quyền Biden với mục đích bán cho thị trường Trung Quốc, song sau đó bị cấm theo lệnh trừng phạt của Mỹ.

Chi phí đào tạo các mô hình DeepSeek tương đối thấp khiến ngành công nghiệp phải đánh giá lại mức độ cần thiết của bộ xử lý đồ họa (GPU) để đào tạo các mô hình AI ngày càng tinh vi hơn.

Wei Sun, nhà phân tích chính về AI tại hãng nghiên cứu thị trường Counterpoint Research, cho biết thành công của DeepSeek thách thức niềm tin rằng các mô hình lớn hơn với nhiều sức mạnh tính toán hơn sẽ mang lại hiệu suất tốt hơn, đe dọa chiến lược tăng trưởng dựa trên GPU của Nvidia.

Bà Wei Sun cho biết: "Nó cũng đặt câu hỏi về sự cần thiết của những khoản đầu tư khổng lồ như dự án Stargate trị giá 500 tỉ USD của Mỹ. Bằng cách đạt được kết quả tiên tiến với ít nguồn lực hơn, DeepSeek làm nổi bật tiềm năng đổi mới hiệu quả thay vì chỉ tập trung vào quy mô, đánh dấu một bước ngoặt trong cuộc đua AI".

DeepSeek V3 bị nghi sao chép o1 của OpenAI

Vào tháng 9.2024, OpenAI đã phát hành mô hình o1 có "khả năng lý luận vượt trội so với các phiên bản trước đó". Ba tháng sau đó, DeepSeek đã tung ra mô hình lý luận tương tự là V3 khiến OpenAI ngỡ ngàng.

Một bản tin trên trang TechCrunch cuối tháng 12.2024 cho rằng DeepSeek có thể đã sử dụng kết quả từ o1 để đào tạo mô hình AI của riêng mình.

"Họ có lẽ là những người đầu tiên tái tạo o1. Tôi đã hỏi nhiều người ở OpenAI xem họ nghĩ gì về điều này. Họ nói DeepSeek V3 trông giống như cùng một thứ với o1, nhưng không biết DeepSeek đã làm điều này nhanh như vậy như thế nào”, một chuyên gia AI nói.

V3 được mô tả có thể xử lý khối lượng lớn công việc và tác vụ thông qua văn bản đầu vào "theo cách thông minh nhất", như lập trình, dịch thuật, viết bài luận và email từ lời nhắc. Mô hình AI này được phát hành miễn phí, có thể sử dụng đa mục đích, gồm cả thương mại.

DeepSeek cho biết trong các thử nghiệm nội bộ, V3 "vượt trội so với các mô hình có thể tải về hiện nay", tính cả mã nguồn mở và nguồn đóng.

Tuy nhiên, trong thử nghiệm của trang TechCrunch và một số chia sẻ của người dùng trên mạng xã hội, DeepSeek V3 lại tự nhận nó là ChatGPT. Khi được yêu cầu giải thích, V3 khẳng định mình là phiên bản của GPT-4, được OpenAI phát hành năm 2023.

deepseek-bi-tan-cong-mang-sau-khi-reo-rac-noi-so-o-thung-lung-silicon-khien-von-hoa-nvidia-giam-ky-luc.jpg
DeepSeek V3 lại tự nhận là ChatGPT

Khi đặt câu hỏi liên quan đến API của DeepSeek, V3 lại hướng dẫn cách sử dụng API của OpenAI. Nó thậm chí kể một số câu chuyện cười, những câu đùa dí dỏm theo phong cách GPT-4.

DeepSeek không đề cập đến nguồn dữ liệu đào tạo V3. Tuy nhiên, theo suy đoán của TechCrunch, mô hình có thể đang dùng lại các tập dữ liệu công khai chứa văn bản do GPT-4 tạo ra thông qua ChatGPT.

"Nếu được đào tạo trên những dữ liệu này, DeepSeek V3 có thể đã ghi nhớ một số câu trả lời đầu ra của GPT-4 và lặp lại nguyên văn", TechCrunch bình luận.

Mike Cook, nhà nghiên cứu chuyên về AI tại Đại học Nhà vua London, có quan điểm tương tự. "Rõ ràng mô hình nhận phản hồi thô từ ChatGPT tại một giai đoạn nào đó, nhưng không rõ khi nào. Có thể vô tình, thực tế không hiếm trường hợp tận dụng kết quả của mô hình này để đào tạo mô hình khác", Mike Cook nói.

Mike Cook lưu ý cách này "rất tệ", vì có thể dẫn đến hiện tượng "ảo giác", tạo ra những câu trả lời gây hiểu lầm. "Giống như chụp ảnh bản sao của bản sao, mô hình sẽ dần mất nhiều thông tin và kết nối với thực tế", ông giải thích.

Ngoài ra, Mike Cook cho rằng việc lấy dữ liệu của mô hình này cho cái khác có thể vi phạm điều khoản. Chẳng hạn, OpenAI cấm người dùng sản phẩm của mình sử dụng kết quả đầu ra để phát triển các mô hình cạnh tranh.

Cuối năm ngoái, Sam Altman (Giám đốc điều hành OpenAI) được cho đã chế giễu DeepSeek. "Thật dễ để sao chép một thứ mà bạn biết là hiệu quả. Thật khó để làm điều gì đó mới mẻ, mạo hiểm và khó khăn khi bạn không biết liệu nó có hiệu quả hay không", ông viết trên mạng xã hội X.

Song hôm 27.1, Sam Altman thừa nhận hiệu suất ấn tượng của DeepSeek R1 trên X. Doanh nhân 39 tuổi người Mỹ gọi R1 là "một mô hình ấn tượng", đặc biệt khi xét đến những gì DeepSeek có thể đạt được với mức chi phí đó. Tuy nhiên, Sam Altman nhấn mạnh rằng OpenAI vẫn sẽ tập trung vào sức mạnh tính toán, coi đây là yếu tố cốt lõi để thực hiện các sứ mệnh dài hạn.

Bài liên quan
'Khoảnh khắc Sputnik' của AI do DeepSeek R1 tạo ra khiến giá Bitcoin thủng mốc 100.000 USD
Giá Bitcoin giảm xuống dưới mốc 100.000 USD hôm 27.1, chạm mức thấp nhất trong 11 ngày.

(0) Bình luận
Nổi bật Một thế giới
Thị trường mùng 3 tết sẽ sôi động hơn, cần theo dõi giá các mặt hàng thiết yếu
Thị trường ngày mùng 3 Tết Nguyên đán Ất Tỵ (2025) dự kiến sẽ sôi động hơn do người dân bắt đầu các hoạt động vui chơi, du xuân. Nhu cầu đi lại và mua sắm các mặt hàng thiết yếu, đặc biệt là tại các trung tâm thương mại và khu vui chơi giải trí, dự kiến sẽ tăng lên.
Đừng bỏ lỡ
Mới nhất
POWERED BY ONECMS - A PRODUCT OF NEKO
Microsoft và quan chức AI ở Nhà Trắng nghi DeepSeek thu thập trái phép dữ liệu của OpenAI