Mã nguồn Claude Code là kho báu, với các công ty và lập trình viên Trung Quốc
Vụ rò rỉ mã nguồn Claude Code của Anthropic gây xôn xao giới lập trình viên Trung Quốc.
Các lập trình viên Trung Quốc đang rất hào hứng, tranh nhau tải xuống bản sao mã nguồn Claude Code bị rò rỉ và nghiên cứu kỹ lưỡng các file để tìm hiểu chi tiết.
Chưa đầy một năm sau khi Anthropic gọi Trung Quốc là “quốc gia thù địch” và tuyên bố sẽ hạn chế nước này tiếp cận công nghệ của mình, công ty khởi nghiệp AI (trí tuệ nhân tạo) Mỹ vô tình làm lộ hơn 512.000 dòng mã nguồn Claude Code. Sự cố này gây ra cơn sốt trong giới lập trình viên Trung Quốc.
Claude Code là tác tử AI lập trình nổi tiếng của Anthropic, giúp lập trình viên viết mã, sửa lỗi, chạy lệnh, đọc/ghi file và tự động hóa các tác vụ kỹ thuật.
Vụ rò rỉ xảy ra sau khi một nhân viên Anthropic vô tình đưa mã nguồn đã sửa đổi của Claude Code vào một file trong gói phần mềm được lưu trữ trực tuyến.
Mã nguồn Claude Code, với hơn 512.000 dòng và nằm sâu trong gói phần mềm, đã được nhà nghiên cứu an ninh mạng Shou Chaofan phát hiện và giải mã hôm 31.3, sau đó đăng lên mạng xã hội X. Anh dẫn link đến một file zip chứa mã nguồn Claude Code bị rò rỉ.
Theo tài khoản LinkedIn cá nhân, Chaofan Shou là Giám đốc công nghệ Fuzzland và từng bỏ dở chương trình tiến sĩ tại Đại học California - Berkeley (Mỹ). Đến nay, bài đăng của Shou Chaofan đã đạt hơn 34 triệu lượt xem, thu hút sự chú ý của cộng đồng công nghệ toàn cầu, đặc biệt là tại Trung Quốc. Thế nhưng, link hiện đã trả về lỗi 404 khi truy cập.
Fuzzland là hãng công nghệ hoạt động trong lĩnh vực bảo mật
blockchain/Web3, chuyên phát hiện và ngăn chặn lỗ hổng trong các hợp đồng thông minh.
Giống như OpenAI (công ty khởi nghiệp AI đứng sau ChatGPT) và Google, Anthropic không cung cấp dịch vụ của mình tại Trung Quốc đại lục, với lý do lo ngại về an ninh quốc gia. Do đó, Trung Quốc là một trong số ít quốc gia, cùng với Nga, Triều Tiên, Afghanistan, Iran và Cuba, không thể chính thức sử dụng chatbot và mô hình AI Claude của Anthropic. Tất nhiên, người dân ở các nước này có thể sử dụng mạng riêng ảo (VPN) để tiếp cận Claude.
Nhiều nhà phát triển Trung Quốc rất ưa thích các mô hình AI Claude của Anthropic cũng như Claude Code, nhờ khả năng tiên tiến giúp tự động hóa các tác vụ lập trình, từ viết mã đến gỡ lỗi và tăng hiệu quả phát triển phần mềm, dù phải truy cập dịch vụ thông qua VPN.

Kể từ hôm 31.3, các nhà phát triển Trung Quốc đã “hoạt động hết công suất”, đua nhau tải về các bản sao mã nguồn Claude Code bị lộ để tìm hiểu từng chi tiết. Một số người đã chia sẻ những gì họ cho là công thức bí mật của Claude Code, từ kiến trúc và thiết kế tác tử AI đến cơ chế bộ nhớ, cùng nhiều thứ khác, trong các bài đăng trên mạng xã hội, thu hút lượng lớn người xem và tạo ra nhiều cuộc thảo luận sôi nổi.
Chủ đề “Sự cố rò rỉ mã nguồn Claude Code” đã thu hút hơn gần 3 triệu lượt xem, với nhiều nhà phát triển Trung Quốc chia sẻ những gì đã học được và đề xuất cách tận dụng tác tử AI lập trình này tốt hơn.
Một người phát ngôn của Anthropic nói rằng vụ rò rỉ là do “lỗi của con người”, không phải vi phạm an ninh và nhấn mạnh rằng dữ liệu khách hàng không bị ảnh hưởng.
“Không có dữ liệu khách hàng nhạy cảm hoặc thông tin đăng nhập nào bị ảnh hưởng hoặc lộ. Đây là sự cố trong quá trình đóng gói bản phát hành do lỗi con người, không phải là xâm phạm an ninh. Chúng tôi đang triển khai các biện pháp để ngăn chặn điều này xảy ra lần nữa”, người phát ngôn của Anthropic tuyên bố.
“Mã nguồn Claude Code là kho báu với các công ty AI hoặc nhà phát triển”
Anthropic đã nhanh chóng xóa file gây ra sự cố và cũng vội vàng yêu cầu các trang lưu trữ mã nguồn, gồm cả GitHub - nền tảng lớn nhất thế giới thuộc loại này, gỡ bỏ các bản sao trực tuyến mã nguồn Claude Code.
Các chuyên gia trong ngành cho biết file bị rò rỉ chỉ chứa mã nguồn Claude Code, chứ không phải trọng số mô hình, vốn rất quan trọng với một công ty AI có mã nguồn đóng.
“Thế nhưng, các đoạn mã nguồn thực sự là kho báu với các công ty AI hoặc nhà phát triển, vì tiết lộ tất cả quyết định kỹ thuật quan trọng mà Anthropic đã đưa ra”, Zhang Ruiwang, kiến trúc sư hệ thống CNTT tại Bắc Kinh (thủ đô Trung Quốc), nhận định.

Gabriel Bernadett-Shapiro, nhà nghiên cứu AI tại hãng an ninh mạng SentinelOne, cho biết điều đáng chú ý nhất của vụ lộ mã nguồn Claude Code là vén màn cách Anthropic định hình tương lai của các tác tử AI lập trình.
Ông nói các đối thủ cạnh tranh có thể đã ghi chép lại cách Anthropic tiếp cận các vấn đề, chẳng hạn bộ nhớ của tác tử AI.
"Bất kỳ đối thủ cạnh tranh nào cũng có thể sử dụng kiến thức đó như kiểu: Được rồi, đây là cách Anthropic đang làm, phải không? Điều này có phù hợp với mô hình của chúng ta không?", Gabriel Bernadett-Shapiro nói.
Ngay sau vụ rò rỉ, giới công nghệ bắt đầu phân tích hàng nghìn dòng mã Claude Code. Họ đã chụp ảnh màn hình các tham chiếu đến các mô hình AI chưa được Anthropic phát hành như Opus 4.7, Sonnet 4.8, cùng tên mã như Capybara và Tengu.
Một người dùng Reddit cho biết phát hiện thú cưng kiểu Tamagotchi “ngồi cạnh ô nhập liệu và phản ứng với việc bạn viết mã”.
Một người khác tìm thấy KAIROS, một tác tử AI chạy 24/7 và tạo nhật ký hàng ngày, được mô tả như “đồng đội toàn năng, xử lý mọi thứ trước cả khi bạn nghĩ đến”.
Boris Cherny, người tạo ra Claude Code, phản hồi rằng Anthropic "luôn luôn thử nghiệm" và 90% các thử nghiệm không được phát hành. Về KAIROS, Boris Cherny nói: "Tôi vẫn đang phân vân về điều này. Chúng tôi có nên phát hành nó không?".
Có cả phân tích về việc chửi thề. Một người dùng phát hiện ra rằng Claude sẽ ghi lại các từ chửi thề là tiêu cực. Anh ta viết: "Anthropic đang theo dõi tần suất bạn nổi giận với AI của mình".
Boris Cherny trả lời rằng những tín hiệu này xác định xem người dùng có trải nghiệm tốt hay không. "Chúng tôi đưa nó lên bảng điều khiển và gọi là biểu đồ chửi thề", ông viết.
Điều đáng chú ý là nhân viên Anthropic gây ra vụ rò rỉ không bị sa thải. Boris Cherny nói: “Đó chỉ là một sai sót vô tình. Chuyện này đôi khi vẫn xảy ra”.