Sinh viên tái tạo Claude Code từ mã nguồn rò rỉ và giải mã bí mật của Anthropic
Sigrid Jin thức dậy lúc 4 giờ sáng 31.3 khi điện thoại liên tục nhận được tin nhắn về vụ rò rỉ mã nguồn Claude Code - tác tử AI lập trình nổi tiếng do Anthropic phát triển.
Sigrid Jin, chàng sinh viên 25 tuổi tại Đại học British Columbia (Canada), lập tức bắt tay vào việc. Chỉ với 10 OpenClaw, một chiếc MacBook Pro và vài giờ, Sigrid Jin cùng một người khác đã tái tạo mã nguồn của Claude Code và chia sẻ với thế giới.
OpenClaw là nền tảng tác tử AI đang gây sốt, có thể thực hiện nhiều nhiệm vụ, từ đặt chỗ ăn tối, theo dõi email, làm việc với các công ty bảo hiểm, làm thủ tục chuyến bay và thực hiện vô số tác vụ khác. Khác với chatbot truyền thống, OpenClaw có khả năng kết nối với nhiều dịch vụ trực tuyến, duy trì nhiệm vụ trong thời gian dài và chủ động hoàn thành các yêu cầu như nghiên cứu thông tin, soạn thảo văn bản, quản lý lịch làm việc hay xử lý email.
Ba giờ trước đó, người dùng mạng xã hội X có tên Chaofan Shou đăng tải rằng anh vô tình phát hiện vụ rò rỉ hơn 512.000 dòng mã nguồn Claude Code, gồm cả chi tiết cách tác tử AI lập trình nổi tiếng này hoạt động và các bài kiểm tra cho tính năng mới.
Dù Anthropic nhanh chóng siết chặt việc phát tán trái phép mã nguồn Claude Code, bản tái tạo của Sigrid Jin, được thực hiện cùng Yeachan Heo tại Seoul (thủ đô Hàn Quốc) bằng Python và đặt tên là Claw Code, đến nay vẫn chưa bị ảnh hưởng.
“Thật bất ngờ, chưa có ai từ Anthropic hay GitHub liên hệ với chúng tôi. Dù vậy, chúng tôi vẫn chủ động chuẩn bị cho mọi khả năng pháp lý, vì mục tiêu chính của chúng tôi là đảm bảo thực hiện việc này hoàn toàn hợp pháp”, Sigrid Jin chia sẻ với trang Insider. Claw Code hiện có trên GitHub - nền tảng trực tuyến giúp lưu trữ, quản lý và chia sẻ mã nguồn cho các dự án phần mềm.
Đây là nghịch lý thú vị với ngành công nghiệp từng bị cáo buộc sử dụng dữ liệu công khai để huấn luyện mô hình AI, và công ty (Anthropic) luôn quảng bá cam kết an toàn như lợi thế cạnh tranh. Các lập trình viên cũng rất vui mừng khi được xem xét kỹ hơn về tác tử AI đã trở nên quan trọng với công việc của họ, đặc biệt là sau khi Anthropic ra mắt mô hình được đánh giá cao như Opus 4.5 và 4.6 gần đây.
“Theo tôi, điều tuyệt nhất tự vụ rò rỉ này là giúp các công cụ lập trình AI trở nên phổ biến và dễ tiếp cận hơn với nhiều người”, Sigrid Jin nói.
“Những người không chuyên về kỹ thuật đang sử dụng các tác tử AI này để xây dựng những thứ thực tế. Chúng ta đang nói về bác sĩ tim mạch tạo ra các ứng dụng chăm sóc bệnh nhân và luật sư tự động hóa việc phê duyệt giấy phép. Nó đã trở thành bữa tiệc chia sẻ khổng lồ”, nam sinh viên chia sẻ với Insider.

“Không có dữ liệu khách hàng nhạy cảm hoặc thông tin đăng nhập nào bị ảnh hưởng hoặc bị lộ. Đây là sự cố trong quá trình đóng gói bản phát hành do lỗi con người, không phải là xâm phạm an ninh. Chúng tôi đang triển khai các biện pháp để ngăn chặn điều này xảy ra lần nữa”, người phát ngôn của Anthropic cho biết.
Trong khi đó, giới công nghệ vẫn tiếp tục chia sẻ các bản sao trong những máy chủ Discord riêng tư và phân tích một số tính năng mới, chẳng hạn cơ chế giống “thú ảo” tương tác với người dùng trong quá trình lập trình và hệ thống có thể chạy nền liên tục để hỗ trợ công việc.
Song song đó, nhiều người cũng thắc mắc vì sao một công ty AI hàng đầu thế giới lại để xảy ra vụ rò rỉ này.
“Sự khám phá lớn về quy trình làm việc”
Bài đăng lúc 1 giờ 23 sáng 31.3 của Chaofan Shou trên X đã châm ngòi cho mọi thứ. Anh dẫn link đến một file zip chứa mã nguồn Claude Code bị rò rỉ. Theo tài khoản LinkedIn cá nhân, Chaofan Shou là Giám đốc công nghệ Fuzzland và từng bỏ dở chương trình tiến sĩ tại Đại học California - Berkeley (Mỹ). Hiện tại, đường link đã trả về lỗi 404 khi truy cập.
Fuzzland là hãng công nghệ hoạt động trong lĩnh vực bảo mật blockchain/Web3, chuyên phát hiện và ngăn chặn lỗ hổng trong các hợp đồng thông minh.
Một giờ sau, người dùng X @nichxbt tải mã nguồn này lên GitHub, kéo theo hàng nghìn bản sao xuất hiện. Đến tối 31.3, Anthropic đã gửi yêu cầu gỡ bỏ trên diện rộng dựa vào bản quyền, khiến GitHub ban đầu xóa hơn 8.000 phiên bản mã nguồn Claude Code bị rò rỉ.
Một số kho lưu trữ mã không liên quan của các lập trình viên khác cũng bị ảnh hưởng. Đến sáng 1.4, Anthropic đã thu hẹp yêu cầu gỡ bỏ của mình. "Chúng tôi đã rút lại thông báo với tất cả, ngoại trừ kho lưu trữ của @nichxbt mà chúng tôi nêu tên. GitHub đã khôi phục quyền truy cập vào các nhánh bị ảnh hưởng", một phát ngôn viên của Anthropic cho hay.
Tính đến chiều 1.4, các trang web khác vẫn tiếp tục cung cấp quyền truy cập vào mã nguồn Claude Code bị lộ hoặc những công cụ được xây dựng dựa trên thông tin từng là độc quyền của Anthropic. Mã nguồn Claude Code vẫn tiếp tục lan truyền trong các tin nhắn riêng tư và liên kết trực tuyến.
Claw Code, bản sao mã nguồn Claude Code của Sigrid Jin, hiện đã có 105.000 lượt đánh dấu sao và 95.000 lượt sao chép trên GitHub. Chỉ trong một ngày, 5.000 người đã tham gia máy chủ Discord của Sigrid Jin - cộng đồng mã nguồn mở về mô hình ngôn ngữ lớn của Hàn Quốc, anh cho biết.
Trong khi đó, các đối thủ cạnh tranh của Anthropic dường như đang đổ thêm dầu vào lửa. Sigrid Jin đăng tải rằng xAI đã gửi cho anh điểm thưởng Grok. "Rất hào hứng được thấy những gì cậu tiếp tục xây dựng!", Umesh Khanna (nhà tuyên dụng của xAI) phản hồi.
Sigrid Jin nói rằng tất cả giống "sự khám phá lớn về quy trình làm việc", cho thấy anh có thể sử dụng AI để tái tạo toàn bộ công cụ bằng một ngôn ngữ mới, trong trường hợp này là Python. "Việc đó là khả thi, kết hợp với tốc độ thực hiện cực nhanh, thực sự khiến mọi người kinh ngạc", Sigrid Jin thổ lộ.
Cộng đồng mạng phát hiện được gì trong mã nguồn Claude Code?
Gabriel Bernadett-Shapiro, nhà nghiên cứu AI tại hãng an ninh mạng SentinelOne, cho biết điều đáng chú ý nhất của vụ lộ mã nguồn Claude Code là vén màn cách Anthropic định hình tương lai của các tác tử AI lập trình.
Ông nói các đối thủ cạnh tranh có thể đã ghi chép lại cách Anthropic tiếp cận các vấn đề, chẳng hạn bộ nhớ của tác tử AI.
"Bất kỳ đối thủ cạnh tranh nào cũng có thể sử dụng kiến thức đó như kiểu: Được rồi, đây là cách Anthropic đang làm, phải không? Điều này có phù hợp với mô hình của chúng ta không?", Gabriel Bernadett-Shapiro nói.
Ngay sau vụ rò rỉ, giới công nghệ bắt đầu phân tích hàng nghìn dòng mã Claude Code. Họ đã chụp ảnh màn hình các tham chiếu đến các mô hình AI chưa được Anthropic phát hành như Opus 4.7, Sonnet 4.8, cùng tên mã như Capybara và Tengu.
Một người dùng Reddit cho biết phát hiện thú cưng kiểu Tamagotchi “ngồi cạnh ô nhập liệu và phản ứng với việc bạn viết mã”.
Một người khác tìm thấy KAIROS, một tác tử AI chạy 24/7 và tạo nhật ký hàng ngày, được mô tả như “đồng đội toàn năng, xử lý mọi thứ trước cả khi bạn nghĩ đến”.
Boris Cherny, người tạo ra Claude Code, đã lên tiếng. Ông viết rằng Anthropic "luôn luôn thử nghiệm" và 90% các thử nghiệm không được phát hành. Về KAIROS, Boris Cherny nói: "Tôi vẫn đang phân vân về điều này. Chúng tôi có nên phát hành nó không?".

Có cả phân tích về việc chửi thề. Một người dùng phát hiện ra rằng Claude sẽ ghi lại các từ chửi thề là tiêu cực. Anh ta viết: "Anthropic đang theo dõi tần suất bạn nổi giận với AI của mình".
Boris Cherny trả lời rằng những tín hiệu này xác định xem người dùng có trải nghiệm tốt hay không. "Chúng tôi đưa nó lên bảng điều khiển và gọi là biểu đồ chửi thề", ông viết.
Tác tử AI liên quan đến vụ Anthropic bị lộ mã nguồn Claude Code?
Delip Rao, nhà nghiên cứu AI tại Đại học Pennsylvania (Mỹ) từng làm việc tại Amazon và Twitter, không quan tâm đến nội dung của vụ rò rỉ mà là cách xảy ra.
“Anthropic tuyển dụng những người thực sự thông minh. Rất khó tin một nhân viên ở đó lại mắc lỗi kiểu người mới vào nghề như vậy”, ông nói.
Ông đưa ra giả thuyết rằng một tác tử AI có thể liên quan đến vụ Anthropic bị lộ mã nguồn Claude Code. Delip Rao so sánh vụ việc này với sự cố gần đây trong hoạt động thương mại điện tử của Amazon, được cho có liên quan đến trợ lý lập trình AI Q.
Một số người dùng mạng xã hội cũng có suy đoán tương tự Delip Rao. Một người dùng X đã chụp ảnh màn hình một tweet của Boris Cherny, trong đó ông viết: "100% đóng góp của tôi cho Claude Code được viết bởi Claude Code". Bài đăng này đã nhận được hàng trăm lượt thích.
Tuy nhiên, Boris Cherny đã trực tiếp trả lời bài đăng đó, bác bỏ những tin đồn. “Đó là lỗi con người. Quy trình triển khai của chúng tôi có vài bước thủ công và một bước đã không được thực hiện đúng. Chúng tôi đã cải thiện vài cải tiến và sẽ bổ sung các bước kiểm tra tính hợp lý”.
Boris Cherny cho rằng giải pháp là tăng tốc chứ không phải chậm lại: “Tự động hóa nhiều hơn và để Claude kiểm tra kết quả”.
Nhân viên Anthropic gây ra vụ rò rỉ mã nguồn Claude Code không bị sa thải
David Borish, chiến lược gia AI tại hãng tư vấn công nghệ Trace3, cảm thấy tiếc cho Dario Amodei - Giám đốc điều hành Anthropic. Ông thấy nhiều người trên mạng sử dụng những bài học từ mã nguồn Claude Code để cải thiện sản phẩm riêng, ngay cả khi họ không phải là khách hàng của Anthropic. Là doanh nhân, ông không thể hiểu nổi một vụ rò rỉ như vậy.
Tuy vậy, David Borish cho rằng nguyên nhân là do tốc độ phát triển quá nhanh của Anthropic, theo triết lý “hành động nhanh và phá vỡ mọi thứ”.
“Không thể vừa kiểm soát an toàn chặt chẽ, vừa phát triển nhanh đến mức như vậy”, ông nhận xét.
Điều đáng chú ý là nhân viên Anthropic gây ra vụ rò rỉ không bị sa thải. Boris Cherny nói: “Đó chỉ là một sai sót vô tình. Chuyện này đôi khi vẫn xảy ra”.