GLM-5.2 của Z.ai áp sát OpenAI, Anthropic ở phân khúc AI tiên tiến
GLM-5.2 được giới công nghệ Mỹ chú ý vì có khả năng lập trình và tác tử AI tiệm cận mô hình hàng đầu của OpenAI, Anthropic với chi phí sử dụng chỉ bằng khoảng 1/6.
Kể từ khi startup DeepSeek gây chấn động thị trường vào đầu năm ngoái với mô hình suy luận R1 có chi phí thấp nhưng hiệu năng mạnh mẽ, người dùng toàn cầu gần như đứng trước hai lựa chọn: Sử dụng các mô hình AI của Trung Quốc với giá rẻ hơn nhưng năng lực hạn chế hơn, hoặc chọn sản phẩm của OpenAI và Anthropic - những công ty đã đầu tư hàng chục tỉ USD để phát triển AI tiên tiến.
Được startup Z.ai (Trung Quốc) ra mắt vào tháng trước, GLM-5.2 có thể đang dần thu hẹp khoảng cách đó, ít nhất là về mức độ quan tâm từ thị trường phương Tây.
Hiệu năng của GLM-5.2 tiệm cận các mô hình AI hàng đầu Mỹ
GLM-5.2 đang tạo ra nhiều cuộc thảo luận sôi nổi tại Thung lũng Silicon (Mỹ) nhờ khả năng lập trình và năng lực tác tử AI, tức AI có thể tự thực hiện những tác vụ phức tạp chỉ với rất ít chỉ dẫn từ người dùng.
Hiệu năng của GLM-5.2 được đánh giá gần tiệm cận các sản phẩm AI hàng đầu Mỹ nhưng với chi phí chỉ bằng một phần nhỏ. Một số chuyên gia gọi đây là "khoảnh khắc DeepSeek thu nhỏ".
GLM-5.2 nhanh chóng trở thành một trong những mô hình AI được sử dụng nhiều nhất trên các nền tảng dành cho nhà phát triển như OpenRouter, thậm chí vượt qua các sản phẩm của Anthropic về mức độ sử dụng. Năng lực của GLM-5.2 cũng nhận được nhiều lời khen từ các lãnh đạo công nghệ, trong đó có Sridhar Ramaswamy (Giám đốc điều hành Snowflake) và nhà đầu tư mạo hiểm Marc Andreessen.
"Giờ đây, chúng ta đã có một mô hình trọng số mở Trung Quốc với chất lượng ngang ngửa các mô hình AI hiện nay của OpenAI và Anthropic", David Sacks, cựu cố vấn AI cho Tổng thống Donald Trump, nhận định trước thời điểm Mỹ dỡ bỏ các hạn chế với Claude Fable 5 và Claude Mythos 5 hôm 30/6. Claude Fable 5 và Claude Mythos 5 là hai mô hình AI tiên tiến của Anthropic hiện nay.
Những năng lực này đã đưa GLM-5.2 trở thành tâm điểm của cuộc tranh luận ngày càng gay gắt về việc liệu Trung Quốc cuối cùng có đang bắt kịp Mỹ trong cuộc đua AI hay không.
Trong khi đó, nhiều lãnh đạo ngành công nghệ cảnh báo rằng các chính sách quản lý thiếu ổn định và khó dự đoán của Mỹ có nguy cơ làm suy yếu lợi thế dẫn đầu trong lĩnh vực công nghệ AI tiên tiến.
"GLM-5.2 chỉ kém Opus 4.8 của Anthropic một chút và gần như ngang hàng với GPT-5.5 của OpenAI", David Sacks nói trong podcast All-In, đồng thời nhấn mạnh: "Chúng ta không thể tự làm những điều khiến các công ty của mình phát triển chậm lại".

Lý do lượng sử dụng GLM-5.2 tăng mạnh
Một số chuyên gia cho rằng việc Mỹ từng hạn chế quyền truy cập hai mô hình AI tiên tiến của Anthropic, cùng với việc OpenAI trì hoãn phát hành rộng rãi GPT-5.6, đã góp phần khiến nhu cầu toàn cầu với GLM-5.2 tăng mạnh.
"Cộng đồng lập trình viên quốc tế ngày càng nhận ra rằng việc chỉ phụ thuộc vào các mô hình AI độc quyền của Mỹ tiềm ẩn nhiều rủi ro", Brian Tse, nhà sáng lập kiêm giám đốc điều hành Concordia AI - hãng tư vấn an toàn AI tại thủ đô Bắc Kinh, cho biết.
Sự đón nhận tích cực của thị trường quốc tế với GLM-5.2 cũng phản ánh xu hướng ngày càng nhiều doanh nghiệp quan tâm tới các mô hình AI mở giá rẻ.
Lý do là chi phí sử dụng các mô hình AI mã nguồn đóng liên tục tăng và khó dự báo, nhất là khi tác tử AI thường tiêu thụ nhiều token hơn để thực hiện những tác vụ phức tạp.
Token là đơn vị dữ liệu mà mô hình AI xử lý hoặc tạo ra, có thể là một từ, một phần của từ, hoặc thậm chí là dấu câu. Nhiều công ty sử dụng token như một đơn vị kinh tế để đo lường khối lượng tính toán mà AI thực hiện. Văn bản càng dài thì càng cần nhiều token để xử lý, vì vậy chi phí thường được tính theo số token (trên mỗi nghìn hoặc mỗi triệu token).
Z.ai, còn được biết đến với tên Zhipu AI, từ chối bình luận. Trong khi đó, Anthropic và OpenAI chưa đưa ra phản hồi về thông tin trên.
Hiện GLM-5.2 đứng thứ năm trên bảng xếp hạng năng lực mô hình ngôn ngữ lớn của Artificial Analysis.
Artificial Analysis là nền tảng đánh giá độc lập chuyên theo dõi, so sánh và xếp hạng các mô hình AI về tạo văn bản, hình ảnh, video, suy luận, lập trình. Công ty này xây dựng các bảng đánh giá chuẩn để đo lường chất lượng, tốc độ, chi phí và hiệu năng của từng mô hình. Từ đó, doanh nghiệp, nhà phát triển và giới đầu tư sẽ hiểu rõ mô hình AI nào đang dẫn đầu, có lợi thế về giá hay khả năng mở rộng.
GLM-5.2 xếp thứ hai trên bảng xếp hạng Code Arena về khả năng phát triển giao diện web và ứng dụng front-end.
Ứng dụng front-end là phần giao diện mà người dùng nhìn thấy và tương tác trực tiếp trên trình duyệt hoặc ứng dụng, gồm mọi thứ như bố cục, nút bấm, biểu mẫu, menu, hình ảnh và các hiệu ứng hiển thị.
Đáng chú ý, GLM-5.2 hoạt động với chi phí vận hành chỉ bằng khoảng 1/6 so với các mô hình AI tiên tiến mã nguồn đóng của Mỹ như Claude hay GPT.
Z.ai chưa công bố đã chi bao nhiêu tiền để phát triển GLM-5.2.
Trong một phản hồi gửi tới Elon Musk trên mạng xã hội X vào tháng trước, nhà sáng lập Z.ai là Tang Jie cho biết startup Trung Quốc này có thể tạo ra một mô hình ngang tầm Claude Fable 5 trước quý I/2027.
"Theo tôi, thay đổi lớn nhất mà GLM-5.2 mang lại là mô hình AI mở giờ đây đã trở thành một sản phẩm có thể cài đặt và sử dụng ngay", Tiezhen Wang, cựu giám đốc khu vực châu Á - Thái Bình Dương của nền tảng mã nguồn mở Hugging Face, nhận định.
"Bạn chỉ cần triển khai mô hình AI, không cần xây dựng các hệ thống tinh chỉnh phức tạp là đã có thể sử dụng ngay với hiệu quả rất cao. Điều này giúp hạ thấp đáng kể rào cản để các doanh nghiệp áp dụng AI mã nguồn mở", ông nói thêm
Rào cản lớn nhất với GLM-5.2: Doanh nghiệp Mỹ vẫn dè chừng AI Trung Quốc
Một trong những rào cản lớn nhất với việc GLM-5.2 được triển khai ở quy mô lớn: Những lo ngại về bảo mật dữ liệu. Đây cũng là nguyên nhân khiến nhiều doanh nghiệp Mỹ, đặc biệt trong các lĩnh vực chịu quản lý chặt chẽ như ngân hàng và an ninh mạng, còn dè dặt với các mô hình AI của Trung Quốc.
Theo Tiezhen Wang, việc chuyển đổi hoặc nâng cấp hệ thống AI trong doanh nghiệp thường mất nhiều tháng.
"Tôi đã thấy một số doanh nghiệp châu Âu bắt đầu thảo luận về khả năng sử dụng GLM-5.2 trong môi trường doanh nghiệp", Wei Sun, chuyên gia phân tích AI cấp cao của hãng nghiên cứu thị trường Counterpoint Research, cho biết.
"Song tại Liên minh châu Âu và Mỹ, nhiều khách hàng, đối tác cũng như các ngành nghề chịu sự quản lý nghiêm ngặt đơn giản là không muốn đưa mô hình AI Trung Quốc vào hạ tầng AI của họ, bất kể hiệu năng hay giá thành hấp dẫn đến đâu", Wei Sun nói thêm.
Một báo cáo công bố đầu năm nay từ tổ chức nghiên cứu phi lợi nhuận RAND, dựa trên dữ liệu lưu lượng truy cập website tại 135 quốc gia, cho thấy thị phần toàn cầu của các mô hình ngôn ngữ lớn Trung Quốc đã tăng từ 3% lên 13% chỉ trong vòng hai tháng sau khi DeepSeek phát hành R1 vào tháng 1/2025.
Việc DeepSeek ra mắt R1 từng gây ra đợt bán tháo cổ phiếu công nghệ trên toàn cầu, bởi mô hình này cho thấy có thể xây dựng AI hiệu năng cao với chi phí thấp hơn rất nhiều so với hàng trăm tỉ USD mà các công ty phương Tây đang chi cho hạ tầng AI.
Mức tăng trưởng sử dụng mô hình AI Trung Quốc đặc biệt mạnh tại các nước đang phát triển cũng như những quốc gia có quan hệ chính trị và kinh tế gần gũi với Bắc Kinh.
Một số chuyên gia cho rằng các lo ngại về độ an toàn của mô hình AI Trung Quốc đang bị thổi phồng quá mức, theo hãng tin Reuters. Theo họ, nếu các mô hình AI này được triển khai trên hạ tầng đám mây Mỹ hoặc trên máy chủ riêng của doanh nghiệp thì dữ liệu vẫn có thể được bảo vệ an toàn.
Trong khi các tập đoàn lớn thường chuyển đổi rất chậm do quy trình phức tạp, các startup cùng doanh nghiệp vừa và nhỏ lại đang triển khai AI nhanh hơn nhiều.
"Các lập trình viên thường không quá quan tâm mô hình AI đến từ quốc gia nào. Điều họ chú ý là mô hình AI có hoạt động tốt hay không, chi phí bao nhiêu và có thể triển khai hoặc truy cập ổn định hay không", Poe Zhao, chuyên gia phân tích công nghệ Trung Quốc và là người sáng lập bản tin Hello China Tech, nhận định.
"Kịch bản nhiều khả năng xảy ra sẽ là các doanh nghiệp sử dụng kết hợp nhiều mô hình AI khác nhau, chứ không phải chỉ sau một đêm thay thế hoàn toàn OpenAI hay Anthropic. Vì vậy, đúng là đây là một 'khoảnh khắc DeepSeek thu nhỏ', nhưng chỉ trong phạm vi hẹp hơn và chủ yếu diễn ra trong cộng đồng các nhà phát triển AI", Poe Zhao nói thêm.