OpenAI, Anthropic đối mặt thực tế mới khi làn sóng tokenmaxxing hạ nhiệt
Chi phí của startup Lindy đang tăng ngoài tầm kiểm soát và Giám đốc điều hành Flo Crivello chỉ còn một cách để giải quyết.
Đầu tháng 6, Lindy đã ngừng hoàn toàn việc sử dụng các mô hình Claude của Anthropic và chuyển sang DeepSeek. Đây là công ty AI Trung Quốc cung cấp các mô hình trọng số mở có chi phí rẻ hơn nhiều.
"Chúng tôi chuyển sang DeepSeek và đường cong chi phí gần như lao thẳng xuống đất", Flo Crivello nói trong cuộc phỏng vấn với kênh CNBC tại trụ sở Lindy ở thành phố San Francisco (Mỹ).
Theo Flo Crivello, quyết định này sẽ giúp Lindy tiết kiệm hàng triệu USD chỉ trong vài tháng, dù startup có khoảng 25 nhân viên này vẫn sẽ chi tiêu cho AI nhiều hơn cả quỹ lương.
"Đây đơn giản là vấn đề sống còn của doanh nghiệp", Flo Crivello nhấn mạnh.
Lindy là startup AI của Mỹ chuyên phát triển nền tảng tạo tác tử AI không cần lập trình, giúp doanh nghiệp tự động hóa các quy trình làm việc như xử lý email, quản lý lịch, chăm sóc khách hàng và cập nhật dữ liệu kinh doanh.
Từng làm gần 5 năm tại Uber, Flo Crivello là một trong số ngày càng nhiều nhà sáng lập và lãnh đạo doanh nghiệp ở Mỹ đang tìm cách cắt giảm chi phí AI.
Kể từ khi ChatGPT của OpenAI gây sốt vào cuối năm 2022, các công ty đổ hàng tỉ USD vào AI để triển khai công nghệ này trong chăm sóc khách hàng, tiếp thị, tài chính và nhiều lĩnh vực khác.
Đặc biệt, chi phí bùng nổ trong lĩnh vực lập trình bằng AI. Các lập trình viên liên tục tiêu thụ lượng lớn token để phát triển công cụ và dịch vụ mới. Điều này tạo ra thời kỳ được gọi là tokenmaxxing, tức doanh nghiệp khuyến khích nhân viên sử dụng AI càng nhiều càng tốt mà ít quan tâm đến hiệu quả hay chi phí.
Tuy nhiên, làn sóng chi tiêu không giới hạn cho AI đang bắt đầu hạ nhiệt. Uber vừa áp dụng các mức giới hạn chi tiêu cho một số công cụ AI, với hạn mức cơ bản là 1.500 USD mỗi tháng. Nhân viên muốn dùng nhiều hơn phải xin cấp thêm quyền.
Trước đó, Praveen Neppalli Naga - Giám đốc công nghệ Uber - tiết lộ với tờ The Information rằng công ty đã tiêu hết toàn bộ ngân sách AI của cả năm chỉ trong 4 tháng.
Token là đơn vị dữ liệu nhỏ nhất mà mô hình AI xử lý hoặc tạo ra, có thể là một từ, một phần của từ, hoặc thậm chí là dấu câu. Nhiều công ty sử dụng token như một đơn vị kinh tế để đo lường khối lượng tính toán mà AI thực hiện. Văn bản càng dài thì càng cần nhiều token để xử lý, vì vậy chi phí thường được tính theo số token (trên mỗi nghìn hoặc mỗi triệu token).
OpenAI và Anthropic là hai công ty hưởng lợi lớn nhất từ giai đoạn doanh nghiệp sẵn sàng chi tiền không giới hạn cho AI. Nhờ đó, cả hai tăng trưởng với tốc độ bùng nổ và hiện được định giá gần mốc 1.000 tỉ USD.
Tuy nhiên, khi OpenAI và Anthropic chuẩn bị IPO (đều đã nộp hồ sơ bí mật vào đầu tháng 6), tâm lý thị trường đang thay đổi. Nhiều doanh nghiệp không còn sẵn sàng chi hàng triệu USD cho OpenAI hay Anthropic nếu chưa nhìn thấy lợi nhuận rõ ràng từ khoản đầu tư.
Gil Luria, chuyên gia phân tích của công ty dịch vụ tài chính D.A. Davidson, nhận định: "Tốc độ tăng trưởng hiện nay có lẽ là nhanh nhất mà OpenAI và Anthropic từng đạt được. Đây cũng là thời điểm hợp lý để IPO, vì nhiều khách hàng doanh nghiệp lớn có thể sắp bắt đầu siết mạnh chi tiêu token".
Anthropic từng cho biết doanh thu quy đổi theo năm đã đạt khoảng 47 tỉ USD vào tháng 5, tăng mạnh so với khoảng 10 tỉ USD doanh thu cả năm ngoái. OpenAI được cho là đang đạt tốc độ doanh thu khoảng 25 tỉ USD/năm, tăng từ 13,1 tỉ USD trong 2025.
Theo Gil Luria, việc IPO khi các con số tăng trưởng vẫn còn rất ấn tượng là một bước đi mang tính chiến lược.
"Sớm hay muộn các doanh nghiệp cũng sẽ phải hợp lý hóa chi tiêu cho AI. Điều đó có thể khiến tăng trưởng của OpenAI và Anthropic chững lại. Vì vậy, họ có lý do để niêm yết trước khi điều đó xảy ra", ông nhận xét.
Anthropic từ chối bình luận, còn OpenAI không phản hồi trước thông tin trên.

Siết chi tiêu cho AI đang lan rộng
Flo Crivello nói ông rất thích Claude, nhưng chi phí sử dụng các mô hình AI của Lindy đã trở thành gánh nặng quá lớn với Lindy.
Ngay từ đầu, Lindy được xây dựng trên giả định rằng giá token sẽ liên tục giảm theo thời gian. Điều này từng đúng trong một thời gian, nhưng gần đây OpenAI và Anthropic không còn giảm giá nhanh như trước.
Ông nói sẽ sẵn sàng quay lại dùng Claude nếu Anthropic hạ giá. "Tôi hy vọng họ sẽ giảm giá thêm, nhưng cho tới lúc đó, chúng tôi vẫn còn nhiều lựa chọn khác", Flo Crivello nói.
Jeff Henry, Chủ tịch mảng tư vấn của Highspring, cho biết nhiều khách hàng của công ty này đang tạm dừng đầu tư AI cho đến khi chứng minh được tỉ suất hoàn vốn rõ ràng. Một số doanh nghiệp khác còn dự định chờ thêm 12 - 18 tháng trước khi chi mạnh.
Highspring là công ty cung cấp các dịch vụ tư vấn, quản lý vận hành và giải pháp nhân sự/doanh nghiệp.
"Ai cũng đang trải qua giai đoạn siết chặt chi tiêu cho AI", Jeff Henry khẳng định.
Tuy vậy, ông lưu ý rằng vẫn còn rất nhiều doanh nghiệp cỡ vừa thậm chí còn chưa bắt đầu thử nghiệm AI.
"AI sẽ không biến mất. Một khi kem đánh răng đã bóp ra khỏi tuýp thì không thể nhét trở lại", Jeff Henry ví von.
Doanh nghiệp không còn dùng mô hình AI đắt tiền cho mọi việc
Darren Kimura, Giám đốc điều hành AISquared, nói nhiều doanh nghiệp hiện nhận ra rằng họ đang dùng các mô hình AI mạnh và đắt tiền cho cả những công việc rất đơn giản. Vì vậy, một xu hướng mới xuất hiện là định tuyến mô hình AI. Hệ thống sẽ tự chọn mô hình AI phù hợp nhất với từng tác vụ. Chẳng hạn dùng mô hình AI rẻ hơn để viết email hoặc tóm tắt văn bản, chỉ nhờ đến GPT, Claude hay Gemini với tác vụ khó như lập trình hoặc suy luận phức tạp.
Theo Arvind Jain - Giám đốc điều hành Glean, khoảng 95% tác vụ AI trong doanh nghiệp hiện vẫn chạy trên các mô hình AI tiên tiến nhất.
Glean là startup AI của Mỹ chuyên phát triển nền tảng AI dành cho doanh nghiệp. Sản phẩm chính của Glean giúp nhân viên tìm kiếm thông tin nội bộ, trả lời câu hỏi và tự động hóa công việc bằng cách kết nối với các hệ thống như Slack, Google Drive, Jira, Confluence, Salesforce, Workday.
Trong bối cảnh đó, OpenAI và Anthropic đã bắt đầu bổ sung các công cụ giúp doanh nghiệp kiểm soát chi phí.
OpenAI vừa bổ sung bảng phân tích chi tiêu, cho phép quản trị viên theo dõi mức tiêu thụ token, đặt hạn mức sử dụng và cho nhân viên biết họ còn bao nhiêu ngân sách.
Anthropic cũng đã triển khai các công cụ tương tự từ tháng 8/2025.
Eric Glyman, đồng giám đốc điều hành Ramp, cho biết các giám đốc tài chính (CFO) đang đặc biệt quan tâm tới AI sau khi liên tục nhận những hóa đơn cao ngoài dự kiến.
"Phần lớn CFO không hề dự tính mức tăng chi phí AI này trong kế hoạch ngân sách hằng năm. Họ cũng chưa có công cụ đủ tốt để quản lý khoản chi mới này", ông cho hay.
Ramp là hãng công nghệ tài chính của Mỹ, chuyên cung cấp nền tảng giúp doanh nghiệp quản lý chi tiêu, thẻ tín dụng doanh nghiệp, hóa đơn, mua sắm và tự động hóa tài chính. Gần đây, Ramp cũng phát triển nhiều công cụ AI để giúp doanh nghiệp kiểm soát các khoản chi, trong đó có chi phí sử dụng AI và token.
OpenAI và Anthropic đối mặt sự cạnh tranh ngày càng gay gắt
Khi khách hàng trở nên nhạy cảm hơn với giá, OpenAI và Anthropic phải cạnh tranh với các đối thủ có tiềm lực tài chính rất mạnh.
Đầu tháng 6, Microsoft giới thiệu loạt mô hình AI giá rẻ mới. Gã khổng lồ phần mềm Mỹ cũng nhấn mạnh GitHub Copilot sẽ tự chọn mô hình AI phù hợp nhất cho từng tác vụ nhằm tối ưu chi phí.
Trong bài viết đăng tháng 6, Giám đốc điều hành Satya Nadella của Microsoft cho rằng ngành AI không nên để quyền lực tập trung vào chỉ vài mô hình AI lớn.
Amazon và Google cũng đang tăng tốc. Peter DeSantis, lãnh đạo mảng AI của Amazon, cho biết công ty kỳ vọng sẽ có các mô hình AI đủ sức cạnh tranh với OpenAI và Anthropic ngay trong năm tới. Ông cũng nhấn mạnh Amazon sẽ tận dụng chip AI tự phát triển để giảm đáng kể chi phí huấn luyện mô hình.
"AI đang có vấn đề về chi phí. Nếu muốn AI thực sự thay đổi mọi lĩnh vực thì giá thành phải thấp hơn nhiều", Peter DeSantis nói.
Tại hội nghị I/O hồi tháng 5, Google đã nỗ lực hết sức để làm nổi bật các sản phẩm AI giá cả phải chăng, đặc biệt là Gemini 3.5 Flash. Theo Sundar Pichai - Giám đốc điều hành Google, Gemini 3.5 Flash có giá chỉ bằng 1/2, thậm chí khoảng 1/3 so với nhiều mô hình AI tiên tiến cùng phân khúc.
Harrison Rolfes, chuyên gia tại PitchBook, cho rằng Microsoft và Google đang nắm lợi thế rất lớn vì sở hữu toàn bộ hạ tầng AI, từ trung tâm dữ liệu đến chip và mô hình.
"Họ có đủ năng lực để gây sức ép mạnh lên OpenAI và Anthropic. Có lẽ họ đang đứng ngoài quan sát cuộc cạnh tranh này để chờ thời cơ", Harrison Rolfes nhận định.
PitchBook là hãng nghiên cứu và cung cấp dữ liệu tài chính của Mỹ, nổi tiếng với cơ sở dữ liệu về startup, quỹ đầu tư mạo hiểm, quỹ đầu tư tư nhân, thương vụ IPO, mua bán và sáp nhập doanh nghiệp.
IPO để huy động thêm vốn
Hiện OpenAI và Anthropic chưa công bố thời điểm IPO chính thức. Tuy nhiên theo tờ The New York Times, OpenAI có xu hướng lùi kế hoạch IPO sang năm sau.
Áp lực IPO của OpenAI và Anthropic phần lớn đến từ nhu cầu huy động vốn.
Khi OpenAI và Anthropic bắt đầu cạnh tranh trực tiếp với chính các nhà đầu tư lớn như Microsoft hay Amazon, thị trường chứng khoán có thể trở thành nguồn huy động vốn quan trọng nhất.
Dharmesh Thakker, đối tác của quỹ đầu tư mạo hiểm Battery Ventures, nhận định: "Nhiều nguồn vốn truyền thống đang dần cạn kiệt. Hầu hết tổ chức đủ khả năng rót vốn vào những công ty này đều đã đầu tư rồi".