AI & Blockchain

Google cảnh báo Search có thể bị phá vỡ khi áp lực về tương lai web gia tăng

Sơn Vân • 01/02/2026 07:13

Google cho biết Search có thể bị phá vỡ nếu công ty buộc phải áp dụng các biện pháp kiểm soát mới quá nghiêm ngặt nhằm bảo vệ và nuôi dưỡng nội dung web trong kỷ nguyên AI.

Cảnh báo này được đưa ra sau khi Cơ quan Cạnh tranh và Thị trường Vương quốc Anh (CMA) đề xuất các quy định mới với công cụ tìm kiếm Google, theo đó trao cho các nhà xuất bản nhiều quyền kiểm soát hơn đối với cách nội dung của họ được sử dụng trong các tính năng AI (trí tuệ nhân tạo) như AI Overviews và AI Mode của gã khổng lồ công nghệ Mỹ.

Đáp lại, Google nói rằng đang nghiên cứu những cách mới để giúp các website kiểm soát tốt hơn việc chatbot AI cùng công cụ trả lời dựa trên AI truy cập và sử dụng nội dung trực tuyến. Google đang chịu áp lực ngày càng lớn trong việc cho phép chủ sở hữu nội dung có quyền từ chối việc dữ liệu của họ bị thu thập để huấn luyện AI, trong khi vẫn cho phép công cụ tìm kiếm truyền thống lập chỉ mục nguồn dữ liệu giá trị này.

“Chúng tôi đang xem xét cập nhật công cụ kiểm soát để cho phép các trang web chủ động chọn không tham gia những tính năng AI tạo sinh của Search”, Google viết trong một bài đăng trên blog. Đây được xem là một nhượng bộ lớn của Google, vốn trước đó kiên quyết phản đối những yêu cầu như vậy, dù không phát ngôn công khai.

Tuy nhiên, Google cũng cảnh báo rằng các biện pháp kiểm soát mới quá chặt chẽ có thể đe dọa Search - mảng kinh doanh mang lại phần lớn lợi nhuận cho công ty. “Bất kỳ cơ chế kiểm soát mới nào cũng cần tránh việc làm gián đoạn Search theo cách dẫn đến trải nghiệm bị phân mảnh hoặc gây nhầm lẫn cho người dùng”, Google nói thêm, đồng thời lập luận rằng tìm kiếm và AI hiện đã gắn bó chặt chẽ với nhau.

Theo Google, AI đã đóng vai trò cốt lõi trong cách Search vận hành suốt hơn một thập kỷ qua, từ việc xếp hạng kết quả tìm kiếm đến làm nổi bật các liên kết liên quan.

Google nói rằng việc tạo ra các tùy chọn loại trừ rõ ràng cho các tính năng AI tạo sinh có thể làm suy yếu cơ chế nền tảng cho phép người dùng tìm kiếm thông tin nhanh chóng và giúp những trang web được khám phá trên quy mô lớn.

Google cảnh báo Search có thể bị phá vỡ khi áp lực về tương lai web gia tăng — Google đang chịu áp lực ngày càng lớn trong việc cho phép các trang web có quyền từ chối việc dữ liệu của họ bị thu thập để huấn luyện AI - Ảnh: MTG

Trọng tâm của tranh cãi là câu hỏi sâu xa hơn: Google Search nên được định hình ra sao trong kỷ nguyên AI.

Các nhà xuất bản ngày càng cho rằng bản tóm tắt do AI tạo ra đang thay thế nội dung của họ thay vì dẫn người dùng quay lại trang chứa nguồn tin, từ đó làm suy yếu thỏa thuận lớn đã làm nền tảng cho web trong nhiều thập kỷ. Ngược lại, Google lập luận rằng việc vạch ra ranh giới cứng nhắc giữa tìm kiếm và AI có thể dẫn đến những hệ quả không mong muốn, gồm cả chất lượng kết quả suy giảm và trải nghiệm người dùng tệ hơn.

Matthew Prince, Giám đốc điều hành Cloudflare, nhận định đề xuất của Vương quốc Anh là một bước tiến nhưng vẫn chưa đủ. Cloudflare hỗ trợ vận hành khoảng 20% trang web toàn cầu và đang thúc đẩy các tiêu chuẩn mới nhằm tạo sân chơi công bằng hơn cho AI.

“Khuyến nghị của CMA vẫn chưa đi đủ xa vì không buộc Google phải tách việc thu thập dữ liệu cho tìm kiếm khỏi việc thu thập dữ liệu cho AI. Thay vào đó, nó yêu cầu tất cả chúng ta phải tin tưởng rằng Google sẽ không làm điều xấu khi họ xây dựng hộp đen AI không thể giám sát độc lập được”, Matthew Prince chia sẻ với trang Insider.

Giám đốc điều hành Cloudflare nói thêm: “Nếu thực sự muốn khuyến khích đổi mới và cạnh tranh trong AI, điều tốt nhất CMA nên làm là buộc Google tuân theo cùng một bộ quy tắc như mọi công ty khác và tách việc thu thập dữ liệu cho AI khỏi thu thập dữ liệu cho tìm kiếm. Mọi công ty, ngoài Google, đều sẽ ủng hộ điều đó vì tạo ra một thị trường lành mạnh. Đây là điều quá hiển nhiên, nên thật đáng thất vọng khi CMA không hành động đủ mạnh mẽ”.

Cuộc tham vấn của CMA sẽ kéo dài đến ngày 25.2. Việc các nhà quản lý có thể siết chặt quy định mà không phá vỡ Search hay không, có thể sẽ quyết định không chỉ tương lai Google tại Vương quốc Anh mà còn cả hình dạng của web mở trong thời đại AI.

Cloudflare ban hành giấy phép siết việc Google thu thập dữ liệu hàng triệu trang web

Cloudflare là một trong những nhà cung cấp hạ tầng internet quan trọng nhất thế giới, chuyên cung cấp dịch vụ mạng phân phối nội dung (CDN), bảo mật web và định tuyến lưu lượng. Nói một cách khác, Cloudflare đóng vai trò như “đường cao tốc” giúp dữ liệu từ máy chủ của các dịch vụ lớn đến được người dùng nhanh, ổn định và an toàn hơn.

Cloudflare giúp tăng tốc tải trang bằng cách lưu và phân phối nội dung từ các máy chủ gần người dùng; bảo vệ website khỏi các cuộc tấn công mạng (DDoS, bot độc hại, khai thác lỗ hổng); giảm chi phí băng thông và tải cho máy chủ gốc.

Công ty Mỹ hiện xử lý khoảng 20% lưu lượng web toàn cầu, một con số cực kỳ lớn với bất kỳ đơn vị hạ tầng internet nào.

Internet đang trải qua một sự thay đổi lớn, từ các công cụ tìm kiếm truyền thống sang các cỗ máy trả lời bằng AI, tạo ra các câu trả lời trực tiếp từ nội dung đã thu thập, thường không kèm theo liên kết đến trang gốc. Điều này đe dọa mô hình kinh doanh dựa trên lưu lượng truy cập ban đầu của internet, vốn thưởng cho việc tạo nội dung bằng các cú nhấp chuột, lượt xem và doanh thu.

Hầu hết công ty AI, gồm cả OpenAI, đều sử dụng các bot thu thập dữ liệu web riêng biệt cho dịch vụ tìm kiếm và AI của họ. Trong khi bot của Google thu thập dữ liệu từ các website để cung cấp cho cả kết quả tìm kiếm truyền thống lẫn công cụ trả lời bằng AI, chẳng hạn AI Overviews.

Hồi tháng 9.2025, Cloudflare công bố chính sách mang tên Content Signals, tạo ra một giấy phép mới đầy tiềm năng cho internet, nhắm trực tiếp vào các sản phẩm tìm kiếm có tích hợp AI của Google.

Matthew Prince cho biết chính sách và giấy phép bot mới từ họ nhắm vào lợi thế thu thập dữ liệu của Google và tìm cách tạo ra sân chơi công bằng hơn.

Ông chia sẻ với trang Insider: "Mọi công cụ trả lời bằng AI đều phải tuân thủ các quy tắc giống nhau. Google kết hợp bot thu thập dữ liệu cho cả tìm kiếm và công cụ trả lời bằng AI, điều này mang lại cho họ một lợi thế độc nhất và không công bằng. Chúng tôi đang làm rõ rằng giờ đây có những quy tắc khác nhau cho tìm kiếm và các công cụ trả lời bằng AI".

Matthew Prince nhắm thẳng đến Google bgiấy phép mới của Cloudflare - Ảnh: Reuters — Matthew Prince nhắm thẳng đến Google qua giấy phép mới của Cloudflare - Ảnh: Reuters

Chính sách Content Signals xây dựng dựa trên dịch vụ quản lý bot thu thập dữ liệu web hiện có của Cloudflare, với các tín hiệu mới nhắm riêng vào các bot AI và trình cào dữ liệu.

Các website thường dùng file robots.txt để quy định bot được phép truy cập dữ liệu như thế nào. Hệ thống này có từ những ngày đầu của internet, nhưng làn sóng bot AI cào dữ liệu hiện nay khiến nó trở nên quá tải. Về bản chất, robots.txt chỉ là thỏa thuận dựa trên sự tự nguyện, nên nhiều công ty AI vẫn phớt lờ và tiếp tục thu thập dữ liệu vì nhu cầu quá lớn.

Hơn 3,8 triệu tên miền đã sử dụng dịch vụ robots.txt của Cloudflare. Cloudflare giới thiệu một giấy phép mới cho các website, giúp họ có thể chặn hoặc cho phép các bot AI thu thập dữ liệu một cách rõ ràng, chi tiết và mạnh mẽ hơn.

Robots.txt là file văn bản nhỏ được đặt ở thư mục gốc của một website, giống bảng nội quy cho các bot của các công cụ tìm kiếm và các dịch vụ khác khi truy cập trang. Robots.txt hướng dẫn các bot rằng chúng được phép truy cập, được thu thập dữ liệu những phần nào trên website và không được cào những phần nào.

Giấy phép của Cloudflare tác động gì đến Google?

Matthew Prince cho biết giấy phép này có thể mang giá trị pháp lý, đặc biệt với Google.

"Đội ngũ pháp lý của Google sẽ hiểu rõ đây là một hợp đồng với những hệ quả pháp lý nếu họ bỏ qua", Giám đốc điều hành Cloudflare nhấn mạnh.

Matthew Prince nói thêm rằng giấy phép mới này sẽ tự động được áp dụng cho hàng triệu website mà Cloudflare đang hỗ trợ. Điều đó đặt ra một lựa chọn cho Google.

Gã khổng lồ công nghệ Mỹ hoặc phải ngừng thu thập dữ liệu từ các website này cho công cụ tìm kiếm của mình (đồng nghĩa bỏ lỡ một lượng lớn nội dung web), hoặc phải tuân thủ và tách biệt các bot thu thập dữ liệu của mình, một bot dành cho tìm kiếm truyền thống và một bot dành cho các công cụ trả lời bằng AI.

Việc tách riêng bot cho tìm kiếm và bot cho AI có ý nghĩa như sau:

- Bot tìm kiếm: Chỉ thu thập dữ liệu để phục vụ kết quả tìm kiếm truyền thống. Khi người dùng tìm kiếm, Google sẽ dẫn liên kết về website gốc, giúp trang vẫn có lưu lượng truy cập.

- Bot cho AI: Thu thập dữ liệu để dùng trong các công cụ trả lời bằng AI (ví dụ AI Overviews). Đó là nơi nội dung được AI tổng hợp và trả lời trực tiếp mà không nhất thiết dẫn link về nguồn gốc.

Google tuyên bố rằng các tính năng tìm kiếm mới tích hợp AI của họ vẫn gửi lưu lượng truy cập đến các website, thậm chí có thể gửi lưu lượng truy cập chất lượng cao hơn. Các lãnh đạo Google cũng nhấn mạnh họ rất quan tâm đến sự lành mạnh và sôi động của internet.

Matthew Prince tiết lộ OpenAI đang có trách nhiệm hơn trong vấn đề này bằng cách tách biệt các bot thu thập dữ liệu của mình, một bot dành cho các hoạt động AI cốt lõi và một bot khác cho chức năng tìm kiếm.

Sơn Vân