Một bản sao cơ sở dữ liệu nội bộ Google bị rò rỉ đã tiết lộ hàng ngàn sự cố liên quan đến quyền riêng tư từ năm 2013 đến 2018, trang 404 Media đưa tin.
Thế giới số

Cơ sở dữ liệu nội bộ Google bị rò rỉ tiết lộ hàng ngàn sự cố về quyền riêng tư trong 5 năm

Sơn Vân 04/06/2024 15:28

Một bản sao cơ sở dữ liệu nội bộ Google bị rò rỉ đã tiết lộ hàng ngàn sự cố liên quan đến quyền riêng tư từ năm 2013 đến 2018, trang 404 Media đưa tin.

Từ một người ẩn danh gửi đến 404 Media, thông tin bị rò rỉ tiết lộ các trường hợp được đánh dấu cho thấy các biện pháp bảo vệ quyền riêng tư của Google có thể đã thất bại.

Người phát ngôn Google cho biết sự cố này đã được các nhân viên báo cáo từ 6 đến 9 năm trước. Người này nói với trang Insider rằng tất cả sự cố đã được xem xét và giải quyết, nghĩa là mọi thông tin cá nhân đều đã bị xóa.

Hai trong những trường hợp được liệt kê trong cơ sở dữ liệu rò rỉ là lỗi kỹ thuật của tính năng làm mờ video trên YouTube làm lộ ra các hình ảnh không được kiểm duyệt và sự cố Waze Carpool chia sẻ địa chỉ nhà riêng của người dùng.

Waze Carpool là tính năng được tích hợp trong ứng dụng Waze của Google, cho phép người dùng chia sẻ xe để đi chung đường. Tính năng này giúp người dùng tiết kiệm chi phí đi lại, giảm tắc nghẽn giao thông và bảo vệ môi trường.

Một sự cố khác là dịch vụ giọng nói của Google đã ghi lại âm thanh 1.000 trẻ em khoảng 1 giờ. Một tình huống khác liên quan đến việc Google Street View lưu biển số xe do thuật toán phát hiện văn bản trong hình ảnh, theo báo cáo của 404 Media, trích dẫn thông tin bị rò rỉ.

Theo Google, một số trường hợp được nêu chi tiết trong báo cáo của 404 Media và chia sẻ với gã khổng lồ công nghệ này hoàn toàn không phải là sự cố, hoặc liên quan đến vấn đề từ nền tảng bên thứ ba.

Ví dụ, một số trường hợp là các cuộc giả lập của nhóm bảo mật nội bộ nhằm mục đích nâng cao khả năng bảo vệ sản phẩm hoặc cảnh báo sai về lỗi sản phẩm, theo Google.

Google cho biết những trường hợp khác là sự cố của bên thứ ba (nhà cung cấp mà công ty sử dụng cho việc đi lại của nhân viên) và một nỗ lực lừa đảo qua mạng Wi-Fi tại hội nghị trong ngành.

Danh sách sự cố từ năm 2013 đến 2018 của Google là vụ rò rỉ thông tin nội bộ thứ hai trong 1 tuần qua.

2.500 tài liệu được công bố ngày 27.5 dường như tiết lộ bí mật về cách Google tổ chức trang web. Vụ rò rỉ này khiến các chuyên gia SEO (tối ưu hóa tìm kiếm) nổi giận. Một số người cho rằng Google không phải lúc nào cũng trung thực về cách xếp hạng các trang web.

Trong khi vấn đề trước đó gây mất lòng tin từ chủ sở hữu trang web và các chuyên gia SEO thì vụ rò rỉ này lại đe dọa đến danh tiếng Google với người dùng hàng ngày. Vụ rò rỉ cũng xảy ra trong thời điểm độ tin cậy của Google đang bị đặt dấu hỏi sau khi những phản hồi không chính xác từ AI Overviews trong công cụ tìm kiếm buộc họ phải thu hẹp lại tính năng này.

Vụ rò rỉ mới nhất cũng làm sáng tỏ cách Google xử lý những sự cố này. Theo 404 Media, rất ít sự cố được Google báo cáo công khai. Thay vào đó, Google yêu cầu nhân viên gắn cờ và đánh giá mức độ ưu tiên trước khi nhóm phản ứng bảo mật điều tra sự cố.

Vì Google ưu tiên cải tiến sản phẩm nên khuyến khích nhân viên gửi báo cáo sự cố nội bộ và chúng được xem xét nghiêm túc, theo công ty. Thế nhưng, Google cho biết điều này thường dẫn đến các báo cáo được gắn nhãn là ưu tiên cao không khớp với xếp hạng do nhóm phản ứng bảo mật xác định.

Google nói với trang Insider rằng họ đã triển khai hàng trăm biện pháp bảo vệ mới và bổ sung trong 6 năm qua để đảm bảo tính bảo mật cùng quyền riêng tư của người dùng. Ví dụ, Google đã cập nhật chính sách của YouTube về trẻ em và bảo vệ dữ liệu vào năm 2019, hạn chế việc thu thập dữ liệu trên các video dành cho trẻ em chỉ còn những gì cần thiết để hỗ trợ dịch vụ.

Ngoài ra, Google cho biết các sản phẩm của họ cũng thường xuyên trải qua quá trình xác minh độc lập về các biện pháp kiểm soát bảo mật, quyền riêng tư và tuân thủ để đạt được các tiêu chuẩn toàn cầu.

co-so-du-lieu-noi-bo-google-bi-ro-ri-tiet-lo-hang-ngan-su-co-ve-quyen-rieng-tu-trong-5-nam.jpg
Một bản sao cơ sở dữ liệu nội bộ Google bị rò rỉ đã tiết lộ hàng ngàn sự cố liên quan đến quyền riêng tư từ năm 2013 đến 2018 -- Ảnh: Internet

Tài liệu 2.500 trang bóc mẽ lời nói dối của Google về cách hãng xếp hạng tìm kiếm

2.500 trang tài liệu nội bộ từ Google đã tiết lộ cách thức hoạt động của công cụ tìm kiếm quyền lực nhất trên internet. Một số thông tin mâu thuẫn với các tuyên bố công khai của Google.

Là một trong những hệ thống quan trọng nhất trên internet, thuật toán tìm kiếm của Google sẽ quyết định trang web nào được phép tồn tại hay phải chết đi. Thậm chí, Google cũng quyết định nội dung trên website là gì.

Từ lâu, cách Google xếp hạng các trang web vẫn luôn là một điều bí ẩn, được các nhà báo, nhà nghiên cứu và những người làm việc trong lĩnh vực này liên tục đặt câu hỏi.

Mới đây, tất cả đã được đưa ra ánh sáng khi một bộ tài liệu nội bộ dài 2.500 trang về công cụ tìm kiếm của Google bị rò rỉ. Nó tiết lộ những thông tin chưa từng có về cách thức hoạt động của Google Search, đồng thời cho thấy sự gian dối của Google suốt nhiều năm.

Theo hai chuyên gia SEO là Rand Fishkin và Mike King, một nguồn tin giấu tên đã chia sẻ 2.500 trang tài liệu với họ. Người này hy vọng rằng tài liệu sẽ bóc mẽ những lời nói dối của Google về cách thuật toán tìm kiếm hoạt động.

Với lượng thông tin dày đặc và nặng tính kỹ thuật, tài liệu tiết lộ những loại dữ liệu được Google thu thập từ các trang web, người dùng, đồng thời gợi ý một số nội dung mà công ty yêu thích.

Các tài liệu bị rò rỉ còn đề cập đến loại dữ liệu nào sẽ được Google thu thập và sử dụng, những trang web nào công ty đề xuất mạnh, cách họ xử lý các trang web nhỏ lẻ… Theo Rand Fishkin và Mike King, một số thông tin trong tài liệu mâu thuẫn với các tuyên bố công khai của gã khổng lồ công nghệ Mỹ.

Mike King viết: “Dùng từ dối trá thì có vẻ hà khắc, nhưng đó là từ chính xác duy nhất có thể sử dụng ở đây. Tôi không đổ lỗi cho các phát ngôn viên Google khi họ bảo vệ thông tin bí mật doanh nghiệp, nhưng vẫn không hài lòng khi hãng luôn cố làm mất uy tín của những người làm trong ngành marketing, công nghệ và báo chí”.

Google không trả lời khi được trang The Verge đề nghị bình luận về các tài liệu. Rand Fishkin cho biết Google không phủ nhận tính xác thực của vụ rò rỉ, nhưng một nhân viên công ty đã đề nghị anh thay đổi một số từ ngữ trong bài đăng.

Thuật toán tìm kiếm bí mật của Google đã tạo ra một ngành công nghiệp tiếp thị toàn cầu, với hàng triệu công ty trên thế giới thực hiện theo hướng dẫn công khai của gã khổng lồ công nghệ này.

Các chiến thuật SEO tinh vi đã dẫn đến hệ quả là nhiều kết quả tìm kiếm của Google đang ngày càng tệ hơn, đầy rẫy nội dung rác chỉ để trang web được xuất hiện ở vị trí cao.

Đáp lại các bài viết chỉ trích chiến thuật SEO trên Google, đại diện hãng thường có cách biện hộ quen thuộc: “Đó không phải những điều Google khuyến khích họ làm”.

Tuy nhiên, một số chi tiết trong tài liệu bị rò rỉ lại chỉ ra những phát ngôn này của Google có phần dối trá.

Một ví dụ điển hình được Fishkin và King trích dẫn liên quan đến việc dữ liệu từ trình duyệt Google Chrome được hãng sử dụng để xếp hạng nội dung. Đại diện của Google đã nhiều lần khẳng định họ không sử dụng dữ liệu Chrome để xếp hạng các trang.

Song trong tài liệu nội bộ, Chrome luôn được đề cập cụ thể khi phân tích cách các trang web xuất hiện trong kết quả tìm kiếm. Theo tài liệu, các liên kết xuất hiện bên dưới URL chính của vogue.com được tạo ra một phần bằng dữ liệu Chrome.

google-seo-banr.png
2.500 trang tài liệu nội bộ từ Google gây mất lòng tin từ chủ sở hữu trang web và các chuyên gia SEO - Ảnh: Internet

Bí mật của Google được đưa ra ánh sáng

Một câu hỏi khác được đặt ra là vai trò của E-E-A-T trong xếp hạng là gì. E-E-A-T là viết tắt của kinh nghiệm (experience), kiến ​​thức chuyên môn (expertise), tính xác thực (authoritativeness) và độ tin cậy (trustworthiness).

Đây là thước đo của Google để đánh giá chất lượng kết quả tìm kiếm. Trước đây, đại diện của Google từng tuyên bố E-E-A-T không phải là yếu tố xếp hạng. Rand Fishkin cho biết ông cũng không tìm thấy nhiều tài liệu đề cập đến tên E-E-A-T.

Tuy nhiên, Mike King đã trình bày chi tiết cách Google thu thập dữ liệu tác giả từ website. Google cũng có cách riêng để biết một cái tên xuất hiện trên trang có phải là tác giả hay không. Cách thức này “chủ yếu được phát triển và tùy chỉnh cho các bài báo, nhưng cũng được áp dụng những các nội dung khác như bài báo khoa học”, trích tài liệu rò rỉ.

Trước đây, Google nhấn mạnh rằng thông tin tên tác giả là điều mà chủ trang web nên làm cho độc giả, chứ không phải công ty vì nó không ảnh hưởng đến xếp hạng.

Theo trang The Verge, dù không tấn công trực diện vào Google, những tài liệu bị rò rỉ đã tiết lộ về hệ thống bí mật của gã khổng lồ công nghệ. Vụ kiện chống độc quyền của chính phủ Mỹ chống lại Google, xoay quanh công cụ tìm kiếm, cũng đã dẫn đến việc tài liệu nội bộ được đưa ra ánh sáng.

Việc Google giữ bí mật về cách hoạt động của công cụ tìm kiếm đã dẫn đến việc nhiều trang web ngày càng trông giống hệt nhau. Lý do là các chuyên gia SEO phải cố lách luật Google, bằng cách dựa trên những gợi ý mà công ty đã đưa ra.

“Trước đây, nhiều người có tiếng trong lĩnh vực tìm kiếm và các nhà phát hành web nổi tiếng đều nghe theo, truyền bá các phát ngôn của Google mà chẳng dám phản bác. Họ viết những dòng tiêu đề như ‘Google nói XYZ là đúng’ thay vì ‘Google tuyên bố XYZ nhưng bằng chứng cho thấy điều ngược lại’. Tôi muốn điều này sẽ thay đổi”, Rand Fishkin chỉ trích.

Bài liên quan
Sam Altman tiết lộ sử dụng GPT-4o như công cụ tìm kiếm thay Google
GPT-4o, mô hình AI đa phương thức mới nhất của OpenAI, gây sốt khi trình làng rạng sáng 14.5 giờ Việt Nam nhờ khả năng trò chuyện bằng giọng nói thực tế và tương tác qua văn bản lẫn hình ảnh.

(0) Bình luận
Nổi bật Một thế giới
Vui buồn nghề muối Bạc Liêu - Bài 2: Ứng dụng kỹ thuật, công nghệ mới
Để làm giàu trên chính đồng muối của gia đình, nhiều diêm dân ở Bạc Liêu đã mạnh dạn đầu tư vật tư, thiết bị cơ giới hóa để sản xuất muối theo hướng công nghệ cao. Hướng đi mới đã khẳng định được hiệu quả, góp phần nâng cao sản lượng lẫn chất lượng hạt muối.
Đừng bỏ lỡ
Mới nhất
POWERED BY ONECMS - A PRODUCT OF NEKO
Cơ sở dữ liệu nội bộ Google bị rò rỉ tiết lộ hàng ngàn sự cố về quyền riêng tư trong 5 năm