Експерти з пошукової оптимізації отримали від співробітника Google доступ до 2500 сторінок внутрішніх документів компанії. Ці дані розкривають, як працює пошуковий алгоритм. 30 травня в Google підтвердили автентичність матеріалів. Про це пише The Verge.
Що відомо про витік?
На існування витоку даних вперше вказали експерти з пошукової оптимізації (SEO) Ренд Фішкін і Майк Кінг. Вони опублікували попередній аналіз документів та їхнього контенту. Як говорить Фішкін, цей витік мав «протистояти брехні» про те, як працює пошуковий алгоритм. За його словами, у документах описується пошуковий алгоритм API Google і розкривається інформація, доступна лише співробітникам.
Майк Кінг у своєму огляді документів підкреслив, що, найімовірніше, витік окреслює, які дані Google збирає з вебсторінок, сайтів і пошуковиків та вказує експертам із SEO на те, чим Google справді переймається.
Злиті документи детально описують дані, які Google відстежує, і які можуть використовуватися алгоритмом для ранжування пошукової видачі.
За словами Фішкіна й Кінга, певна інформація в документах суперечить публічним заявам представників Google.
«”Збрехав” — це грубо сказано, але це єдине правильне слово, яке тут можна використати. Хоча я не звинувачую представників Google у захисті їхньої конфіденційної інформації, я проти їхніх зусиль активно дискредитувати людей у світі маркетингу, технологій і журналістики», — висловився Кінг.
Йдеться, зокрема, про маніпуляції з рейтингами. Представники Google неодноразово зазначали, що вони не використовують дані Chrome для рейтингування сторінок. Водночас згідно з документами, які наводить The Verge, покликання, що з’являються під основною URL-адресою vogue.com, можуть створюватися частково з використанням даних Chrome.
На що вплинуть отримані дані?
Як додає The Verge, зазвичай, Google дотримується суворої секретності щодо того, як працює пошуковий алгоритм, але ці документи внесли більше ясності щодо того, які дані пошуковик враховує під час ранжування вебсайтів.
Крім того, представники Google раніше заявили, що ЕЕАТ — алгоритм Google для оцінювання якості контенту, який впливає на позиції сайтів у результатах пошуку — не є чинником ранжирування.
Проте Кінг пише, що Google збирає дані про автора й має поле для визначення того, чи справді особа на сторінці є автором контенту. У частині документів ідеться, що це поле було «в основному розроблене й налаштоване для новин, але також заповнюється і для іншого контенту, наприклад, наукових статей». Хоча це не підтверджує, що байлайн (byline, коли ім’я автора зазначається під текстом) є метрикою ранжування, це свідчить, що Google принаймні відстежує цей факт. Раніше представники Google наполягали на тому, що вказувати авторство власники сайтів мають для читачів, а не Google, оскільки це не впливає на ранжування.