Дата 24 квітня 2012 запам’яталася багатьом оптимізаторам і власникам сайтів, які побачили в статистиці різке падіння трафіку на 30-70%. Це сталося в результаті нового антиспам-алгоритму Google з офіційною назвою «Пінгвін», про який Метт Каттс повідомив на блозі Google для вебмайстрів.
З тих пір пройшло вже достатньо часу, щоб в мережі з’явилися аналітичні дані, успішні і неуспішні кейси, відповіді на багато питань від офіційних представників пошукової системи Google. Також цього часу вистачило для проведення колективного експерименту , в якому взяли участь більше 100 чоловік, додавши для аналізу близько 150 сайтів.
Що сталося?
Не будемо описувати детально проведення експерименту. Відзначимо лише, що всі сайти були перевірені вручну на потрапляння саме під «Пінгвіна» (аналізувалися звіти, до яких був наданий доступ), перевірені різні метрики сайтів і зібрана статистика по анкор-листам.
Що стосується контенту, чітких закономірностей виявлено не було. Під Пінгвін потрапляли сайти і з рекламою та без, зі сторінкою контактів і без неї, з великим і малим seo-текстом на головній сторінці.
З посиланнями трохи цікавіше. Ми отримали приблизно таку ж картину, як і у західних експертів, а саме — велика кількість прямих входжень частіше зустрічається у тієї групи сайтів, яка постраждала від «Пінгвіна» (вони мають більше 58% прямих ключів в анкорах).Вийшла наступна статистика:
Середні значення для постраждалих сайтів
11% посилань з адресою сайту у вигляді http://domain.com/, 15% посилань з назвою бренду у вигляді імені компанії або імені домена, 58% посилань з просуваються ключовими словами. 14% nofollow-посилань від всієї маси,
Середні значення для сайтів, які отримали плюс після 24 квітня
22% посилань з http, 26% посилань з назвою бренду, 23% посилань з просуваються ключовими фразами. 30% nofollow-посилань,
З тих методів, які були використані для виведення сайтів з-під фільтр, допомогли лише триста перший посторінкові редіректи на інший домен (з тим же ім’ям, але в іншій доменній зоні). Всі, хто використовував редирект, через час були склеєні і зайняли у видачі колишні позиції.
За допомогою маніпуляції з анкорами посилань вийти з-під фільтра не вдалося нікому (судячи з тих даних, до яких у мене є доступ). Можливо, 2 місяці недостатньо для зняття цього фільтра на автоматі. У мережі є лише один кейс (для сайту WMPU .org), де сайт вийшов з-під Пінгвіна завдяки дуже кропітливій роботі із зовнішніми посиланнями.
На конференції SMX Advanced в Сіетлі Метт Каттс в інтерв’ю натякнув, що найближчим часом в панелі для вебмайстрів буде існувати можливість управляти роботою зовнішніх посилань (у плані відключення їх впливу на сайт). Робота з посиланнями представляється в майбутньому дуже копіткої, вже зараз з’явилося безліч сервісів з видалення зовнішніх посилань (природно, платних, на противагу сервісів розміщення).
Пошук проблем
У ході експерименту стало зрозуміло, що деякі вебмастера не зуміли правильно ідентифікувати, який саме фільтр наклав Google на їх сайт. Всі вважали, що це «Пінгвін», проте, останнім часом у гугла було безліч глобальних оновлень. Ось деякі з них:
19 січня — Page Layout Algorythm (аналізується корисність контенту на першому екрані сайту, доступному без прокрутки, сайти з рясною рекламою на першому екрані ранжуються нижче);
27 лютого — Венеція (Google тепер враховує регіональність користувача і для органічної видачі);
16 квітня — Глюк з припаркованими доменами (на початку квітня в Google була технічна неполадка, завдяки якій багато сайтів повилітали з топа, але через кілька днів, після виправлення проблеми, були повернуті);
19 квітня — Оновлення алгоритму «Панда» (постійне нагородження унікальних сайтів);
24 квітня — Антиспам-алгоритм «Пінгвін» (караються сайти, які використовують спам-методи для накрутки своїх позицій);
27 квітня — Черговий апдейт алгоритму «Панда», який також відбувався пізніше в червні.
І кілька пізніших оновлень «Панди» і «Пінгвіна».
Щоб правильно відстежити проблему, необхідно зберігати історію зміни позицій сайту за різними запитами, за якими користувачі знаходять ресурс. При аналізі даних зіставляти дати і цільові сторінки, які втратили в трафіку.
Наприклад, за таким графіком (згрупованому по тижнях) видно, що «Пінгвін» тут причетний, але до нього були й інші проблеми, скоріше всього фільтр комплексний.
На наведеному нижче графіку видно зниження відвідуваності з Google, але проблема явно не в «Пінгвіні».
Чітке визначення «Пінгвіна» видно, коли є різкий стрибок 24-25 квітня.
Для пошуку причини фільтра добре використовувати Google Analytics — вибрати дати після 25 квітня і порівняти дані з датами до 24 квітня, зайти в звіти за ключовими словами і Вира додатковий параметр «Джерела трафіку — Цільова сторінка», а також вибрати сортування по абсолютному зміни параметра ( відвідуваності). Таким чином, ми отримаємо звіти, в яких видно самі постраждалі запити і відповідні їм цільові сторінки.
Як показує практика, якщо сайт просів по високочастотним запитам, за якими ви просуваєте головну сторінку, або по середньочастотним для основних розділів, то проблема скоріше всього в посиланнях. Якщо ж сайт просів за багатьма середньочастотним і низькочастотних запитах, то в першу чергу проблему необхідно шукати в контенті і вихідних з сайту посиланнях.
Кілька наочних прикладів
1. Вхідні посилання
Зі статистики відвідуваності видно, що сайт постраждав від «Пінгвіна».
Аналіз звітів за ключовими словами дає результати, що сайт просів переважно за запитом «робота в Мінську». Це ВЧ запит для сайту, тому, проблема скоріше всього в посиланнях.
Дивимося анкор-лист сайту за допомогою OpenSiteExplorer .
Бачимо, що перше місце в анкор-листі займає просувний нами запит. Мабуть, проблема в цьому. Щоб переконатися в цій гіпотезі, перевіримо анкор-листи інших сайтів в ТОП3.Отримаємо таку картину.
У всіх сайтів на першому місці стоїть анкор у вигляді адреси сайту або без анкора взагалі (наприклад, посилання-зображення).
2. Дублі контенту
Сайт втратив низькочастотний трафік.
Якщо дивитися, які саме запити постраждали найбільше, то отримаємо таку картину:
При перевірці сайту на дублі в Google бачимо, що 93% сторінок в індексі займають повні або часткові дублі.
Використовуючи сервіс WebTaker.com знаходимо ті сторінки, які потрапили в додатковий індекс (незначущі для гугла). Далі аналізуємо і робимо висновки.
3. Вихідні посилання
Сайт просів по низькочастотних запитах і в основному, для одних і тих же сторінок.
При заході саме на ці сторінки, які просіли за запитами, спостерігаємо, що контент містить зовнішні (часто нетематичні) посилання.
Резюме
Для вирішення проблеми з Пінгвіном, насамперед, слід прочитати Керівництво Google для вебмайстрів , там знаходиться багато підказок.
Більшість успішних кейсів, які наводять західні фахівці, пов’язані з поліпшенням сайту.Тому, якщо налаштовуватися на довгострокову перспективу, то найкраще буде працювати поліпшення сайту (насамперед у плані юзабіліті).
Стаття створена за матеріалами сайту https://devaka.ru/articles/google-penguin