Як відомо, Google має два індекси: основний (Main Index) і додатковий (Supplemental Index або, в народі — «соплі» ). Перший містить в собі значущі сторінки, а в другій потрапляють ті, які мають низьку цінність, зазвичай це дублікати або сторінки з дуже малою кількістю цінного контенту. Багато сторінок з додаткового індексу приховані за посиланням «Показати приховані результати».
Гіпотези
Так як офіційної інформації про додатковий індекс Google не так багато, в співтоваристві оптимізаторів виникають дві гіпотези.
1) Сторінки з додаткового індексу не беруть участь в ранжируванні. 2) Вихідні посилання з цих сторінок не працюють.
Метою даного аналізу є перевірити достовірність гіпотез.
Методологія аналізу
Для проведення аналізу, спершу, необхідно розділити сторінки сайту за індексами — які потрапили в основний, які в додатковий. Для цього використовується оператор пошуку «site» і конструкція site: devaka.ru/&. За допомогою двох запитів до Google спочатку береться загальний індекс, потім основний, скануються всі сторінки і їх різниця дає сторінки з додаткового індексу.
Для перевірки першої гіпотези для кількох сайтів проводиться аналіз трафіку в Google Analytics, а саме, перевіряються сторінки входу при обраному сегменті «Google (organic)» . Аналізується частка трафіку, що припадає на сторінки в основному і додатковому індексі. Судячи з гіпотези, сторінки з додаткового індексу не повинні отримувати пошуковий трафік.
При перевірці другої гіпотези береться кілька випадкових посилань зі сторінок в «соплях» і проводиться аналіз їх працездатності, де під працездатністю розуміється знаходження акцептора по точному текстовому анкору на посиланні.
Проведення та результати аналізу
При аналізі була проведена перевірка декількох сайтів, але ми розглянемо процес на прикладі блогу devaka.ru.
Загальний індекс можна отримати за запитом «site: devaka.ru» (із зазначенням filter = 0, щоб витягнути в тому числі дублі).
Основний індекс був отриманий за запитом «site: devaka.ru/&» .
З скріншотів (тут відображені не перші результати) вже видно, що сторінка / articles / не відображається при другому запиті, але є у видачі при першому.
Усього було отримано:
598 результатів із загального індексу. 504 результатів з основного. 94 результатів в «соплях».
Нижче наведені сторінки, які потрапили в додатковий індекс.
http://devaka.ru/about/ob-avtore-i-bloge
http://devaka.ru/articles
http://devaka.ru/articles/1-september-seo-contest
http://devaka.ru/articles/1-year
http://devaka.ru/articles/added-rss-for-comments
…… всього 95 сторінок.
Далі даний список порівнювався з даними з Google Analytics — кількістю трафіку з Google за останній місяць. Вийшла наступна таблиця (приведена в неповному вигляді).
На сторінки додаткового індексу довелося 31 відвідувач за останній місяць з Google, в той час як усього 30976 відвідувачів. Тобто, на додатковий індекс припало близько 0,1% трафіку, хоча ці сторінки становлять близько 16% всього індексу (для аналізованого сайту).
Цікаво, які саме сторінки отримали трафік?
На ці сторінки заходили за такими запитами: — «Як оптимізувати відео devaka» — «Юзабіліті і seo devaka» — «Http://www.google.com/search?q=cache:http://devaka.ru/articles/howto-write-articles» — хтось шукав посилання в кеші, по всій видимості. — Решта «(not provided)»
Таким чином, ми бачимо, що на сторінки з додаткового індексу заходили переважно ті люди, які шукали на сайті devaka.ru (використовували бренд-запити).
Якщо аналізувати посилання на отриманих сторінках в додатковому індексі, то бачимо, що вони працюють (наприклад, ця сторінка , перевірочний запит ).
Підсумки аналізу
В результаті аналізу ми підтвердили першу гіпотезу і спростували другу. Тобто, дійсно, сторінки в додатковому індексі не беруть участь в ранжируванні, якщо тільки текст не шукається безпосередньо на них. У нашому випадку ці сторінки отримали 0,1% Гуглівского трафіку (переважно по бренд-запитам). Однак, посилання зі сторінок в додатковому індексі все ж працюють, принаймні при пошуку по точному входженню тексту посилання акцептор знаходиться.
Які висновки можна зробити, виходячи з результатів аналізу? Я для себе зробив наступні:
1. Варто стежити за якістю індексу для свого сайту. Не завжди більше сторінок — краще.Велика кількість сторінок в індексі (від 15% до 99% у великих порталів) можуть отримувати всього 0,1 — 1% пошукового трафіку.
2. У додатковий індекс потрапляють малоінформативні сторінки та дублі. З тих сторінок, що мені вдавалося аналізувати, в додатковому індексі присутні найчастіше дублі (як внутрішні, так і з зовнішніх ресурсів, наприклад, якщо на сайті активно копіюють контент, то додатковий індекс для сайту може рости), а також сторінки, на яких крім наскрізних блоків присутній дуже мало тексту (менше 70-80 слів) або тільки посилання (в незалежності від обсягів).
3. «Соплі» рідко переіндексовуются. Судячи логам сервера, сторінки в «соплях» малозначущі для роботів і переіндексіруются дуже рідко, ними складно маніпулювати і купувати з них посилання не має економічного сенсу.
4. Деякі сторінки потрапляють в додатковий індекс, якщо більша частина їх унікального тексту дублюється на сторінці-категорії. Це було відмічено для деяких документів, у яких немає зовнішніх дублів. Частина їх тексту просто копіюється на сторінці-категорії. У зв’язку з цим, анонси у категорії краще пускати унікальні, щоб залишати унікальним текст самої статті.
У будь-якому випадку «соплі» це погано 🙂
Стаття створена за матеріалами сайту https://devaka.ru/articles/supplemental-index