Перейти до основного вмісту
Як PDF-файли можуть канібалізувати сторінки сайту

Тема особливо актуальна для комерційних сайтів, де на додаток до основного опису товарів, часто, просто необхідно ще прикріплювати технічні характеристики, сертифікати, інструкції з експлуатації тощо. як файл, і найчастіше це саме файли у форматі PDF. Але наскільки корисні такі вкладення для сайту щодо SEO?

Ось приклад такої картки товару із вкладенням:

energy-voltron.com.png

За натисканням посилання або відкривається нова вкладка (вікно, лайтбокс) з вмістом файлу, або пропонується зберегти PDF файл на комп'ютер.

Але, давайте розберемося з метою додавання таких вкладень:

  1. Надати повну відповідь відвідувачу сайту на заданий йому запит
  2. Розмаїти контент на сторінці
  3. Збільшити поведінкові фактори на сайті
  4. Як кінцева мета - отримати конверсію від відвідувача, який після відвідування сторінки товару та ознайомлення з інформацією про нього має вчинити цільову дію, найчастіше це оформлення замовлення.

Це, мабуть, основні цілі та користь від додавання вкладень. Індексація, ранжування, розширення семантики і, як наслідок, додаткові переходи з пошукових систем з метою я не вказав спеціально, і ось чому.

Справа в тому, що відвідування пошукової системи на сторінку PDF документа не рахуються в метриці сайту як перехід на одну зі сторінок. Єдине, що в метриці можна відстежити - це так звані "завантаження файлів", але це швидше до пункту 3 цілей, зазначених вище.

zagruzki_faylov_-_yandeks.metrika.png

zagruzki_faylov_.metrika.png

Як бачимо завантаження все ж таки є.

Видачу засираємо, профіт не отримуємо

Окрім того, що переходи з пошукової системи на PDF файли не дають нам додаткового трафіку для сайту (я, наприклад, не зміг ніяк це відстежити, якщо у когось є інша думка та досвід, будь ласка, поправте), так до того ж , рідкісний відвідувач потрапивши на цей PDF файл, здійснить потім перехід на саму картку товару, навіть якщо в PDF файлі є зворотне посилання на цей самий товар. Навіщо нам тоді показувати у видачі файли?  Скажіть, ну, нехай будуть, шкоди як мінімум жодної. Хоч би як!

Канібалізація

Канібалізація, якщо просто, це коли в межах сайту одна сторінка, поїдає іншу, видавлюючи її з результатів пошуку. Таке буває коли сторінки мають одне й те саме смислове навантаження і відповідають на ті самі запити. Як результат, пошуковим системам немає сенсу тримати у видачі два документи з одного сайту, які відповідають на одне і теж, і визначається одна, найбільш релевантна сторінка, інша ж при цьому йде далеко вниз, або зовсім перестає ранжуватися по ряду запитів, що перетинаються.

PDF - така ж сторінка сайту як і html документи. Відповідно, якщо в PDF файл буде визнаний більш релевантним за певними запитами, то наша картка товару, яка нам найбільш цікава для досягнення цілей, буде канібалізована та зсунута далеко вниз. Нижче наведено приклад однієї сторінки з реального сайту, яку з пошуку висунув PDF файл:

Є картка товару з вкладеним технічним описом приладу:

ustroystvo_rs83_a2.0_pdf.png

Вот позиции и релевантная страница, которую показывает сервис съема позиций Line:

line.png

А ось пошукова видача за цим запитом в Яндексі:

ustroystvo_rs83_a2.0.png

Сайт за запитом у ТОП 3, але який толк від цього ТОПу, якщо перейшовши відвідувач потрапить не на сторінку товару, а на PDF документ? І таких запитів, які канібалізували PDF-файли виявилося досить багато. Чому? Часто в PDF вкладеннях набагато більше корисної інформації для користувача ніж на картці товару, у зв'язку з чим він і визначається за рядом запитів як найбільш релевантний документ. До речі, це стосується тільки текстових PDF-файлів, PDF збережені картинками не страшні.

Вирішення проблеми

Видаляти вкладення все ж таки не варто так як вони дійсно можуть бути корисними відвідувачам. Копіювати все з PDF і вставляти в картку товару теж не вихід, інакше перетворимо опис товару на цілу статтю. На мій погляд найбільш правильним рішенням у таких випадках - залишити документацію для користувачів сайту, охопивши при цьому всі цілі, описані вище, але прибрати їх з видачі пошукових систем шляхом заборони на індексацію всіх небажаних файлів у robots.txt. Приклад:

Disallow: / *pdf
Disallow: / *docx
Disallow: / *djvu
Disallow: / *txt

Я розповів про шкоду тільки PDF файлів так як вони найчастіше зустрічаються у вкладеннях та видачі, але інші документи у форматі Word або txt теж можуть скласти конкуренцію html сторінкам сайту, тому закривайте їх також якщо такі є.