Rel Canonical чи Noindex? Що краще використовувати для закриття дублюючих сторінок?

Щоб уникнути дублювання контенту та неякісних сторінок при індексації, веб-майстри зазвичай вважають за краще встановлювати теги noindex, nofollow, іноді rel = canonical, а іноді й усі разом. Так як же все-таки правильніше?

Теги canonical та noindex в Google

Джон Мюллер (John Mueller) на одній із зустрічей у Google Webmaster Central розповів, що пошуковик Google при визначенні якості сайту використовує тільки ті сторінки, які дозволені для індексації. Тобто, сторінки закриті через теги noindex враховуватися не будуть, саме тому Джон рекомендував веб-майстрам замість тега "noindex" використовувати rel=canonical для сторінок із дублюючим контентом.

При використанні тега noindex всі сигнали, пов'язані з дублюючою сторінкою, губляться і не передаються при обліку якості сайту в цілому. Канонічний тег дозволяє передати всі сигнали з дублюючої сторінки, на канонічну.

У випадку, якщо Ви будете використовувати обидва теги одночасно (noindex, nofollow, і rel = canonical), це може призвести до непередбачуваних наслідків, оскільки вони абсолютно суперечать один одному і не можуть використовуватися разом. З цього питання Джон Мюллер відповів:

Загальне правило полягає в тому, що сигнали передаються та поєднані з канонізацією. Коли Google бачить дві схожі URL-адреси з вашого сайту і ви чітко вказуєте на те, якій з них ви надаєте перевагу, ми спробуємо їх об'єднати і будемо враховувати тільки один (зазвичай більш вагомий) URL. Редиректи, rel=canonical, внутрішні та зовнішні посилання, sitemaps, hrflang і так далі - все це говорить нам про ваші уподобання і чим більше ви їх налаштуєте, тим більше ми будемо слідувати їм і використовувати їх для вибору канонічної адреси (пересилаючи при цьому всі сигнали на вибрану сторінку).

З іншого боку, noindex і disallow у robots.txt не є ознаками канонізації. Тобто. їх наявність на сторінці не говорить нам, що ви хочете, щоб вона поєднувалася з будь-якою іншою і що її сигнали потрібно перенаправити. Disallow у robots.txt нам важче зрозуміти, тому що ми навіть не знаємо чи відповідає вказана в ньому сторінка чомусь ще на вашому сайті, чи є схожі сторінки, тому ми не можемо використовувати цей файл для канонізації, якби захотіли.

Звідси випливає: ви не повинні змішувати noindex і rel=canonical, оскільки для нас це дуже суперечлива інформація. Зазвичай ми вибираємо rel=canonical і використовуємо його поверх noindex, тому будь-коли, коли ви покладаєтеся на інтерпретацію комп'ютерним скриптом (ботом), ви зменшуєте вагу вашого входу (а SEO — багато в чому зводиться на тому, щоб вказати боту ваші уподобання).

Яндекс

Пошукова система Яндекс також розпізнає та враховує обидва теги, але коментарів від представників Яндекса з питання чи можна використовувати обидва теги одночасно я не знайшов. Але логічно зрозуміло, якщо теги розпізнаються так само, як і в Google, правила їх використання повинні бути теж.

Боротися з дублюванням контенту на сайті Яндекс також рекомендує більшою за допомогою тега rel=cannonical, про що є невелика замітка з прикладами в блозі Платона Щукіна https://yandex.ru/blog/platon/2878

SEO в прикладах