Rel Canonical или Noindex? Что лучше использовать для закрытия дублирующих страниц?

Чтобы избежать дублирования контента и некачественных страниц при индексации, веб-мастера обычно предпочитают устанавливать теги noindex, nofollow, иногда rel = canonical, а иногда и все вместе. Так как же все таки правильней ?

Теги canonical и noindex в Google

Джон Мюллер (John Mueller) на одной из встреч в Google Webmaster Central рассказал, что поисковик Google при определении качества сайта использует только те страницы, которые разрешены для индексации. То есть, страницы закрыты через теги noindex учитываться не будут, именно поэтому Джон рекомендовал веб-мастерам вместо тега "noindex" использовать rel = canonical для страниц с дублирующим контентом.

При использовании тега noindex все сигналы, связанные с дублирующейся страницей, теряются и не передаются при учете качества сайта в целом. Канонический тег позволяет передать все сигналы с дублирующей страницы, на каноническую.

В случае если Вы будете использовать оба тега одновременно (noindex, nofollow, и rel = canonical), это может привести к непредсказуемым последствиям, так как они совершенно противоречат друг-другу и не могут использоваться вместе. По этому вопросу Джон Мюллер ответил:

Общее правило заключается в том, что сигналы передаются и объединены с канонизацией. Когда Google видит два похожих URL адреса с вашего сайта и вы чётко нам указываете на то, какой из них вы предпочитаете, мы попытаемся их объединить и будем учитывать только один (обычно более весомый) URL. Редиректы, rel=canonical, внутренние и внешние ссылки, sitemaps, hrflang и так далее — всё это говорит нам о ваших предпочтениях и чем больше вы их настроите, тем больше мы будем следовать им и использовать их для выбора канонического адреса (пересылая при этом все сигналы на выбранную страницу).

С другой стороны, noindex и disallow в robots.txt не являются признаками канонизации. Т.е. их наличие на странице не говорит нам, что вы хотите чтобы она сочеталась с какой-либо другой и что её сигналы нужно перенаправить. Disallow в robots.txt нам труднее понять, потому что мы даже не знаем соответствует ли указанная в нём страница чему-либо ещё на вашем сайте, есть ли похожие страницы, поэтому мы не можем использовать данный файл для канонизации, если бы захотели.

Отсюда следует: вы не должны смешивать noindex и rel=canonical так как для нас это очень противоречивая информация. Обычно мы выбираем rel=canonical и используем его поверх noindex, поэтому в любое время, когда вы полагаетесь на интерпретацию компьютерным скриптом (ботом), вы уменьшаете вес вашего входа (а SEO — во многом сводится на тем, чтобы указать боту ваши предпочтения).

Яндекс

Поисковая система Яндекс также распознает и учитывает оба тега, но комментариев от представителей Яндекса по вопросу можно ли использовать оба тега одновременно я не нашел. Но логически понятно, если теги распознаются также как и в Google, правила их использования должны быть теже.

Бороться с дублированием контента на сайте Яндекс также рекомендует в большей с помощью тега rel=cannonical, о чем есть небольшая заметка с примерами в блоге Платона Щукина https://yandex.ru/blog/platon/2878

SEO в примерах