Google поменял rel=prev/next и все сломали пагинацию — Вот как всё исправить

Patrick Stox
Патрик Стокс — консультант по продукту, технический SEO-специалист и амбассадор бренда в Ahrefs. Он является организатором Raleigh SEO Meetup, конференции Raleigh SEO, Beer & SEO Meetup, конференции Findability и модератором /r/TechSEO.
Статистика статьи
  • Ссылающиеся веб-сайты 2
Данные из Контент Эксплорер

Показывает, сколько различных веб-сайтов ссылаются на этот контент. Как правило, чем больше сайтов ссылаются на вас, тем выше вы ранжируетесь в Google.

Показывает ежемесячный рассчетный поисковый трафик на эту статью по данным Ahrefs. Фактический поисковый трафик (по данным Google Analytics) обычно в 3–5 раз больше.

Количество ретвитов этой статьи в Twitter.

    Когда компания Google заявила, что уже много лет не использует разметку rel=prev/next, мы заметили, что больше сайтов начали её менять, нанося вред сайтам. Давайте посмотри что изменилось и что следует делать.

    Разметка rel=prev/next нужна для обозначения пагинации на сайте. Раньше Google использовал разметку для того, чтобы разделить сигналы на группу страниц, а в поиске показывать самую релевантную из них. Чаще всего контент делился на несколько частей, что создавало множество страниц для списков товаров, форумных обсуждений и записей в блогах.

    Давайте взглянем как мог выглядеть код для серии из трёх страниц.

    Первая страница:

    Это первая страница, поэтому здесь нужно только обозначить следующую.

    <link rel="next" href="https://website.com/page/2/>
    

    Вторая страница:

    Здесь обозначаются следующая и предыдущая страницы.

    <link rel="next" href="https://website.com/page/3/>
    
    <link rel="prev" href="https://website.com/page/1/>
    

    Третья страница:

    Это последняя страница, поэтому здесь нужно указать только предыдущую страницу.

    <link rel="prev" href="https://website.com/page/2/>
    

    Но в 2019‑м году в Google решили нам сообщить о том, что они больше не используют разметку rel=prev/next для обозначения пагинации. Даже хуже: оказалось что они не используют её уже несколько лет.

    Это изменение не повлияло на SEO. Если на сайте используется несколько блоков одинакового текста, вашему сайту это не навредит и никаких санкций за это не будет. Не стоит бояться такого дублированного контента. Google всё равно будет пытаться выбрать самый подходящий контент.

    Поэтому вопрос в следующем: зачем что-то менять? И нужно ли что-то делать? Если да, то что?

    В этом посте вы узнаете:

    Давайте начнём с первого вопроса.

    Ещё до того как в Google заявили, что rel=prev/next больше не поддерживается, в официальных рекомендациях говорилось о том, что с пагинацией не нужно ничего делать и надо позволить боту самому разобраться.

    Ничего не делайте. Поскольку разбиение на страницы используется очень часто, алгоритмы Google показывают контент, наиболее соответствующий запросам пользователей, независимо от того, на скольких страницах он расположен.

    Учитывая это, скорее всего они перестали поддерживать rel=prev/next потому что научились лучше разбираться и им больше не нужна такая разметка.

    Кроме rel=prev/next у Google есть несколько вариантов для распознавания страниц в серии. В основном, на всех сайтах это работает одинаково, поэтому Google может смотреть на:

    • Заголовки
    • Теги title (когда используется один и тот же заголовок, но с разными цифрами)
    • Ссылки на странице (внутренние ссылки на подобные страницы из серии)

    Возможно также, что рекомендации приводили к плохим решениям, когда сайта делили контент на несколько страниц. Чаще всего это делалось для увеличения количества просмотров страниц и рекламного дохода. Но пользователям это не нравилось и было трудно найти то, что они хотели. Вот два примера того, что я имею в виду.

    Когда Google объявил о том, что они уже много лет не поддерживают rel=prev/next, одним из первых вопросов, который мы, как технические SEO специалисты получали был вопрос, как мы могли этого не заметить?

    Ответ простой: узнать было невозможно. Если бы Google не сказал, мы бы и не узнали.

    Если бы пагинация работала, то Google успешно консолидировал бы сигналы для всего набора страниц. И хотя обычно они показывали первую страницу, они могли её поменять на более релевантную, если такая была, и показывать её в результатах поиска. Если пагинация не работала, то ничего бы не поменялось. Google ведь и так показывает самую релевантную страницу.

    Нет.

    Если на вашем сайте уже есть разметка rel=prev/next, не стоит её удалять. Google не единственный кому она нужна. Она всё ещё рекомендована W3C  и нужна для веб-доступности и для соответствия ADA. Некоторые браузеры используют её для предзагрузки. А некоторые поисковые системы, такие как Bing, всё ещё её используют.

    В большинстве случаев вместе с rel=prev/next страницы используют теги каноникализации отсылающие страницу на саму себя. Если у вас всё работает так, то вам не нужно ничего делать. Относитесь к страницам пагинации как к любым другим страницам на сайте и убедитесь что ссылаетесь на другие страницы пагинации.

    Каноникализацию ещё можно настроить таким образом, чтобы все страницы пагинации указывали на страницу, где отображается весь контент сразу. Таким образом контент можно разбить на страницы для пользователей, а в индекс попадёт страница со всем контентом сразу.

    Так выглядит привычный вариант пагинации, где сканируется каждая страница:

    Но при внедрении пагинации люди часто повторяют одни и те же ошибки, которые вредят их сайтам:

    • Каноникализируют первую страницу
    • Остальные страницы закрывают от индексации
    • Ставят ссылки в nofollow
    • Запрещают сканирование

    Давайте подробнее взглянем на каждую из ошибок и узнаем как их проверить на своём сайте.

    Ошибка 1: Каноникализация первой страницы

    В лучшем случае Google просто проигнорирует тег canonical. Если нет, то таким образом отрезаются пути сканирования остальных страниц и многие становятся страницами-сиротами. Из-за этого поисковым системам сложнее находить и индексировать ценный контент. Также прекращается передача PageRank на другие страницы.

    Как проверить ошибки на своём сайте

    Просканируйте сайт с помощью инструмента Аудит Сайта в Ahrefs. Перейдите в Page Explorer и примените следующие фильтры.

    canonical pagination site audit

    Если есть совпадающие URL адреса, посмотрите на каноничные URL. Если есть страницы пагинации, которые указывают на первую страницу, их нужно поменять.

    canonical site audit

    Ошибка 2: Запрет на индексацию

    Если вы добавите noindex на страницы, они будут удалены из поиска. Страницы перестанут ранжироваться и PageRank не будет передаваться на них.

    Ссылки на странице могут быть просканированы, но в будущем это может поменяться. Аналитик Google Webmaster Trends Джон Мюллер упоминал о том, что страницы с noindex могут в будущем восприниматься как nofollow, но пока непонятно когда это будет. Когда другого аналитика Webmaster Trends Гари Илша спросили об этом, он ответил что скорее всего страницы будут просканированы.

    Пока до конца не будет понятно как это работает, безопаснее будет не запрещать эти страницы к индексации, если нет других путей сканирования.

    Как проверить эту ошибку на своём сайте

    Просканируйте сайт в Сайт Аудите Ahrefs, затем перейдите в Page Explorer и примените следующие фильтры:

    noindex site audit

    Если будут URL, которые совпадают с фильтром, удалите директиву noindex из мета тега robots или заголовка X‑Robots-Tag HTTP на странице.

    noindexed site audit

    Ошибка 3: Ссылки в nofollow

    Внутренние ссылки никогда не стоит помечать nofollow. Сегодня nofollow для Google это только рекомендация и в лучшем случае они просто проигнорируют то что вы пометили. Но вы могли и запретить дальнейшее сканирование и передачу остальным страницам сайта сигналов, таких как Pagerank.

    Как проверить эту ошибку на своём сайте

    Просканируйте сайт в Сайт Аудите Ahrefs, затем перейдите в Page Explorer и примените следующие фильтры:

    nofollow site audit

    Если будут URL, которые совпадают с фильтром, кликните по колонке “No. of inlinks nofollow”.

    nofollow inlinks site audit

    Вы увидите оверлей, на котором показано где можно найти ссылки с nofollow на вашем сайте.

    overlay nofollow links

    Удалите атрибуты nofollow с этих ссылок, или удалите директиву в robots, запрещающую сканирование, либо в заголовке X‑Robots-Tag на странице.

    Ошибка 4: Запрет на сканирование

    Запретив сканирование страниц вы усложните поиск контента на сайте, ваши страницы станут страницами-сиротами и PageRank не будет передаваться дальше по сайту.

    Как проверить эту ошибку на своём сайте

    Проверьте файл robots.txt на наличие директив, блокирующих поисковые системы от сканирование страниц пагинации. Вот как они могут выглядеть:

    User-agent: *
    Disallow: /blog/page/
    

    Удалите эти директивы из файла robots.txt.

    Заключение

    Если на вашем сайте уже настроена пагинация через rel=prev/next, не трогайте её. Нет смысла её менять. Вы можете сделать больше вреда, чем пользы.

    Если вы хотите поменять пагинацию потому что считаете, что страницы пагинации недостаточно некачественные, подумайте как можно сгруппировать страницы таким образом, чтобы это было удобно для пользователей и чтобы у ботов был альтернативный способ их сканирования. Например, если вы хотели использовать категории для группировки нескольких постов в блоге, то это будет намного лучше, чем куча страниц пагинации с постами на разные темы. У тематических страниц категорий есть шанс попасть в результаты поиска по релевантным запросам.

    Если будете использовать категории чтобы бот мог сканировать страницы, убедитесь что на категории стоят ссылки с главной страницы. Для этого может понадобиться редизайн, поэтому если вы не собирались ничего менять, я бы не рекомендовал этот способ. Даже с категориями у вас могут появиться страницы пагинации, если в какой-то категории будет много постов. Это только усложнит задачу.

    Если вы ещё не внедрили разметку rel=prev/next и не уверены, стоит ли вообще это делать, то это сложный вопрос. Я бы сказал, что всё зависит от того, насколько большие усилия потребуются для этого по сравнению с результатами. Помните, что разметку всё ещё используют браузеры и поисковые системы. Поэтому возможно, что усилия того стоят.

    Если вдруг кому-то нужна будет ссылка на оригинальную документацию, которая была удалена, то вот она.

    Остались вопросы о rel=prev/next или пагинации? Напишите мне в Twitter.

    Перевел Дмитрий Попов, владелец Affilimarketer.com

    • Ссылающиеся веб-сайты 2
    Данные из Контент Эксплорер