Разметка rel=prev/next нужна для обозначения пагинации на сайте. Раньше Google использовал разметку для того, чтобы разделить сигналы на группу страниц, а в поиске показывать самую релевантную из них. Чаще всего контент делился на несколько частей, что создавало множество страниц для списков товаров, форумных обсуждений и записей в блогах.
Давайте взглянем как мог выглядеть код для серии из трёх страниц.
Первая страница:
Это первая страница, поэтому здесь нужно только обозначить следующую.
<link rel="next" href="https://website.com/page/2/>
Вторая страница:
Здесь обозначаются следующая и предыдущая страницы.
<link rel="next" href="https://website.com/page/3/> <link rel="prev" href="https://website.com/page/1/>
Третья страница:
Это последняя страница, поэтому здесь нужно указать только предыдущую страницу.
<link rel="prev" href="https://website.com/page/2/>
Но в 2019‑м году в Google решили нам сообщить о том, что они больше не используют разметку rel=prev/next для обозначения пагинации. Даже хуже: оказалось что они не используют её уже несколько лет.
Весенняя чистка!
Мы оценили наши сигналы для индексирования и решили отказаться от rel=prev/next.
Исследования показывают, что пользователям больше нравится контент на одной страницу. Где возможно, старайтесь всё размещать на одной странице. Но для поиска Google работает и серии страниц из нескольких частей. Делайте так, как будет лучше для *ваших* пользователей! #springiscoming pic.twitter.com/hCODPoKgKp— Google Webmasters (@googlewmc) March 21, 2019
Это изменение не повлияло на SEO. Если на сайте используется несколько блоков одинакового текста, вашему сайту это не навредит и никаких санкций за это не будет. Не стоит бояться такого дублированного контента. Google всё равно будет пытаться выбрать самый подходящий контент.
Поэтому вопрос в следующем: зачем что-то менять? И нужно ли что-то делать? Если да, то что?
В этом посте вы узнаете:
- Почему Google перестал поддерживать rel=prev/next
- Почему уже было ясно что rel=prev/next не работает
- Стоит ли удалять rel=prev/next
- Как правильно настроить пагинацию в 2020‑м году
- Как люди вредят своим сайтам, неправильно внедряя пагинацию
Давайте начнём с первого вопроса.
Ещё до того как в Google заявили, что rel=prev/next больше не поддерживается, в официальных рекомендациях говорилось о том, что с пагинацией не нужно ничего делать и надо позволить боту самому разобраться.
Ничего не делайте. Поскольку разбиение на страницы используется очень часто, алгоритмы Google показывают контент, наиболее соответствующий запросам пользователей, независимо от того, на скольких страницах он расположен.
Учитывая это, скорее всего они перестали поддерживать rel=prev/next потому что научились лучше разбираться и им больше не нужна такая разметка.
Кроме rel=prev/next у Google есть несколько вариантов для распознавания страниц в серии. В основном, на всех сайтах это работает одинаково, поэтому Google может смотреть на:
- Заголовки
- Теги title (когда используется один и тот же заголовок, но с разными цифрами)
- Ссылки на странице (внутренние ссылки на подобные страницы из серии)
Возможно также, что рекомендации приводили к плохим решениям, когда сайта делили контент на несколько страниц. Чаще всего это делалось для увеличения количества просмотров страниц и рекламного дохода. Но пользователям это не нравилось и было трудно найти то, что они хотели. Вот два примера того, что я имею в виду.
Когда Google объявил о том, что они уже много лет не поддерживают rel=prev/next, одним из первых вопросов, который мы, как технические SEO специалисты получали был вопрос, как мы могли этого не заметить?
Ответ простой: узнать было невозможно. Если бы Google не сказал, мы бы и не узнали.
Если бы пагинация работала, то Google успешно консолидировал бы сигналы для всего набора страниц. И хотя обычно они показывали первую страницу, они могли её поменять на более релевантную, если такая была, и показывать её в результатах поиска. Если пагинация не работала, то ничего бы не поменялось. Google ведь и так показывает самую релевантную страницу.
Нет.
Если на вашем сайте уже есть разметка rel=prev/next, не стоит её удалять. Google не единственный кому она нужна. Она всё ещё рекомендована W3C и нужна для веб-доступности и для соответствия ADA. Некоторые браузеры используют её для предзагрузки. А некоторые поисковые системы, такие как Bing, всё ещё её используют.
Мы используем разметку rel prev/next для сканирования и понимания структуры сайта. На сегодняшний день мы не склеиваем страницы пагинации в индексе и не используем prev/next в ранжировании. https://t.co/ZwbSZkn3Jf
— Frédéric Dubut (@CoperniX) March 21, 2019
В большинстве случаев вместе с rel=prev/next страницы используют теги каноникализации отсылающие страницу на саму себя. Если у вас всё работает так, то вам не нужно ничего делать. Относитесь к страницам пагинации как к любым другим страницам на сайте и убедитесь что ссылаетесь на другие страницы пагинации.
Каноникализацию ещё можно настроить таким образом, чтобы все страницы пагинации указывали на страницу, где отображается весь контент сразу. Таким образом контент можно разбить на страницы для пользователей, а в индекс попадёт страница со всем контентом сразу.
Так выглядит привычный вариант пагинации, где сканируется каждая страница:
Но при внедрении пагинации люди часто повторяют одни и те же ошибки, которые вредят их сайтам:
- Каноникализируют первую страницу
- Остальные страницы закрывают от индексации
- Ставят ссылки в nofollow
- Запрещают сканирование
Давайте подробнее взглянем на каждую из ошибок и узнаем как их проверить на своём сайте.
Ошибка 1: Каноникализация первой страницы
В лучшем случае Google просто проигнорирует тег canonical. Если нет, то таким образом отрезаются пути сканирования остальных страниц и многие становятся страницами-сиротами. Из-за этого поисковым системам сложнее находить и индексировать ценный контент. Также прекращается передача PageRank на другие страницы.
Как проверить ошибки на своём сайте
Просканируйте сайт с помощью инструмента Аудит Сайта в Ahrefs. Перейдите в Page Explorer и примените следующие фильтры.
Если есть совпадающие URL адреса, посмотрите на каноничные URL. Если есть страницы пагинации, которые указывают на первую страницу, их нужно поменять.
Ошибка 2: Запрет на индексацию
Если вы добавите noindex на страницы, они будут удалены из поиска. Страницы перестанут ранжироваться и PageRank не будет передаваться на них.
Ссылки на странице могут быть просканированы, но в будущем это может поменяться. Аналитик Google Webmaster Trends Джон Мюллер упоминал о том, что страницы с noindex могут в будущем восприниматься как nofollow, но пока непонятно когда это будет. Когда другого аналитика Webmaster Trends Гари Илша спросили об этом, он ответил что скорее всего страницы будут просканированы.
Пока до конца не будет понятно как это работает, безопаснее будет не запрещать эти страницы к индексации, если нет других путей сканирования.
Как проверить эту ошибку на своём сайте
Просканируйте сайт в Сайт Аудите Ahrefs, затем перейдите в Page Explorer и примените следующие фильтры:
Если будут URL, которые совпадают с фильтром, удалите директиву noindex из мета тега robots или заголовка X‑Robots-Tag HTTP на странице.
Ошибка 3: Ссылки в nofollow
Внутренние ссылки никогда не стоит помечать nofollow. Сегодня nofollow для Google это только рекомендация и в лучшем случае они просто проигнорируют то что вы пометили. Но вы могли и запретить дальнейшее сканирование и передачу остальным страницам сайта сигналов, таких как Pagerank.
Как проверить эту ошибку на своём сайте
Просканируйте сайт в Сайт Аудите Ahrefs, затем перейдите в Page Explorer и примените следующие фильтры:
Если будут URL, которые совпадают с фильтром, кликните по колонке “No. of inlinks nofollow”.
Вы увидите оверлей, на котором показано где можно найти ссылки с nofollow на вашем сайте.
Удалите атрибуты nofollow с этих ссылок, или удалите директиву в robots, запрещающую сканирование, либо в заголовке X‑Robots-Tag на странице.
Ошибка 4: Запрет на сканирование
Запретив сканирование страниц вы усложните поиск контента на сайте, ваши страницы станут страницами-сиротами и PageRank не будет передаваться дальше по сайту.
Как проверить эту ошибку на своём сайте
Проверьте файл robots.txt на наличие директив, блокирующих поисковые системы от сканирование страниц пагинации. Вот как они могут выглядеть:
User-agent: * Disallow: /blog/page/
Удалите эти директивы из файла robots.txt.
Заключение
Если на вашем сайте уже настроена пагинация через rel=prev/next, не трогайте её. Нет смысла её менять. Вы можете сделать больше вреда, чем пользы.
Если вы хотите поменять пагинацию потому что считаете, что страницы пагинации недостаточно некачественные, подумайте как можно сгруппировать страницы таким образом, чтобы это было удобно для пользователей и чтобы у ботов был альтернативный способ их сканирования. Например, если вы хотели использовать категории для группировки нескольких постов в блоге, то это будет намного лучше, чем куча страниц пагинации с постами на разные темы. У тематических страниц категорий есть шанс попасть в результаты поиска по релевантным запросам.
Если будете использовать категории чтобы бот мог сканировать страницы, убедитесь что на категории стоят ссылки с главной страницы. Для этого может понадобиться редизайн, поэтому если вы не собирались ничего менять, я бы не рекомендовал этот способ. Даже с категориями у вас могут появиться страницы пагинации, если в какой-то категории будет много постов. Это только усложнит задачу.
Если вы ещё не внедрили разметку rel=prev/next и не уверены, стоит ли вообще это делать, то это сложный вопрос. Я бы сказал, что всё зависит от того, насколько большие усилия потребуются для этого по сравнению с результатами. Помните, что разметку всё ещё используют браузеры и поисковые системы. Поэтому возможно, что усилия того стоят.
Если вдруг кому-то нужна будет ссылка на оригинальную документацию, которая была удалена, то вот она.
Остались вопросы о rel=prev/next или пагинации? Напишите мне в Twitter.
Перевел Дмитрий Попов, владелец Affilimarketer.com