Что такое семантический поиск и как он влияет на SEO?

Michal Pecánek
Маркетолог и автор для Ahrefs. Заядлый любитель SEO, авиации, парфюмерии, суши и тако.
    Вы замечали, что сегодня Google отвечает практически на каждый вопрос, который вы ему задаёте?

    Посмотрите на результат по этому запросу:

    yoda fs

    Несмотря на то что Йода не упоминается по имени, Google понял о ком речь и что мы хотели о нём узнать.

    Это было бы невозможно без семантического поиска.

    В этом посте вы узнаете:

    Семантический поиск это процесс поиска неструктурированной информации, который используют современные поисковые системы, чтобы предоставлять самые релевантные результаты.

    Термин происходит от названия раздела лингвистики “семантика”, который изучает смысловые значения.

    Несмотря на то что в процессе участвует множество переменных, принципы работы семантического поиска, почему он нужен и что на него влияет, понять достаточно легко.

    Пользователи часто используют разный язык для поиска нужного контента

    Хуже того, мы иногда даже не знаем как правильно составить запрос.

    Допустим, вы услышали незнакомую песню на радио. Вам она понравилась и вы начинаете гуглить случайные слова из песни, пока наконец её не находите.

    soad serp

    А теперь сделаем задачу ещё сложнее. Сравните то что вы вводите в Google с тем, что вы говорите Siri, Alexa, или Google Ассистенту. Ключевые слова стали разговорными.

    Есть множество способов выразить одну и ту же идею и поисковым системам нужно справляться со всеми ими. Они должны уметь сопоставлять контент в индексе и ваши поисковые запросы, основываясь на смысле обеих.

    Как бы сложно это ни звучало, это только начало.

    Многие запросы неумышленно неоднозначны

    Около 40% слов в английском языке полисемичны, т.е. у них есть два или больше значений. Это, пожалуй, самая сложная проблема, которую пытается решить семантический поиск.

    Например, слово “python” спрашивают 533,000 раз в месяц только в США:

    python search volume

    Если бы я когда-нибудь искал “python”, я бы скорее всего имел в виду язык программирования. Но тот кто не относится к индустрии технологий скорее всего имел бы в виду змею или известную британскую комик-группу.

    Проблема здесь в том, что без контекста редко можно однозначно понять смысл слова. Кроме полисемии, слова также могут выступать прилагательными, глаголами, или тем и другим. И это мы ещё не вышли за пределы прямых смыслов. Если вникнуть в переносные смыслы (например, сарказм), всё становится ещё интереснее.

    Контекст определяет всё в семантике и это подводит нас к оставшимся двум выводам.

    Необходимость понимания лексической иерархии и связи между объектами

    Давайте взглянем на следующий поисковый запрос и верхние результаты поиска:

    complex query example

    Удивительно. Вот что нужно Google, чтобы понять этот запрос:

    1. Знать что слово “partner” (партнёр) обозначает жену/девушку/мужа/парня/супругов.
    2. Понимать что Оби-Ван появлялся в нескольких фильмах и его играли разные актёры.
    3. Провести связи.
    4. Отобразить результаты поиска таким образом, чтобы не забыть ничего из того, что связано с “obi wan”.

    Даже не представляю что бы я получил, если бы ввёл этот запрос в 2010‑м или раньше.

    Теперь давайте сделаем шаг назад и подробнее рассмотрим все эти понятия.

    Лексическая иерархия показывает отношения слов друг к другу. Слово “партнёр” (partner) более общее по значению (гипероним), чем жена, парень, супруги и другие.

    Как мы уже говорили ранее, наши запросы часто не совпадают с точной формулировкой того что мы хотим найти. Очень важно знать что “доступная цена” это что-то между дешевизной, средней и разумной ценой.

    Объекты (сущности) в данном примере это персонажи из фильма (Оби-Ван), люди с определённой профессией (актёры) и люди, которые с ними как-то связаны (партнёры). В целом, сущности это объекты или понятия, которые можно точно определить. Часто это люди, места или вещи.

    Несмотря на все языковые сложности, нам нужно пойти ещё дальше.

    Давайте вернёмся к примеру с питоном (“python”). Если я введу его в поиск, я действительно получу результаты о языке программирования.

    Как бы нам не не нравилось использование наших персональных данных, как минимум они полезны для поиска. Google использует ограниченные данные вместе с вашей историей поиска чтобы дать вам наиболее точные персонализированные результаты.

    Мы все об этом знаем. Введите любую услугу в поисковую строку и получите результаты с местными компаниями:

    local results

    Но что более удивительно, так это способность Google временно подстраивать результаты поиска под цели поиска, которые постоянно меняются.

    Например, коронавирус — это не новый термин. Так всегда называли группу вирусов. Но как мы знаем, вначале 2020-го года цели поиска по этому запросу резко изменились. Люди начали искать информацию об определённом штамме коронавируса (SARS-CoV‑2). Результаты поиска поменялись соответственно.

    serp history graph

    Как видите по истории позиций по запросу “coronavirus”, ни один из первых пяти результатов не стоял в топе до 2020-го года.

    То же происходит и с интернет-магазинами во время больших распродаж на Рождество или Чёрную Пятницу. Цель поиска в этот период крайне сосредоточена непосредственно на покупках, хотя в другое время люди могут искать сравнения или отзывы.

    Google постоянно обновляет алгоритм и технологии чтобы ещё больше улучшить способность понимать естественную речь и цель поиска.

    Есть четыре основных технологии, которые делают семантический поиск таким как он есть в 2020‑м.

    Knowledge Graph (Сеть знаний)

    Сеть знаний Google, представленная в 2012‑м году это база знаний, которая состоит из объектов и связей между ними.

    Её можно представить как что-то похожее на это, но она состоит из пяти миллиардов объектов:

    Если коротко, это технология, которая “выстрелила” и дала возможность перейти от поиска по ключевым словам к поиску по смыслам.

    Сеть знаний получает данные в основном из двух источников:

    1. Структурированные данные (далее рассмотрим подробнее)
    2. Поиск объектов (сущностей) в тексте

    Чтобы воспользоваться вторым способом, поисковой системе нужно понимать естественную речь. Отсюда в игру вступают три обновления алгоритма, о которых речь пойдёт далее.

    Hummingbird

    В 2013‑м году Google запустил поисковый алгоритм под названием Hummingbird. Он был особенно полезен при работе со сложными поисковыми запросами.

    Hummingbird стал первым главным обновлением, которое акцентировало внимание на важности смысла запросов, а не текстов ключевых слов. Это был нужный катализатор, который заставил людей писать о темах, а не ключевиках.

    RankBrain

    Если вы когда-нибудь встречали фразу Латентно-Семантическое Индексирование или LSI запросы, забудьте о них. Google решил проблему, для которой изобрели LSI, с помощью RankBrain.

    Мы уже обсуждали эту проблему. Речь шла о несоответствии между формулировкой запроса и языком, который используется в контенте.

    Алгоритм Google RankBrain основан на технологиях, которые намного превосходят LSI. Простыми словами, RankBrain понимает значение даже незнакомых слов и фраз с помощью сложных алгоритмов машинного обучения.

    И это очень важно, учитывая что 15% всех поисковых запросов — новые.

    RankBrain можно рассматривать как апгрейд Hummingbird, а не отдельный алгоритм. Это один из самых важных факторов ранжирования, но единственное что вы можете сделать для оптимизации под него — удовлетворять цель поиска.

    BERT

    Bidirectional Encoder Representations from Transformers (BERT — двунаправленная модель кодировщика-трансформера) это новейшее обновление в работе семантического поиска. Оно влияет примерно на 10% всех запросов с конца 2019-го года.

    Не волнуйтесь. Мне тоже потребовалось время чтобы хотя бы запомнить как расшифровывается BERT.

    Всё что вам нужно знать это то, что BERT помогает лучше понимать длинные и сложные предложения и запросы. Это решение для работы с неочевидными запросами и нюансами. Оно помогает лучше понимать контекст употребления слов.

    И хотя под BERT оптимизировать невозможно, неплохо знать что это такое и как оно работает.

    Я уже немного упоминал о некоторых моментах в статье. Теперь давайте разберемся, что конкретно можно сделать.

    1. Оптимизируйте под темы, а не ключевые слова
    2. Определите цель поиска
    3. Используйте семантическую разметку HTML
    4. Используйте разметку schema
    5. Выстройте бренд, чтобы попасть в Сеть знаний
    6. Выстройте релевантность с помощью ссылок

    1. Оптимизируйте под темы, а не ключевые слова

    В старые времена вы могли хорошо ранжироваться разными статьями по одной и той же теме, слегка изменив ключевые слова. Например:

    • open graph tags
    • open graph meta tags
    • og meta tags
    • open graph tag
    • what is open graph
    • facebook open graph tags

    Эти времена прошли. Сейчас Google понимает, что все эти запросы обозначают примерно одно и то же и в топе стоят практически одни и те же страницы.

    Помните об этом, когда будете создавать контент. Теперь цель — не занять топовые позиции по одному ключевику, а раскрыть тему полностью. Чтобы Google ставил вас на первые позиции по множеству похожих long-tail ключевым словам.

    Например, наша статья про мета теги Open Graph ранжируется по сотням ключевых слов. Многие из них это просто вариации одного и того же. Но некоторые обозначают подтемы. Например, “og:title,” “og url,” и “og:image”.

    open graph keywords

    У нас получилось ранжироваться по всем этим ключевым словам благодаря тому что мы написали подробную статью по теме, а не по отдельному ключевому слову.

    Посмотрев отчёт по странице из топа по нужной теме, можно понять о каких темах стоит писать. Например, вы хотели написать пост о том, как выращивать спаржу. Если вставить статью из топа по запросу “выращивание спаржи” (“growing asparagus”) в Сайт Эксплорер от Ahrefs и проверить отчёт Ключевые слова, то можно увидеть что кроме прочих, статья ранжируется по следующим ключевым словам:

    • how deep to plant asparagus (как глубоко нужно садить спаржу)
    • asparagus growing conditions (условия для выращивания спаржи)
    • when to plant asparagus (когда садить спаржу)
    • best place to plant asparagus (лучшее место для посадки спаржи)
    • how to harvest asparagus (как собирать урожай спаржи)
    • how to care for asparagus plants (как ухаживать за спаржей)

    Всё это стоит упомянуть при создании подробного поста, чтобы получить максимальное количество органического трафика.

    Небольшое предостережение: планируя контент под определённую тему, не стоит рассказывать про абсолютно всё что связано с ней или вникать слишком глубоко.

    Возьмите эту статью для примера. Я мог потратить десятки часов, исследуя тему обработки естественного языка и рассказать во всех технических подробностях о семантическом поиске. Я этого не сделал потому что большинству людей это неинтересно.

    Это приводит нас к следующему:

    2. Определите цель поиска

    Можно опубликовать контент по определённой теме и он всё равно не будет соответствовать цели поиска.

    Допустим, вы — маркетолог и работаете с данными. И вы увидели возможности войти в топ по теме “SEO report” (“SEO отчёт”). Обычно вы бы рассказывали обо всём, что нужно для создания SEO отчёта. У вас бы получилось что-то вроде “Используйте силу QUERY чтобы делать лучшие SEO отчёты”.

    Этот контент может и правда помочь создавать лучшие SEO отчёты. Но большинство людей, которые начинают интересоваться этой темой вообще могут не знать о функциях в Google Таблицах. Им просто нужно что-то, что решило бы их проблему:

    seo template ranking

    Поэтому прежде чем составлять структуру новой статьи, посмотрите на страницы, которые стоят в топе, чтобы понять цель поиска.

    Рекомендуем прочитать: Searcher Intent: The Overlooked ‘Ranking Factor’ You Should Be Optimizing For (Цель поиска: упущенный “фактор ранжирования”, под который нужно оптимизировать страницы)

    3. Используйте семантическую разметку HTML

    Прежде чем продвинуться к семантическому поиску, нужно было начать сдвиг в сторону семантического веба. Первоначальная идея Всемирной сети можно понимать как создание стандартизированных связанных друг с другом документов без какого-то явного смысла. Сегодня стало понятно, что нам нужен смысл.

    И он начинается с основ HTML.

    Сравните эти HTML элементы:

    Семантический HTML добавляет смысл в код таким образом, что машины могут понять где находятся блоки навигации, шапки, подвалы, таблицы и видео.

    HTML5 предоставляет самые основные семантические элементы, которые уже используют современные CMS. Если ваша CMS их не использует, то скорее всего можно поставить плагин, который позволит её добавить.

    Но семантическая разметка HTML всё равно достаточно ограничена. Она говорит, что “это таблица, а это подвал”, но она не передаёт смысл самого контента. Поэтому мы используем разметку schema.

    4. Используйте разметку schema

    Разметка schema это дополнительный способ размечать страницы. Её также называют структурированными данными, которые можно описать как общий семантический фреймворк для интернета.

    Словарь Schema.org содержит сотни типов, которые связаны свойствами. Их можно использовать для разметки контента и ботам Google будет легче понимать её без использования сложных алгоритмов.

    Например, Google будет проще выявить смыслы из этого структурированного контента:

    Время приготовления: 20 минут
    Калорий: 80

    … чем из естественной речи:

    Чтобы приготовить блины, понадобится 20 минут. К тому же, это низкокалорийные блины. В каждой порции около 80 калорий.

    Поэтому когда пользователь хочет узнать сколько времени займёт приготовление блинов, или сколько калорий каждый из них содержит, Google может предоставить ему информацию самым удобным способом.

    5. Выстройте бренд, чтобы попасть в Сеть знаний

    В общем-то, в заголовке всё сказано, потому что я уже рассказал об объектах (сущностях). Поэтому я просто направлю вас на статью о том, как попасть в Сеть знаний Google (Knowledge Graph).

    Среди прочих советов по улучшению SEO для семантического поиска этот самый сложный. Нужно приложить немало усилий чтобы построить бренд и применить остальные советы.

    Исторически, ссылки были одним из главных показателей релевантности. Если документ А ссылался на документ Б, они могли считаться взаимосвязанными.

    И внутренние, и внешние ссылки с релевантных страниц с естественным анкорным текстом помогают Google понимать о чем идёт речь в вашем контенте прежде чем его обрабатывать.

    Связанные статьи

    Напоследок

    Семантический поиск изменил всю экосистему работы с контентом. Пользователи получают более релевантный и ценный контент и это мотивирует издателей его производить.

    Несмотря на то что в семантическом поиске участвуют сложные технологии и алгоритмы, принципы семантического поиска просты для понимания. Теперь вы готовы провести необходимые изменения и положить надёжное основание для вашего SEO.

    Если у вас остались какие-либо вопросы или комментарии о семантическом поиске, напишите мне в Твиттере.

    Если хотите подробнее изучить технические подробности о семантическом поиске, подпишитесь на Дона Андерсона и посмотрите его презентации.

    Перевел Дмитрий Попов, владелец Affilimarketer.com