Как оптимизировать PDF для SEO (7 шагов)

Patrick Stox
Патрик Стокс — консультант по продукту, технический SEO-специалист и амбассадор бренда в Ahrefs. Он является организатором Raleigh SEO Meetup, конференции Raleigh SEO, Beer & SEO Meetup, конференции Findability и модератором /r/TechSEO.
Article stats
  • Tweets 2
Data from Content Explorer

Shows how many different websites are linking to this piece of content. As a general rule, the more websites link to you, the higher you rank in Google.

Shows estimated monthly search traffic to this article according to Ahrefs data. The actual search traffic (as reported in Google Analytics) is usually 3-5 times bigger.

The number of times this article was shared on Twitter.

    Google начал индексировать PDF файлы с 2001-го года. Формат чаще всего используется в государственных, академических и бизнес целях.

    PDF файлы хороши для совместимости. Они работают практически на всех устройствах и всегда выглядят одинаково. Однако, если вы создаёте новый контент для интернета, лучше использовать веб страницы, а не PDF.

    Далее мы рассмотрим:

    PDF файлы отображаются в результатах поиска Google с отметкой PDF.

    1 google search pdf

    PDF файлы конвертируются в HTML и так индексируются. Для PDF файлов, в которых текст отображается картинками Google использует технологию оптического распознавания символов (OCR) и конвертирует изображения текста в текст. Картинки в PDF файлах тоже индексируются в результатах поиска по изображениям.

    Google предпочитает страницы PDF файлам в случае дублирования. Если у вас есть страницы и PDF файлы с одним и тем же контентом, Google чаще выбирает веб версию контента в качестве основной в дублированном кластере. Это значит что сигналы будут подклеиваться к веб версии и она будет отображаться в результатах поиска.

    Несмотря на то что Google индексирует и периодически ранжирует PDF файлы, у формата есть несколько недостатков по сравнению с веб страницами:

    1. Не адаптивные. PDF файлы создаются так, чтобы они выглядели одинаково на всех устройствах. А значит не существует адаптивных PDF файлов.
    2. Отсутствует навигация. У большинства PDF файлов нет элементов навигации, которые помогают людям находить другой контент.
    3. Нет некоторых SEO атрибутов. У PDF файлов есть эквиваленты для многих SEO элементов. Но многих элементов нет. Например, в PDF файлах нет атрибутов ссылок nofollow, UGC и sponsored.
    4. Их редко переобходит бот. Из-за того что PDF файлы редко меняются, бот их посещает гораздо реже чем страницы, которые меняются чаще.
    5. Сложнее отслеживать. Самые распространённые инструменты аналитики используют JavaScript для страниц и не работают в файлах PDF.

    Тем не менее, я прекрасно понимаю что случаются ситуации, когда приходится использовать PDF для контента. В таком случае, читайте дальше чтобы узнать как оптимизировать файлы PDF для поиска.

    У большинство элементов внутренней оптимизации, которые вы используете в HTML есть свои аналоги в PDF. Они используются привычным образом. Многие элементы также нужны для доступности. Давайте рассмотрим несколько способов оптимизировать PDF для SEO:

    1. Пишите хороший контент
    2. Добавьте оптимизированный заголовок
    3. Добавьте оптимизированное описание
    4. Используйте подходящее название файла
    5. Используйте атрибуты alt для изображений
    6. Используйте подзаголовки
    7. Используйте ссылки

    1. Пишите хороший контент

    Миссия компании Google — организовать всю информацию в мире. Даже если это не веб страница, хороший контент это хороший контент. Я видел множество примеров хорошего контента в PDF. Например, техническая документация, официальные документы и т.д. Очень много хорошего контента спрятано в PDF.

    2. Добавьте оптимизированный заголовок

    У веб страниц есть теги title и у PDF файлов есть заголовки. Многие поисковые системы используют заголовок для описания документа в результатах поиска. Если у PDF файла нет заголовка, в результатах поиска появится название файла.

    Вот как отредактировать заголовок файла PDF в Adobe Acrobat Pro:

    1. Нажмите Файл > Свойства (File > Properties)
    2. Отредактируйте заголовок в поле Title

    optimized title pdf

    3. Добавьте оптимизированное описание

    Как и в случае с мета описаниями у веб страниц, это не фактор ранжирования, но они помогут вам контролировать текст, который появляется в результатах поиска.

    1. Нажмите Файл > Свойства (File > Properties)
    2. Нажмите Additional Metadata
    3. Отредактируйте Описание

    optimize description pdf

    4. Используйте подходящее название файла

    Название файла PDF будет частью URL. Это повлияет на URL, который будет отображаться в результатах поиска. Также это небольшой фактор ранжирования.

    1. Нажмите Файл > Сохранить как (File > Save As)
    2. Отредактируйте Название файла.

    optimize file name pdf

    5. Используйте атрибуты alt для изображений

    Чтобы помочь поисковым системам понять изображения, можно добавить текст alt для изображений в файле PDF.

    1. Нажмите на иконку Ярлыки (Tags) в левом сайдбаре
    2. Найдите в структуре документа изображение, которому вы хотите добавить текст alt.
    3. Нажмите на изображение правой клавишей мыши.
    4. Выберите Свойства (Properties)
    5. Добавьте соответствующий текст

    optimize alt text pdf

    6. Используйте подзаголовки

    Как и теги подзаголовков (Н1-Н6) на веб страницах, вы можете указать что определённый текст в файле PDF это подзаголовки.

    1. Нажмите на иконку Ярлыки (Tags) в левом сайдбаре
    2. Найдите в структуре документа текст, который вы хотите отредактировать
    3. Нажмите на тег правой клавишей мыши
    4. Нажмите Свойства (Properties)
    5. Выберите соответствующий заголовок из выпадающего списка

    optimize heading level pdf

    7. Используйте ссылки

    Как и на любой другой страницу, внутренние и внешние ссылки влияют на ранжирование. Ссылки передают PageRank, а анкоры добавляют контекст. Используя входящие и исходящие ссылки в PDF файле, вы помогаете PageRank перетекать по сайту, не создавая тупиков. Некоторые PDF файлы получают кучу ссылок. Лари Пейдж однажды сказал, что “Оказывается, что лауреатов Нобелевской премии цитируют в 10 тысячах разных исследований”.

    Проверьте документ GDPR. На него ссылается 77 тысяч страниц на 823 доменах, но у него нет исходящих ссылок. Это упущенная возможность. Добавив несколько внутренних ссылок на другие страницы, можно помочь им ранжироваться лучше.

    3 regulation pdf backlinks rds

    А этот пример от Google ещё лучше. У их Руководства по поисковой оптимизации для начинающих 3370 ссылок из 754 доменов и они правильно сделали, что передают ценность другим страницам, оставляя на них ссылки из файла PDF.

    2 backlinks and rds

    google seo starter guide

    Чтобы добавить ссылки в PDF:

    1. Нажмите кнопку Редактировать PDF (Edit PDF) в правом сайдбаре
    2. Нажмите выпадающий список Ссылки (Link) в меню Редактирования
    3. Нажмите Добавить/Отредактировать ссылку (Add/Edit Web or Document Link)
    4. Нарисуйте прямоугольник вокруг текста, в котором вы хотите оставить ссылку
    5. Выберите Тип ссылки (Link type) Невидимый прямоугольник Invisible Rectangle
    6. Выберите Действие ссылки (Link Action) — Открыть веб страницу (Open a web page)

    add links pdf

    Примечание.
    Скриншоты и инструкции выше предназначены для Acrobat Pro DC и могут отличаться, в зависимости от программы, которую вы используете.

    Как мы уже упоминали, файлы PDF отслеживать сложнее. Поэтому многие маркетинговые команды встраивают PDF файлы, или дают к ним доступ только после заполнения формы. Делая так, они смещают внимание с отслеживания эффективности на лидогенерацию. Несмотря на это, есть несколько вариантов для отслеживания эффективности PDF файлов. Среди них:

    Отслеживание событий

    Можно отслеживать клики по ссылкам на файл и отправлять их в систему аналитики. Таким образом вы сможете увидеть сколько людей кликнуло на файлы PDF, скачали их и открыли. Узнайте здесь как настроить эти события.

    Вложения

    Если встроить файл PDF на страницу используя JavaScript или iframe, можно просто использовать аналитику для страницы.

    Сторонний скрипт для отслеживания

    Это сложное решение, но клики PDF возможно отправлять через сторонний скрипт для отслеживания, который отправляет данные в вашу систему аналитики прежде чем они получат файл PDF. Один из примеров можно найти здесь.

    Серверные логи

    Из-за того что файлы PDF хранятся на сервере, каждый запрос на доступ к ним записывается в файлы логов.

    Данные сторонних источников

    Из-за того что файлы PDF так редко отслеживают системами аналитики, иногда самые лучшие данные можно получить из других источников. Таких как Поисковая Консоль Google или Ahrefs. Ahrefs может предоставить данные о том, какие файлы PDF у ваших конкурентов получают больше всего органического трафика. Просто вставьте домен в Сайт Эксплорер, перейдите в отчёт Топ страницы и найдите URL, содержащие .pdf

    4 oracle pdfs

    Заключение

    Надеюсь, я вас убедил, что в большинстве случаев новый контент лучше создавать для веб страниц, а не PDF файлов. Но как насчёт старых PDF? Стоит ли их оптимизировать или перенести их на страницы? Как обычно говорят сеошники, “смотря как”. Я считаю что здесь нет правильного или неправильного решения. Делайте так как вам проще. В любом случае будет положительный результат. В зависимости от наличия ресурсов и прилагаемых усилий, можно оптимизировать PDF, перенести PDF на страницы или сделать что-то другое.

    Остались вопросы? Напишите в Твиттер.

    Перевел Дмитрий Попов, владелец Affilimarketer.com

    • Tweets 2
    Data from Content Explorer