Статья поможет новичкам разобраться с понятием релевантности, а также укажет основные способы ее определения
Автор: Инна Самарина, редактор проекта PR-CY
Релевантность — это степень соответствия результата запросу. В поисковой выдаче это пропорция ключевых фраз или слов, которые есть в запросе пользователя и на странице сайта.
Алгоритмы поисковых систем подбирают страницы с соответствующим контентом, а самые подходящие оказываются в топе выдачи. Для этого контент должен быть уникальным и полезным, но не перенасыщенным ключевиками. Релевантность выдачи также можно считать показателем эффективности работы поискового робота.
Два основных параметра, по которым поисковики определяют релевантность страницы:
1. Наличие слов из запроса на странице и их плотность.
Чтобы поисковый робот признал страницу релевантной, на ней должно быть достаточно вхождений, но не слишком много, иначе робот сочтет ее спамной.
Помните правило о том, что нужно писать для людей — да, оно до сих пор работает.
2. Поведение пользователей после перехода на страницу.
Если пользователь уходит со страницы сразу же и идет искать дальше, это сигнал для поискового робота — страница не соответствует запросу. Если отказов будет слишком много, поисковик понизит страницу в выдаче.
Внутренние критерии релевантности
Самое важное, что нужно знать: текст на странице должен соответствовать тематике сайта, ключевые слова или фразы должны соответствовать тематике текста. Задача текста — дать полный развернутый ответ на вопрос пользователя. Используйте длинные запросы, пишите тексты для своего сайта простым языком — как писал бы пользователь в строке поиска.
Плотность
Вписывайте ключи в текст органично, используйте словоформы и синонимы, чтобы вхождение было естественным. Поисковые алгоритмы обращают внимание не только на ключи, но и на их окружение, поэтому все—таки придется писать “для людей”.
Расположение
Размещайте ключевые слова не куда попало, а так, чтобы они создавали структуру текста. В то же время лучше, чтобы ключи находились ближе к началу страницы, больший вес именно у тех, что расположены наверху. Вставляйте их в мета—теги: title, description, H1—H6, в описания изображений. Хорошо, если ключевое слово встречается в названии раздела сайта и в url. Относитесь с осторожностью к прямым вхождениям и проверяйте на переспам отдельные слова.
Юзабилити
У неудобного сайта с непонятной навигацией будет много отказов, и ключевые слова не помогут. Помните о внутренней перелинковке, чтобы логично связать разделы сайта, не размещайте текст “простыней” — разбейте на абзацы, разбавьте списками и изображениями.
Качество текста
Не будем про инфостиль, но не забывайте, что сложноподчиненные предложения на половину страницы, повествующие о неоспоримых преимуществах и стремительном развитии вашей молодой перспективной компании, заставляя перечитывать себя несколько раз и вдумываться в смысл прочитанного, скорее отпугнут пользователя, чем расскажут о вашем писательском таланте. Помните про грамматику, структуру и удобство пользователей. Или подпишитесь на рассылку Главреда.

пример плохого текста
Технические параметры
Скорость загрузки сайта, отсутствие страниц с ошибками, настройка редиректов, файл robots.txt и карта сайта — эти параметры влияют на «отношение» поисковых систем к сайту.
Обновления контента
Тот самый случай, когда важно не только качество, но и количество. Хотя бы раз в месяц размещайте новые материалы по тематике вашего ресурса и обязательно обновляйте старые, если информация в них устарела.
Внешние критерии релевантности
Самый важный критерий — ссылочная цитируемость ресурса. Чем больше сайтов на вас ссылается, чем более они популярны, тем лучше. Важно, чтобы тематика сайтов-доноров совпадала с вашей. Хорошо, если это не просто ссылка, а анкор — органично вписанная в текст фраза со ссылкой, ведущей к вам. Если по ссылке пользователь не найдет то, что искал, будет много отказов, и эта ссылка окажется бесполезной. Вся ссылочная масса должна выглядеть естественно.
Пользователь читает статью о том, как самостоятельно покрасить стены в квартире. Он видит ссылку под текстом «подобрать колер» и ждет, что найдет по ней советы по подбору колера, а не предложение купить промышленный смеситель краски или ламинат, хотя тематика схожая — ремонт. В последних двух случаях пользователь, скорее всего, сразу закроет вкладку.
Поисковые алгоритмы сработают так, что подобные ссылки навредят и вам, и сайту-донору.
Релевантность слов на странице/в документе
Чтобы оценить важность конкретного слова в тексте, можно использовать статистический показатель TF*IDF. По нему оценивается вес каждого слова, входящего в общую базу документов.
TF — это частотность вхождения термина (англ. term frequency), IDF — обратная (инвертированная) частота документа (англ. inverse document frequency). В контексте соотношения TF*IDF вес определенного слова прямо зависит от того, сколько раз оно встречается на заданной странице/в документе и обратно зависит от частоты использования во множестве других документов или в базе.
TF показывает соотношение количества конкретного (искомого) слова и общего количества слов на странице, этот параметр показывает важность/вес конкретного слова на конкретной странице.
IDF — это инверсия частотности, с которой определенное слово встречается в базе. Этот показатель позволяет снизить вес часто встречающихся слов — союзов, предлогов, общих понятий, не несущих смысловой нагрузки. Если заданное слово часто используется на проверяемой странице, но редко — на других, показатель TF*IDF будет высоким. Он используется для анализа релевантности текстового контента в больших объемах данных и для поиска схожих по смыслу страниц/документов.
Анализ контента страницы
Из-за того, что алгоритмы поисковых систем постоянно меняются, релевантность страниц тоже не остается постоянной. Также она может зависеть от географических факторов, устройства, с которого пользователь выходит в сеть, особенностей браузера, журнала посещений и других факторов. Чтобы оценить релевантность страницы, опирайтесь на результаты поисковой выдачи — выберите ключевые слова или фразы, настройте регион поиска и смотрите, что попадает в топ. Для оценки релевантности текстового контента можно использовать онлайн-сервисы.
К примеру, инструмент “Анализ контента” от PR-CY позволяет оценить тексты с точки зрения поисковых систем. Он показывает общие технические параметры страницы — размер HTML, скорость загрузки, внутренние и внешние ссылки и анализирует контент: находит title, description и заголовки H1-H6, определяет длину текста и количество слов. Для оценки релевантности контента используется параметр TF*IDF, отдельно для всех слов на странице и для заданных пользователем ключей. Сервис бесплатный, авторизации не требует.

анализ технических параметров страницы

анализ релевантности контента сервисом
Сервис “Contentyoda” технические характеристики страницы не оценивает, но показывает общую статистику текста. Он позволяет проверить его на соответствие ключевикам, монотонность, релевантность, оценить уровень переспама и водянистости, высчитать индекс читабельности по индексу туманности Ганнинга и индексу удобочитаемости Флеша. Первый индекс определяется по уровню образования, которое нужно читателю, чтобы понять текст, индекс Флеша считается по многим параметрам, включая длину предложений и разнообразие слов.
Бесплатно сервис дает возможность проверять текст до 600 символов, платные тарифы начинаются от 599 рублей за 50 проверок.

пример анализа текста сервисом

часть анализа текстового фрагмента
Сервис Majento позволяет проанализировать страницу на релевантность поисковой выдаче по конкретному запросу. Показывает результаты как по title, так и по всему тексту, релевантность высчитывает в процентах и раскладывает на конкретные пункты анализа.
Сервис бесплатный и авторизации не требует.

пример анализа title страницы

пример анализа текста статьи
Мы привели в пример несколько самых популярных сервисов, есть еще множество других, с разной функциональностью и тарифами, будет несложно подобрать тот, которым удобнее пользоваться.
Вместо заключения
Итак, поисковые системы оценивают полезность страницы для читателей по двум основным критериям: наличие и плотность слов из запроса на странице и поведение юзера после перехода. Кроме того, при написании текстов нужно ориентироваться на внутренние и внешние критерии релевантности, которые были описаны в статье, в таком случае текст пройдет проверку системы, будет считаться достаточно релевантным и полезным.