Как Google оценивает авторитетность контента: 6 возможных метрик

Адаптированная статья Расса Джонса (Russ Jones), научного сотрудника по поиску в System 1 и Moz.

Каждую идею в SEO можно рассматривать как набор метрик, которые мы используем для улучшения ранжирования страниц. А это значит, что если говорить о таком понятии как «авторитетность контента», то почти наверняка есть факторы, которые можно анализировать и улучшать для получения более высоких позиций в поисковой выдаче.

Если Google измеряет авторитетность контента, то какие показатели он может для этого использовать? Согласно каким критериям SEO-специалисты должны измерять E-A-T своего контента? Об этом пойдёт речь в статье.

Мы поговорим о том, что может представлять собой «авторитетность контента» и как мы можем её измерить.

Возможно, Google использует эти способы для измерения авторитетности, а может и нет. Но мы надеемся, что сможем выработать концепцию метрик, которые можно использовать для оценки авторитетности контента.

Тема авторитетности контента окружена противоречиями. Так, Google довольно чётко заявил, что экспертиза, авторитетность и надёжность (E-A-T) являются очень важными частями Руководства для асессоров. При этом, какая именно часть алгоритма помогает определять этот тип контента, в компании не уточнили.

Мы знаем, что поисковик не использует данные, получаемые от асессоров, для обучения алгоритма. При этом Google может применять их для отмены тех изменений в работе поискового алгоритма, которые не соответствуют его стандартам.

Как измерить авторитетность контента?

Итак, как мы можем измерить авторитетность контента? В конечном счёте, любая идея, о которой мы говорим в рамках поисковой оптимизации, должна сводиться к определённому набору измерений, которые в какой-то форме используются для ранжирования страниц.

Иногда бывает достаточно просто это ощущать. Однако авторитетный контент – это более сложная концепция. И оценить, является ли контент авторитетным или нет, довольно непросто.

По факту, Руководство для асессоров приводит достаточно понятные примеры того, что можно расценивать как высоко авторитетный контент. Например, в разделе «Новости» упоминается такой критерий, как наличие у автора статьи Пулитцеровской премии.

Вряд ли среди авторов много таких людей, поэтому непонятно, как такие примеры могут помочь нам определить авторитетность контента.

Поэтому ниже мы рассмотрим ряд идей, которые могут помочь получить лучшее понимание этого концепта.

1. ALBERT

Итак, далее мы поговорим о том, что могут представлять собой потенциальные метрики авторитетного контента. И начнём мы с такой концепции, как ALBERT.

Мы уже говорили об использовании поисковой системой Google алгоритма BERT для понимания естественного языка. Что касается ALBERT, то это «облегчённый BERT» - похожая модель, используемая Google, которая предназначена для ответов на вопросы.

Это может показаться не очень важным. Технологии ответа на вопросы используются уже довольно давно. Например, в работе избранных сниппетов (featured snippets). Однако ALBERT перевёл эту работу на новый уровень.

В настоящее время ALBERT и вариации этой модели занимают первые топ-5 позиций и 9 из топ-10 позиций в рейтингах ответов на вопросы, и все они работают лучше, чем люди. Это явное доминирование. И эта технология очень эффективна в своей области.

Как это связано с авторитетностью контента? Если подумать о документе, любом контенте, который мы производим, то наша цель – ответить на те вопросы, на которые наши пользователи хотят получить ответы. Поэтому любая тема, с которой мы начинаем – например, Data Science, – предполагает наличие ряда вопросов, ответы на которые хотят получить пользователи.

Так, пользователей могут интересовать следующие вопросы:

  • Кто такой специалист по анализу и обработке данных (Data Scientist)?
  • Сколько эти специалисты зарабатывают?
  • Что нужно знать, чтобы претендовать на эту должность?

И это то место, где такие системы, как ALBERT, могут быть чрезвычайно полезными для измерения авторитетности контента. Как вы видите, одной из мер авторитетного контента является то, насколько хорошо он отвечает на вопросы, связанные с конкретной темой.

Исходя из этого, можно представить, как Google анализирует все страницы, которые ранжируются по запросу [data science]. Поисковик знает топ-10 вопросов, связанных с этой темой, и смотрит, какие публикации лучше всего отвечают на них. Гипотетически.

Если бы Google мог это делать, то это было бы прекрасной метрикой для определения того, насколько основательным, значимым, ценным, полезным и авторитетным является этот контент.

Поэтому мы считаем, что алгоритм ALBERT действительно имеет большой потенциал. Но давайте посмотрим, что ещё может использоваться для определения авторитетности контента.

2. Плотность информации

Ещё один возможный способ – это анализ плотности информации. При написании статей авторы – особенно, если они не знакомы с темой – нередко используют много лишних слов, так называемой «воды».

При этом мы знаем, что количество слов на странице не влияет на позиции контента.

Таким образом, один из способов узнать, является ли контент действительно ценным или нет, или, по крайней мере, может ли он предоставить важную информацию – это использовать программы обработки естественного языка (NLP) для извлечения информации.

  • ReVerb + OpenIE

Одна из самых популярных NLP-технологий с открытым исходным кодом начиналась как проект под названием ReVerb, который потом объединился с Open IE Project.

Как это работает: вы можете предоставить системе фрагмент контента, и она извлечёт из него все фактические утверждения.

Таким образом, плотность информации будет представлять собой набор фактов, которые могут быть извлечены из документа, против количества слов.

Если бы у нас была эта метрика, то мы могли бы довольно легко отсеивать контент, написанный только ради объёма, и находить тот контент, который содержит важную информацию.

Просто представьте статью в Wikipedia – насколько плотной является информация в ней по сравнению с тем контентом, который большинство из нас создаёт.

3. Стиль контента

Стиль контента также может быть довольно простой метрикой. Например, если в статье используются встроенные цитаты, как это делается в Wikipedia, а соответствующие ссылки приводятся внизу страницы – аналогично научным статьям, то это также может указывать на авторитетность.

То же самое касается использования списков фактов или оглавлений, как это делает Wikipedia, и т.п.

Всё это довольно простые приёмы, которые, если подумать, чаще всего используют те сайты, которые заслуживают большего доверия.

Если это действительно так, то они могут быть подсказкой для Google, что контент, который вы производите, является авторитетным.

4. Качество текста

Помимо указанных выше параметров, довольно сложных для оценки, есть и достаточно простые. Такие как качество текста.

Есть ли в тексте орфографические и грамматические ошибки? Смотрели ли вы когда-нибудь на читабельность текста? Замечали ли вы, что ваш контент написан так сложно, что никто его не может понять? Или же так просто, что он попросту не кажется основательным и авторитетным?

Также есть такие вещи, как длина предложений и использование определённых слов.

Возможно вместо того, чтобы анализировать все сайты, на которых упоминается Data Science, Google смотрит только на домены .edu или только на опубликованные научные статьи, а затем сравнивает те формулировки, которая в них используются.

Это было бы довольно простым способом для Google идентифицировать авторитетный контент и тот, что не является таковым.

5. Медиа-стили

Ещё одна вещь, на которую мы можем обратить внимание, это медиа-стили. Только в случае данной метрики немного сложнее понять, как её может использовать Google. В то же время её легко измерять и использовать оптимизаторам.

  • Аннотированные графики

Я думаю, что мы должны отойти от графических изображений и больше двигаться к использованию графических библиотек с открытым исходным кодом. Это позволит предоставлять Google фактическую информацию и цифры в исходном коде.

  • Уникальный визуальный контент

Собственные визуализации - это то, о чём мы точно можем позаботиться. Уникальный визуальный контент также упоминается в Руководстве для асессоров Google.

  • Доступность

Доступность также имеет значение. Этот параметр не делает контент авторитетным, но говорит о том, в какой степени человек заботится о той информации, которая содержится на сайте.

6. Кликбейт-заголовки, квалификация автора и Google Scholar

В завершение мы рассмотрим ещё несколько параметров, о которых стоит поговорить.

  • Кликбейт-заголовки

Наличие такого рода заголовков указывает на то, что контент не является авторитетным. Об этом тоже говорится в Руководстве для асессоров. Поэтому важно избегать использования этого приёма.

  • Квалификация автора

Ещё одна вещь, которая упоминается в Руководстве для асессоров – квалификация автора.

Если автор имеет какие-то сертификаты, учёные степени и т.п., то это помогает Google понять, насколько он владеет той темой, о которой говорит.

  • Google Scholar

Ещё один аспект, который также заслуживает внимания – это Google Scholar. Как много Google зарабатывает на этом проекте? Вероятно, не очень много. Зачем тогда компании нужна гигантская база данных академической информации, если на этих страницах отсутствует реклама? Возможно, эти материалы нужны для оценки контента – согласуется ли он с научными данными по указанной теме.

Вместо заключения

В завершение мы снова хотим отметить, что всё, описанное в статье, – это просто предположения. Что именно использует Google для оценки авторитетности, пока неизвестно.

Но это не значит, что мы должны это игнорировать. Мы надеемся, что описанные нами идеи помогут вам понять, как вы можете улучшить контент на своих ресурсах.

Источник: Moz.com