Как Google может интерпретировать запросы на основе информации о сущностях

28 декабря Google получил новый патент, в котором описан процесс интерпретации запросов на основе информации о сущностях – Methods, systems, and media for interpreting queries.  Об этом рассказал SEO-консультант Билл Славски, который специализируется на отслеживании и изучении патентов поисковой системы.

На конференции SMX 2016 сотрудник Google Пол Хаар представил доклад на тему «Как работает Google». Одним из основных пунктов презентации был тот факт, что поисковик пытается определить сущности в запросах пользователей.

В новом патенте Google подробно описывает этот процесс. Понимание запроса помогает поисковой системе предоставлять более релевантные результаты поиска.

В патенте описаны следующие этапы интерпретации запросов:

  • Получение запроса в поисковом домене.
  • Определение условий поиска на основе запроса.
  • Соответствует ли поисковый запрос имени сущности.
  • Проверка, взято ли имя сущности из метаданных, связанных с поисковым доменом.
  • Выбор типа сущности и присвоение оценки.
  • Поиск ряда имен сущностей путем удаления некоторых совпадающих имен сущностей на основе оценки сущности и контекстной информации в полученном поисковом запросе.
  • Выполнение поиска в домене поиска с оставшейся частью имен сущностей.

В патенте также описывается обработка голосовых запросов через связывание слов с сущностями.

Выводы

Когда поисковая система определяет, что в статье находится сущность, то пытается определить конкретно, о какой именно сущности идет речь.

В одном из других патентов Google объясняется, что при интерпретации сущностей возможны нюансы. Так, может показаться, что имя сущности «Майкл Джексон» связано только с одним человеком, которого знают большинство людей. Однако есть еще один Майкл Джексон, который не имеет ничего общего с популярным певцом. Этот человек известен как бывший заместитель секретаря Министерства внутренней безопасности США.


Чтобы определить, с какой именно сущностью связан запрос, Google рассчитывает коэффициент достоверности (confidence score). Таким образом, Google может определить, какая сущность ищется, прежде чем возвращать результаты поиска.

Если поисковая система способна корректно интерпретировать запросы и показывать релевантные ответы пользователю, то она может удовлетворить его информационную или ситуационную потребность.

В патенте этот процесс описывается намного подробнее. Билл Славски постарался выделить только ключевые моменты. Он также отметил, что правильное определение сущностей очень важно. В противном случае поисковая система не сможет верно интерпретировать запрос. 

Статьи по теме:

preview Google: запретить переписывать теги title невозможно

Google: запретить переписывать теги title невозможно

Нет такого механизма
preview Google об использовании RankBrain, Neural Matching, BERT и MUM в поиске

Google об использовании RankBrain, Neural Matching, BERT и MUM в поиске

Для лучшего понимания запросов
preview Только 33% сайтов достигают пороговых значений Core Web Vitals – исследование Ahrefs

Только 33% сайтов достигают пороговых значений Core Web Vitals – исследование Ahrefs

На основе 44 млн уникальных страниц
preview В Google рассказали, как работает модерация отзывов в Картах

В Google рассказали, как работает модерация отзывов в Картах

И какую роль в этом играет машинное обучение
preview Google значительно уменьшил видимость ccTLD крупных брендов в США

Google значительно уменьшил видимость ccTLD крупных брендов в США

Согласно данным Sistrix
preview В WTFSEO составили шуточный словарь по SEO

В WTFSEO составили шуточный словарь по SEO

С определениями самых частых терминов