Новый алгоритм определения релевантности

12
[Удален]
3586

Заранее извиняюсь, если эта идея "С бородой"

Основана на моем убеждении, что: "Если я ищу автомобильные покрышки "NOKIA", то для меня лучшим будет тот магазин, где продаются не только "NOKIA", но и остальные покрышки, и не продается, например, парфюмерия".

Точно так же можно отнестись и к сайтам:

- Каждому слову из списка поисковых слов присвоить одну (несколько) тему, к которорым они относятся. Темы можно взять из рубрикаторов.

Например слово "кошка" относится к теме "животные" (хотя может и "альпинизм"). Полностью согласен с тем, что это безумно большая работа.

- Релевантность страницы (сайта) оценивать по тому, как много слов данной тематики на странице (сайте).

- Релевантность страницы оценивать, и с учетом того, к какой теме относится введенный запрос. Совпадение темы запроса и "тематической релевантности" страницы должно продвигать страницу выше в списке.

Мне эта идея очень нравится:-)

VT
На сайте с 27.01.2001
Offline
130
#1

Может, подобный алгоритм и будет работать, но с точки зрения затрат на создание такой системы на это никто не пойдет. Один труд лингвистов, которые должны классифицировать все(?) слова по всем(?) темам обойдется в копеечку. А поддерживать рубрикатор в актуальном состоянии?

А что делать, если пользователь ищет по словам, у которых куча омонимов? :)

ER
На сайте с 19.11.2002
Offline
107
#2
"Если я ищу автомобильные покрышки "NOKIA", то для меня лучшим будет тот магазин, где продаются не только "NOKIA", но и остальные покрышки

По-моему наоборот, этот специализированный на одном производителе магазин может быть официальным дилером с наибольшим выбором и самыми низкими ценами. Ищите "магазин с покрышками", если много производителей хотите. Кстати, если Вы ищите сайт производителя, который других покрышек не делает, то что тогда? :)

Темы можно взять из рубрикаторов

Подобный рубрикатор "перевязок" есть у Рамблера.

Релевантность страницы (сайта) оценивать по тому, как много слов данной тематики на странице (сайте)

Какой простор для оптимизатора - наделал кучу страниц с нужным словом и... :)

VT
На сайте с 27.01.2001
Offline
130
#3
Подобный рубрикатор "перевязок" есть у Рамблера.

А у Рамблера, насколько я помню, из статистики взято около 100К наиболее популярных запросов, которые лингвисты ручками и классифицировали. "Всего лишь" 100 тысяч, которые, похоже, в основном поиске никак не используются.

[Удален]
#4
Один труд лингвистов, которые должны классифицировать все(?) слова по всем(?) темам обойдется в копеечку.

Если работать по каждому слову, то да, но скорее всего можно придумать, как эту работу сократить.

[Удален]
#5
Подобный рубрикатор "перевязок" есть у Рамблера.

Если Вы насчет: "Те, кто ищет 'снегоход', ищут также:", тона мой взгляд, это совсем не то. Там, просто обобщены запросы и нет никакого разбиения по темам.

VT
На сайте с 27.01.2001
Offline
130
#6
Если Вы насчет: "Те, кто ищет 'снегоход', ищут также:", тона мой взгляд, это совсем не то. Там, просто обобщены запросы и нет никакого разбиения по темам.

Нет, это же Рамблер ассоциации.

Перевязки они показывают сверху, перед поисковой выдачей. Например, по запросу футбол выводится блок:

Новости спорта: футбол

Товары: Книжный мир >> Спорт

Рейтинг Top100: Спорт

Это сделано, по-видимому, для более удобной навигации между различными разделами портала.

AA
На сайте с 16.04.2001
Offline
70
#7
- Каждому слову из списка поисковых слов присвоить одну (несколько) тему, к которорым они относятся. Темы можно взять из рубрикаторов.

Идея неплохая. Поиск по тезаурусу давно уже сделан и хорошо работает, например, см. УИС Россия Доброва-Лукашевич.

С уважением, Антонов Александр.
S
На сайте с 23.01.2003
Offline
51
#8

Я задаю запрос "лизинг" и получаю в первых результатах сайты, относящиеся, преимущественно, к рубрике "Небанковское кредитование".

Т.е. Яндекс знает это слово и повышает вес определенных сайтов в теме.

[Удален]
#9

Причем здесь это ?

S
На сайте с 23.01.2003
Offline
51
#10
Как писал Miha Kuzmin
Причем здесь это ?
Точно так же можно отнестись и к сайтам:
- Каждому слову из списка поисковых слов присвоить одну (несколько) тему, к которорым они относятся. Темы можно взять из рубрикаторов.
Например слово "кошка" относится к теме "животные" (хотя может и "альпинизм"). Полностью согласен с тем, что это безумно большая работа.

На основании списка ключевых слов, указываемых для сайтов, регистрируемых в определенную рубрику Каталога Яндекс можно составить список наиболее часто повторяющихся слов. Данные слова присвоить рубрике. Одно слово может соответствовать нескольким рубрикам, но иметь разный вес. Тогда все сайты рубрики с наибольшим весом слова выводятся наверх.

Дело в том, что слово "лизинг" относится к любой рубрике "транспорт", "недвижимость", "машиностроение", так как это технология покупки и компании регистрируются в разных рубриках.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий