Новый алгоритм определения релевантности

12
VT
На сайте с 27.01.2001
Offline
130
#11
Я задаю запрос "лизинг" и получаю в первых результатах сайты, относящиеся, преимущественно, к рубрике "Небанковское кредитование".
Т.е. Яндекс знает это слово и повышает вес определенных сайтов в теме.

О том, что что-либо подобное работает в Яндексе, можно с уверенностью сказать лишь тогда, когда его представители сами это хоть как-то подтвердят. Вряд ли они будут сейчас чем-то подобным заниматься, у них и так сейчас проблем хватает :)

VT
На сайте с 27.01.2001
Offline
130
#12
Дело в том, что слово "лизинг" относится к любой рубрике "транспорт", "недвижимость", "машиностроение", так как это технология покупки и компании регистрируются в разных рубриках.

Боюсь, все гораздо прозаичнее :) Просто эти слова хорошо прописаны в заголовках и описаниях выдаваемых сайтов в каталоге Яндекса, в нужных рубриках.

S
На сайте с 23.01.2003
Offline
51
#13

Оно подтвержается тем, что в других рубриках есть сайты не хуже прописанные по данному слову.

[Удален]
#14
Дело в том, что слово "лизинг" относится к любой рубрике "транспорт", "недвижимость", "машиностроение", так как это технология покупки и компании регистрируются в разных рубриках.

Думаю, что слово "лизинг" относится к финансовым операциям, как и слово "кредит" (хотя в кредит можно покупать и машины).

S
На сайте с 23.01.2003
Offline
51
#15

Если Яндекс "знает", что "лизинг" имеет большее отношение скорее к финансам, то идея реализовна.

spark
На сайте с 24.01.2001
Offline
130
#16

Позволю себе повторить стертое сообщение.

знают что такое "лизинг"

1) веб-мастера, составляющие описание

2) редактора Яндекс-каталога, редактирующие и описывающие сайты

даже в указанном вами примере http://www.yandex.ru/yandsearch?text=%EB%E8%E7%E8%ED%E3&tb=1

присутствуют сайты из рубрик "Строительное оборудование" и "недвижимость", "транспорт", "станки". Так о каком "знании" идет речь?

Ashmanov
На сайте с 21.11.2000
Offline
66
#17

Насколько я могу судить, заявленная тема обсуждения - это фактически тезаурус поисковых запросов.

В Рамблере мы это проделали с 60,000 самых частотных запросов и получили 2,500 рубрик. На каждой рубрике оказался повешен семантический образ рубрики. Образы пополнялись, естественно, не только из запросов, но и с помощью различных систематических процедур, например, в "фармакологию" можно сразу залить словарь названий лекарств.

В поиск этот тезаурус не был включён, потому что тут нужна хорошая теория - как объединять расчёт релевантности с тезаурусом. Это задача очень интеллектуально сложная, как и всё связанное с тезаурусом, а разработчикам Рамблера сейчас не до неё.

А вот для вывода ссылок на проекты Рамблера это использовали ещё в 2001, и получились так называемые "перевязки". Работают они очень хорошо, релевантность практически 100%, это даёт зацикливание трафика, то есть повышает число показов страниц на портале процентов на 10-12%.

На работу мы затратили усилия нескольких лингвистов в течение нескольких месяцев, но заниматься этим можно сколько угодно.

С уважением, Игорь Ашманов Все для оптимизации (рассылка, сервисы): www.optimization.ru (www.optimization.ru) Сервис по созданию собственных поисковиков: www.flexum.ru (www.flexum.ru)
F
На сайте с 29.11.2003
Offline
1
#18

насколько я понимаю, такой способ вполне реализуем. когда по каждой странице строится семантическая сеть, потом все сети объединяются в онтологию. при поиске вытаскиваются только те документы, которые имеют наибольший вес по связям.

// wbr
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий