Vyacheslav Tikhonov

Рейтинг
130
Регистрация
27.01.2001
Должность
Developer
Интересы
search engines, bots, information retrieval, data mining
Master's Degree in Computer Science

Осталось выяснить самое малое - по каким признакам считается релевантность урла теме, почему тем всего(!) 500 и взято 7 уровней?

Keva, с днем рождения! 🍻 Удачи во всем и успехов в работе!

Знал-бы прикуп-жил-бы в Сочи :-)

Greenwood, за такой осмысленный ответ можно ведь и отхватить на пару-тройку штрафных :)

Эхъ, поделился бы кто-нибудь информацией хотя бы относительно особенностей определения ролевантности в Ra и Ya ... Хотя бы в теории.

Читайте форум

Кстати, а дубли никак не чистятся? Одна и та же страница с www и без идут сразу друг за другом - 5 и 6 места.

Что ж, все понятно. Мониторинг информации и конкурентная разведка.

Подобные продукты с нужными функциями есть, но стоят денег, и немалых. Free версий лично я не видел.

Было бы интересно услышать Ваши комментарии.

Пока не очень чувствуется учет текста ссылок и ссылочного ранжирования. Например, при поиске сайта Кабмина

вылезают какие-то газетные отрывки, но самого сайта нет. Вообще выдача на навигационных запросах хромает довольно серьезно.

Информационные и транзакционные запросы отрабатывает достаточно неплохо, хотя если есть аналог Pagerank, то порядок вывода сайтов немного удивляет - вверху находятся не слишком известные сайты.

Вот я и спрашиваю, может кто-нибудь знает, какой софт это умеет делать?

Скорее всего, такую программу вряд ли где-то можно взять бесплатно. А для каких целей это нужно, если не секрет?

Я бы вместе со словом реферат написал интересующую меня тематику, или воспользовался поиском в базе рефератов

Скорее всего имеется в виду не тот реферат - реферат документа (abstract).

А какой-нить поисковик умеет после запроса сформировать отчет с рефератами близких по смыслу документов (при ограничении размера отчета) с выделением наиболее значимых терминов?

Что значит близких по смыслу? Разве при запросе, принадлежащем одной выбранной теме, поисковик не выдает документы по этой и близким темам?

Например, по

Information Retrieval.

А наиболее значимые термины - имеется в виду keyphrases extraction?

Но проблема может возникнут в том, что поиск не всегда будет давать те топики, в которых действительно то, что ищешь

На самом деле это не так уж и сложно. Например, очень частый вопрос:

Где можно найти статистику запросов Яндекса и Рамблера?

Ответ здесь.

Там дальше по прочтении топиков все станет понятно.

Или может еще и запросы пострить таким образом, чтобы было все как надо?

Именно это я и имел в виду. Нужно просто описать каждый вопрос множеством запросов :)

Всего: 847