Аналог Яндекса.
Имхо, очень точное наблюдение. Именно контент, не заголовки. Несколько раз такое наблюдал. Плюс еще очень любит новые страницы. То есть несколько ключевых слов на странице и в тайтле + только что сделанная страница, на которой стоит счетчик, и вы в топе. Год назад страница появлялась в топе по ключевыому запросу в тот же день. 3-5 место при нормальной плотности ключевых слов на странице.
но на русском MSN ищет плохо. То есть тупо ключевые слова и расстояния между ним. Наверное, есть свой аналог PageRank. Но качество результатов на русском очень плохое. Имхо, MSN Search это застолбленные пользователи Microsoft-а, то бишь его софта. IE в частности %) Хотя, сам Microsoft яростно это опровергал и говорил, что не учитывает запросы, пришедшие напрямую из IE. В общем, темна вода в облацех.
Объясню. Что именно персонифицировать? Сегодня я ищу зимние шины, завтра расписание фильмов на вечер пятницы в центре Москвы... Практически это должен быть персональный PageRank. Скорее, не запросы надо учитывать, а переходы. Хотя, при переходах много мусора, который просеивается только глазами. В общем, КПД затеи представляется на уровне 3%. ИМХО, овчинка не стоит выделки. Я имею в виду именно описанный подход.
Подбор ключевых слов для Altavista:
http://inventory.overture.com/d/searchinventory/suggestion/
Это фирма, занимающаяся контекстной рекламой - overture.com, недавно их купила Yahoo.
Там предупреждения, что отрабатывать может до 30 секунд - надо чуть-чуть подождать.
Прошу прощения, что ответ в 3х раздельных сообщениях - ссылки выдавал по мере нахождения.
Подбор ключевых слов для MSN: http://advertising.msn.com/msnadcenter/learningcenter/tools.asp
Подбор ключевых слов для Google: https://adwords.google.com/select/KeywordSandbox
(они его очень глубоко спрятали %))
А конечную цель можно описать? Смемминг делает довольно много ошибок. Когда я не знал такого слова, сам написал примитивный механизм. Работал, но не очень качественно. Может, морфологический словарь будет лучше? Здесь можно посмотреть: http://aot.ru
а также заготовки для микроволновки в обойме есть %) Со всем уважением к присутствующим, тема остается неизменной. Спасибо.
Ситуацию да, представляю. Но это как с телевидением - людей много, а каналов всего десяток. Поэтому ищу людей, которые знают лингвистические, статистические методы, напишут краулер и индекс. Все это уже есть, но нужна новая версия, исходя из возросших требований.