New_Angel, а тема не связана с прошлогодней публикацией про дедов морозов? http://www.webplanet.ru/news/advert/2004/12/15/context_word.html
То что это работает я не спорю, но только что-то России там нет :(. А посадить 10 работников за привязку географических точек к координатной сетке (читай почти составление GPRS карт) денег в России нет, поэтому нужно искать готовые наиболее простые варианты.
Думаю готового ничего нет, но писать можно (Win32 или php) - 1 день работы по Яндексу и Рамблеру на входе ключевик на выходе данные в XML (для последующей загрузки в Excel) за дозволенный промежуток (Rambler - 4месяца, Яндекс - 1 год) стоимость 100 WMZ, если надо жду на мыло admin[.....]medaest.ru
:) а если ещё сидж прикрутить, что-нибудь жалобное, думаю душа у многих растает. Попробывать стоит только думается мне что абонплата будет высока.
С авторубрикацией сложнее, тем более по научным статьям, думаю что таких программ нет, максимум что можно получить так это вывод что данная статья - научная и по физике. :( Может быть Вас спасёт система автореферирования - TextAnalyst.
Архивариус 3000 спасёт 100% и стоимость студенческой лицензии смешная что-то около 300 рублей. Куча входных форматов, кодировок и поддержка морфологии :)
Я и не пытаюсь :) а наоборот говорю что это не показатель. А про километры! это ...личное, просто это чем-то напомнило моего начальника, который очень любит использовать рефактори и чужой код, несмотря на методы и затраты.
Ну тогда точно русских высокочастотников нет :)
Vyacheslav Tikhonov, http://www.google.ru/search?sourceid=navclient&hl=ru&ie=UTF-8&oe=UTF-8&q=%D0%9A%D0%9B%D0%90%D0%94%D0%A0
А насчет некомпетентности, я не называю процедуру поиска по "рабочему словарю признаков классов объектов" кластеризацией и по моему у Вас используется АВО (алгоритм вычисления оценок) а не кластеризация.
lagif, виноват исправлюсь.
По поводу локализации IP, много готовых и авторских решений. Можно потестить моё http://www.medaest.ru погода в правой колонке, заодно и проверю как работает :)
По поводу вопроса а при чем тут КЛАДР поясню, релевантнее запросу будут те страницы, которые "привязаны" к одному почтовому индексу с указанным пользователем (или определенным SE).
Господа, не смог заставить прочитать себя весь этот бред, причём здесь километры?
Скажу одно, всё это просто.... для России алгоритм такой:
город[] = Телефон?локализация по коду -> локализация по КЛАДР:
(Индекс? -> локализация по КЛАДР: (Текст?леммирование ->локализация по КЛАДР));
город[] найдены по улице?дальнейшая обработка....
Если же вы хотите локализовать пользователя :(, до ничего кроме whois у вас нет и быть неможет изначально. Ну может еще трассировка помочь, но это на самом деле не однозначно.