Спасибо за ответ.
Если всё так будет, как Вы рассказываете, многие посетители к вам вернутся (я то уж точно, поскольку я очень не люблю менять свои привычки).
По поводу индекса цитирования - согласен, в Яндексе он реализован довольно криво - как результат на многие запросы в первую десятку попадают страницы со SpyLog'а, ведь ссылка ссылке рознь. А взята идея из научного мира. Не знаю как сейчас, а ещё лет десять назад ученые мужи занимались поиском ссылок на свои статьи (задача упрощается тем, что в конце статьи в обязательном порядке идёт список использованной литературы). Чем больше ссылок - тем больше платили за статью. Понятное дело, что упоминания в какой-нибудь "бульварной" газете в расчет не принимались. Если Вы собираетесь определять темы документов, то ссылки со страниц той же направленности должны как-то сказываться на результате поиска. Очевидно, что счётчики тут не причём.
Кстати о счётчиках. Бытует в народе байка о раскрутке пустой страницы. Человек в начале нового дня привёл на свою страницу около 50-ти человек, что позволило ему продержаться в первой странице топа в течение нескольких дней. Получил бешенный приток посетителей. По Вашей идеалогии он ещё и в результатах поиска должен был приподняться.
И ещё технический вопрос о счётчике, коль скоро мы его здесь упомянули. Существуют анонимные прокси, которые не передают HTTP_VIA. Т.е. скрипт его не распознает как прокси. Единственный способ с ними бороться (как я понимаю)- это составлять "чёрный список". На сегодняшний день очевидно с этой проблеммой Ваш счётчик никак не борется, иначе как объяснить присутсвие "пустых" страниц в первой 50-ке топа?
Спасибо,
Артём.
Классная статья.
Вот маленькая цитата
Обычно полноценный словарь для русского языка должен включать не менее 100-120 тысяч основ слов, а таблицы окончаний – не менее нескольких сотен наборов эквивалентных окончаний.
Такой словарь мне в одно жало не составить.
Кстати, пользуясь случаем хочу спросить у автора, какая "первая" форма глагола "трусь"?
З.Ы: наверно идеальная поисковая система должна ещё и слэнг всяческий учитывать.
Неужели можно надеяться, что Рамблер осилит большую часть написанного?
Добавил обработку тэгов и поддержку кодировок KOI и DOS
Шутки - шутками, а бета-версию можете забрать со страницы, указанной в профайле. Раздел проекты. Условия для выхода последующих версий - там же.
CU,
AiK
Хоть бы объяснился.
[This message has been edited by Gray (edited 21-11-2000).]
Не сложный. Только искать в лом. Ты же сам представляешь, как поисковики спамят
Но если ты найдёшь человек десять желающих (чтобы потешить моё самолюбие ) то я берусь написать такую программу.
Вот об этом и надо было спрашивать у саппорта
Гы-гы. Они должны отличаться от спама.
spam - мясные консервы, колбасный фарш. Нынче имя нарицательное и не переводится
Лучше бы ты не писал на сером фоне. Читать сложно.