-На странице http://top100.rambler.ru/top100/top_add.shtml.ru написано так-
В статистику заглавной страницы Ресурса также не засчитываются посещения через публичные proxy-серверы. Публичным proxy-сервером считается такой, которым могут пользоваться любые пользователи Интернета без авторизации.
-так о каких накрутках идет речь? Это что же, не работает? Рамблеру было пора накопить хороший список прокси за все время.
-я просто не очень понял эту фразу...
Могу дать на perl: паука + составитель индекса + поисковый скрипт. Но разбираться в деталях придется самому :)
- а вот это уже самому придется. А зачем, если не секрет?
- ну да, может. Кроме стоп-слов, наверное. Из полнотекстового индекса.
Под пауком я имею в виду программу, которая ходит по ссылкам и собирает контент.
-Для чего? Для спама в форумы? Или для индексации форумов?
-индекс в смысле базы данных и индекс в смысле поиска - разные вещи. Первое - инструмент для быстрого поиска по таблицам. Второе - сама организация этой таблицы, т.е., база по контенту сайтов.
-О какой однозначости идет речь? Типа слово "хреновый" встречается в моем документе и только в нем?
-Я, например, пока не слыхал термина "индексатор контента". Предполагаю, что имеется в виду паук. По существу, а зачем он тебе нужен?
-мне тоже интересно, и еще зачем он нужен.
Мне кажется, сайт получает свои хосты за счет библиотеки /library/, там есть довольно общие и, вероятно, популярные слова (ASP, что вы знаете о сексе и т.д.). Это, вероятно, реальные, но случайные посетители.
Я могу помочь Interitus по "любым вопросам для новичков" и взять "Link Popularity", "Doorways, Hallways.."
-Да, конечно, делаю. Под свой собственный Msie, и реферрер посылаю.
-это только на первых порах все так радужно будет... Ведь тот же PageRank задумывался как способ учета "голосования" "авторитетов". В нейроне ручное "голосование". Но такой способ не даст пробиться наверх новичкам, и начнется заспамливание, теперь уже "экспертами". Кто наймет больше экспертов, тот и на коне.
Так что это не панацея. Хотя, конечно, идея самостоятельную ценность имеет. Но мне кажется, она только вместе, но не вместо поисковиков будет работать...
Если поторопиться в разработке устава и др. "организационных" вещей, можно успеть к конференции в ноябре. Это плюс+ :)
Давайте обсудим необходимый минимум. Устав, цели, сайт. Или просто выберем группу, которая вне рамок форума друг с другом разработает все это.
Я делаю 3-8 секунд, случайным образом :) Может, это и с запасом, но меня уже один раз в баннили - больше не хочу...