Проект: кооперативный спайдер.

!Иван FXS
На сайте с 16.11.2001
Offline
119
1057

Что делают интернет-спайдеры? Обходят по очереди (по ссылкам, например) страницы интернта, скачивают их и производят КАКУЮ-ТО их индексацию.

Какую именно индексацию - это определяется владельцем (заказчиком работы) спайдера.

При этом спайдеры разных владельцев (в основном это - SE, Search Engines) работают независимо, то есть - в аспекте скачивания контента страниц - они друг друга дублируют.

Понят, что работа по скачиванию сколько-нибудь заметной доли WWW - достаточно дорогостоящая, и она не по силам рядовому ... скажем так, - исследователю интернета.

Отсюда идея: почему бы не создать "кооперативный спайдер", то есть такой, который будет, скачивая страницы, индексировать их ПО ВСЕМ РАЗЛИЧНЫМ алгоритмам, предоставленным участниками проекта, и раздавать каждому участнику его (заказанные им) результаты индексации?

Может быть где-то такие кооперативные спайдеры уже существуют или разрабатываются?

Z
На сайте с 03.01.2004
Offline
32
#1

Нечто подобное: http://www.grub.org/

!Иван FXS
На сайте с 16.11.2001
Offline
119
#2

хммм ... а почему мне показалось, что у них там все наоборот: процесс Grub-линга - распределенный, а статистика - централизована (единообразна)?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий