Chuck

Рейтинг
1
Регистрация
30.01.2005
Должность
программист, веб-мастер
Интересы
программирование, администрирование
родился в Ташкенте

Пробую написать самый простой! Не думаю, что стоит заморачиваться сначала!

lagif, для начала я хочу написать простого паука!

Не так. Краулер занимается и закачиванием документов, и извлечением из них ссылок. Индексатор создает поисковые индексы, по которым идет сам поиск.

А почему бы не объеденить это в одну программу!

Пусть скачивает страничку, ищет ссылки и ключевые слова! Мне кажется, тут нет минусов! а +: меньше траффика!

Вы паука хотите написать или что-то другое? Или какое отношение к нему имеет "слово" или "фраза" ?

Индексатора и краулера в одной программе!

Дело в том, что в Ташкенте траффик дорогой и место на серваках тоже!

Я так понял, что краулер качает страничку, обрабатывает ссылки, а индексатор, закачивает её опять (с мира или локального ресурса) и индексирует! Я же хочу одновременно и обрабатывать ссылки и индексировать за один "шаг".

Паук просто читает страницы

Это как? Мне казалось, что краулер ищет ссылки, а паук (индексатор) обрабоатывает документ!

Пишу я на Си под линукс!

Сейчас основная проблема - разработка структры базы данных!

Есть, конечно же, более мелкие проблемы, но они со временем решатся!

Слонжовато писать на Сях, Си, как известно, не поддерживает строки и, следовательно, остожняет разработку! Подумывал писать на Python-е, но Питон плохо знаю и потом, он скриптовый!

Что посоветуете? Учить питон (забросить Си) или все же мучиться! Это чисто моя инициатива - создать паука для зоны Уз!