lagif

lagif
Рейтинг
30
Регистрация
15.12.2004
Должность
Программер
Интересы
Идеи
Которая

Vyacheslav Tikhonov, Нет!

Vyacheslav Tikhonov, Он работает пока для нашей конторы. Индексирует юа-нет:) Примерно через месяц(если скрестить пальцы :) ) будем анонсировать бета-версию... ух, и икнется ж мне... :). Берет большой страх.

W.Ed., да.

W.Ed., лично меня это не привлекает. сорри всем за флуд

W.Ed., напишите обычный мониторинг на тех же сях, который использует пайпы - и будет вам радость...

все это, опять же, сущее ИМХО!

alyak, я сторонница написания паука на сях - без перла, апача, браузеров и php. При этом можно использовать хоть pthread'ы, хоть обычное форканье, хоть один процесс с множественными сокетами (едва слышала, не пробовала, говорить не буду). Все это уже выбор, разумеется, разработчика.

Поиск, индексация, интерфейсы поиска - уже вопрос третий...

W.Ed., если опций там столько же, сколько в сях, вопрос снят. :) Тем не менее, на мой взгляд, писать на php - все равно что забивать гвозди микроскопом.

и, кстати, зачем спайдеру браузер? ошибки в лог записываются - и ресурсов это жрет ну совсем немного, если учесть, что используется при этом перенаправление стандартных потоков...

но это уже тонкости, которые относятся к "многое-многое другое". Продолжать спор не вижу смысла :)

W.Ed., Начнем с того, что я не нашла в PHP процедур типа setsockopt, и это меня расстроило. Во-вторых, ресурсов php жрет куда больше сишных бинарников... взять хотя бы тот факт, на чем php написан.

В-третьих, разумеется, я подсознательно защищаю свой метод :)

alyak, и правда, зачем апач? Чем не нравится голый HTTP-запрос? А кодировки - почти все можно iconv и прочими enca'ми определить и перекодировать... то, что там пишут в мета-заголовках пользователи, для спайдера, на мой взгляд, неактуально.

Interitus, А свой парсер писать надо :) Все тестенные мной парсеры все равно не все отлавливают...

Interitus, Не на виртуале, разумеется... :)

W.Ed., Мой такую цифру съедает лениво за 1,5 суток (я угадаю эту мелодию с 2-х нот :) ).

Лениво - это если проставить глубину чтения где-то 3-го уровня, пустить 3 потока и зашейпить канал до 32К (иначе я всю локалку повешу).

Притом, что в сях гораздо проще настроить сокеты как хочется :) и многое-многое другое... :)

50K?!! Вы, верно, шутите... Может, вы имели в виду 50М?

Всего: 745