Bdiang, Вы правы, я объяснил почему возникает ошибка. Теоритически, возможно и на сайтах использовать BMP рисунки, но всетаки этого не делают.
Если Вас не затруднит, покажите место, где в формате ICO файла есть упоминания на полупрозрачность (как я понимаю alfa-канал)? Она, если мне не изменяет память, возможно только в полноцветных PNG и то, если парсилка поддерживает полный формат, а такое встречается не часто.
Яшин бот, как уже не однократно убеждался, работает на Перле(слава богу), а значит использует стандартные модули обработки графики. Ну нету в стандартной библиотеки поддержки PNG 24bit.
Самое простое, что напрашивается, т.к. запрос ВЧ, то используется кеш, а когда вы указали rhost, серп был постоен с нуля, и построен именно вашим фронт-сервером. Мелкие расхождения всегда будут. Ведь при построении серпа используются те части индексной базы, которые сейчас доступны, активны и не перегружены.
Возможно, просто перепивший и не проспавшийся модер. Пишите еще.
А на счет причнин отказа - не всегда они это коментируют
T.R.O.N добавил 15.10.2008 в 12:42
Вы исходник посмотрите. Конечно, в каталоге присуствуют и похуже, но всетаки.
Ничего, верне, еще сильнее ужесточить политику против любителей попарсить выдачу.
Вот именно. Перед тем как сесть за руль мотоцикла или машины, любой вменяемы, сначала учится. Тот, кто хочет пожить подольше, учится несколько месяцев и с хорошим инструктором. Компьютеы и сети - штука куда более сложная и серьезнаю, но сюда все идут, не потрудившись освоить даже теорию. Конечно, микрософт создал систему "для кухарок", но в ней можно работать и с большим количеством знаний.
Теперь к вопросу. Если юзера называют "ботом", значит произошло одно из следующего:
1. Юзер не вменяем, и умудряется обращаться к яше с частостой более 1 запроса в 5 секнд (приблизительные данные).
2. Криворукий админ настроил офисную или домовую сетку так, что все юзеры видятся как "одно целое", в итоге - читаем пункт 1. Очень часто, именно в таких сетках еще сидят те, кто юзают семонитор или подобный мусор.
3. На комп наставлено куча ...мна, типа дополнительных панелек, снифером, учетчиков трафика, анализатора посещений и пр. В итоге, каждое обращение к яше, расценивается им как "многократное".
4. Подключая инет дома, юзер не потрудился узнать - как именно и откуда этот инет приходит. Очень часто, "доморощенные" провайдеры используют каскадные сокс сервера, что приводит к блокировке адресов провайдера вместе со всеми юзерами.
Итог, чтобы избезать проблем, нужно чуть больше читать о том, во что вступаете.
нет, не достаточно. Очень быстро придет блок по IP. боты, сканирующие серп и не принимают куки, а капча, защита именно от них (как и блокировка доступа через анонимные прокси)
T.R.O.N добавил 15.10.2008 в 09:10
не говорите глупости. "Тип Броизера" для любого HTTP сервера, это то, что написано в запросе в строчке USER-AGENT. Только "белые" боты подписываются собой. Все остальные, использщуют подпись обычных броузеров.
А откуда такое желание все что нужно, на халяву и еще без затрат сил и времени????
SearchMaster, <<host=site1,site2,site3
SearchMaster, Простым путем не решить. Слишком большое количество. Можно пробовать разбить сайта на группы, делать XML запросы а потом "сливать" результаты самостоятельно