T.R.O.N

T.R.O.N
Рейтинг
314
Регистрация
18.05.2004

Bdiang, Вы правы, я объяснил почему возникает ошибка. Теоритически, возможно и на сайтах использовать BMP рисунки, но всетаки этого не делают.

Утка-робот:
Полупрозрачные точки заменяются в данном случае черными, в моем - белыми, что тоже уродует изображение.

Если Вас не затруднит, покажите место, где в формате ICO файла есть упоминания на полупрозрачность (как я понимаю alfa-канал)? Она, если мне не изменяет память, возможно только в полноцветных PNG и то, если парсилка поддерживает полный формат, а такое встречается не часто.

Яшин бот, как уже не однократно убеждался, работает на Перле(слава богу), а значит использует стандартные модули обработки графики. Ну нету в стандартной библиотеки поддержки PNG 24bit.

dmbav:
Вопрос, куда пропали 2ое (kond.ru) и 8ое (tehnoklimat.ru) места?

Самое простое, что напрашивается, т.к. запрос ВЧ, то используется кеш, а когда вы указали rhost, серп был постоен с нуля, и построен именно вашим фронт-сервером. Мелкие расхождения всегда будут. Ведь при построении серпа используются те части индексной базы, которые сейчас доступны, активны и не перегружены.

cycero:
Другим сайтам Яндекс всегда говорит - вот в этом причина отказа, спам, недоработка сайта, находится в стадии наполнения и все такое.

Возможно, просто перепивший и не проспавшийся модер. Пишите еще.

А на счет причнин отказа - не всегда они это коментируют

T.R.O.N добавил 15.10.2008 в 12:42

cycero:
сделан профессиональными разработчиками

Вы исходник посмотрите. Конечно, в каталоге присуствуют и похуже, но всетаки.

Slc:
а Яндексу то что делать с капчей?

Ничего, верне, еще сильнее ужесточить политику против любителей попарсить выдачу.

Slc:
юзера, живого, любознательного юзера, задающего свои вопросы Яндексу через браузер, называют бездушным роботом

Вот именно. Перед тем как сесть за руль мотоцикла или машины, любой вменяемы, сначала учится. Тот, кто хочет пожить подольше, учится несколько месяцев и с хорошим инструктором. Компьютеы и сети - штука куда более сложная и серьезнаю, но сюда все идут, не потрудившись освоить даже теорию. Конечно, микрософт создал систему "для кухарок", но в ней можно работать и с большим количеством знаний.

Теперь к вопросу. Если юзера называют "ботом", значит произошло одно из следующего:

1. Юзер не вменяем, и умудряется обращаться к яше с частостой более 1 запроса в 5 секнд (приблизительные данные).

2. Криворукий админ настроил офисную или домовую сетку так, что все юзеры видятся как "одно целое", в итоге - читаем пункт 1. Очень часто, именно в таких сетках еще сидят те, кто юзают семонитор или подобный мусор.

3. На комп наставлено куча ...мна, типа дополнительных панелек, снифером, учетчиков трафика, анализатора посещений и пр. В итоге, каждое обращение к яше, расценивается им как "многократное".

4. Подключая инет дома, юзер не потрудился узнать - как именно и откуда этот инет приходит. Очень часто, "доморощенные" провайдеры используют каскадные сокс сервера, что приводит к блокировке адресов провайдера вместе со всеми юзерами.

Итог, чтобы избезать проблем, нужно чуть больше читать о том, во что вступаете.

Цахес:
Да, вполне достаточно.

нет, не достаточно. Очень быстро придет блок по IP. боты, сканирующие серп и не принимают куки, а капча, защита именно от них (как и блокировка доступа через анонимные прокси)

T.R.O.N добавил 15.10.2008 в 09:10

Slc:
А с чего вообще, при работе в браузере должна вываливаться капча? .. По идее это косяк Яндекса, если так происходит, т.к. если вы работаете в браузере, то очевидно что вы не робот.

не говорите глупости. "Тип Броизера" для любого HTTP сервера, это то, что написано в запросе в строчке USER-AGENT. Только "белые" боты подписываются собой. Все остальные, использщуют подпись обычных броузеров.

SearchMaster:
Но все же собирать из кусков долго получится...

А откуда такое желание все что нужно, на халяву и еще без затрат сил и времени????

SearchMaster, <<host=site1,site2,site3

SearchMaster, Простым путем не решить. Слишком большое количество. Можно пробовать разбить сайта на группы, делать XML запросы а потом "сливать" результаты самостоятельно

Всего: 4849