Только вот и индекс у них другого размера наверное :)
А по поводу проксей, не согласен. Вот к примеру сервис с нормальными проксями, сам его юзаю http://proxy-list.org/
Конкретизируй запрос. На пример site:com site:org inurl:bla-bla allinurl: в общем используй доп. запросы, их ОЧЕНЬ МНОГО можно придумать. И с каждого вытащишь по 1000 урлов. Главное потом на дублирование проверяй.
Ещё раз напоминаю. JS может защитить от поисковых краулеров, которые жабаскрипт не выполняют (и то не все, кстати). А эти боты на 99% сгенерены трояном, и запрос они делают обычным браузером, который этот скрипт выполнит, и перейдет на следующую страничку. Вот кстати интересную статейку сегодня выложили на умакс-форуме... http://www.affftar.com/?p=8
У меня ваще доры не в яндексе живут, а в гугле....
ЦН действительно в яндексе не нашел. Но речь по моему шла о фильтре.... А его, как видно из моего поста, нету.
вот цн не под фильтром а вот spb.ru а вот в яндексе спб
Учите матчасть
Честно говоря не оч. понятно к чему это...
ИМХО белая горячка.... Вы представляете какие аппаратные ресусы нужны для такого анализа графики? А в масштабах индекса гугла?
Альты - может быть, а уникальность картинки - бред по моему...
Это какие домены под фильтром?
Речь не о поисковых ботах идет, а о накрутке трафика. Т.е. о иммитации нормального серфера. А это никаким JS не отследишь...