Гуглите проксирование. IP дора - в бан. Также по логам можно посмотреть подозрительных ботов, и их IP тоже в бан добавить.
Вот еще нагуглил http://pytalk.ru/forum/django/43649/ Чувак там предлагает отдавать им роботс с Disallow: /. Но это защита от лоха скорее и сработает, если robots.txt с вашего сайта тоже проксируется.
Одну из версий только 2 недели назад обновил. Думаю, это доказывает актуальность программы.
На счет отзывов, ну сколько есть. Я никого писать не заставляю. Важнее то, что среди них нет ни одного отрицательного.
Если есть какие-то сомнения, можете взять на тест, если поймете, что не ваше, сделаю манибек.
В новом сеодоре картиночные парсеры есть и уникализация (базовая).
Шаблон по методике добычи контента под иностранные языки обновлен!
Добавлено распознавание обычной цифровой капчи в выдаче гугла (стала периодически появляться вместо рекапчи).
Так это не коммерческий ключ, со "своими руками". ДДЛ-подобное как бы не за что фильтровать
Есть. Но 99% просто не смогут понять, что это доры.
Вот такие как раз делал ) Только от доров там только автоматизация создания.
Ну а по вопросу:
1. все делают доры под партнерки и стараются избегать коммерции, где сложно добыть много трафа и тем более выгодно его слить.
2. сейчас действительно яндекс практически победил доры - мрут еще на старте (очень быстро).
Посоветуйте связку партнерок с виджетами консультантов под юридический траф. Помониторил топики партнерок, многие разные ГЕО на разные ПП отправляют. Хотелось бы узнать какие наибольший профит дают и на каких ГЕО.
Попробовал. Все равно качает с левых доменов.
wget -r --user-agent="Mozilla/4.0 (compatible; MSIE 5.0; Windows NT 5.0)" -l0 -E -p -e robots=off -c http://site.ru
Не нашел в вашем примере команды, которая задает скачивание только с начального домена.
Чего?
Вопрос именно как скачать с заданного домена был.