- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Как удалить плохие SEO-ссылки и очистить ссылочную массу сайта
Применяем отклонение ссылок
Сервис Rookee
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Нужно отпарсить сай, но не просто текст а вместе с картинками.
Парсер написал, он работал пока не заблокировали IP :mad: . Как это можно обойти? Прокси не предлагать(больше чем на 1000 страниц его не хватает).
гггггг
Ну всё писец)))) Скажите владельцу, мол разблокируйте, я тут попарсю....
Скажите владельцу, мол разблокируйте, я тут попарсю....
Если не поможет, то http://browsershots.org/ и через FineReader :D
С технической точки зрения:
Динамика прокси + рандомайзер таймаутов
С моральной точки зрения:
Свяжитесь с владельцем сайта и попробуйте купить у него контент, ибо воровать нехорошо.
А еще лучше - займитесь чем нибудь полезным для людей
Нужно отпарсить сай, но не просто текст а вместе с картинками.
Парсер написал, он работал пока не заблокировали IP 😡 . Как это можно обойти? Прокси не предлагать(больше чем на 1000 страниц его не хватает).
И это наверное кто-то из тех людей которые со своего основного аккаунта на весь форум кричат, что воровать контент плохо)))
А еще лучше - займитесь чем нибудь полезным для людей
и это верно, поддерживаю именно этот совет 🚬
А кто говорит, что парсить контент - плохо? Здесь технические вопросы обсуждаются, а не юридические и моральные.
ТС: попробуйте прикинуться ботом яндекса(другой ПС) - он-то должен кушать рес как-то. Если не поможет - сделайте поддержку кукисов (если не по js режется - поможет).
Вариантов бана - куча. Но прокси лучше, имхо. Особенно - искажающие.
Если реально нужно - обращайтесь.
Самое печальное во всём этом - это то что ТС абсолютно искренне полагал, что то что он делает вполне нормально и скорее всего очень удивился, что мы всем форумом не бросились помогать ему, бедненькому😂
А кто говорит, что парсить контент - плохо? Здесь технические вопросы обсуждаются, а не юридические и моральные.
ТС: попробуйте прикинуться ботом яндекса(другой ПС) - он-то должен кушать рес как-то. Если не поможет - сделайте поддержку кукисов (если не по js режется - поможет).
Вариантов бана - куча. Но прокси лучше, имхо. Особенно - искажающие.
Если реально нужно - обращайтесь. За умеренную плату сделаем ;)
Если IP забанили, хоть кем прикидывайся, не поможет.
Единственный выход менять IP, либо использовать прокси.
К счастью, смена ip беcполезна, ибо автору ресурса достаточно прописать еще одну строку в .htaccess, а прокси живут мало.
К стати, автор того ресурса немного не правильно поступил. Я бы для данного IP делал редирект на страницу со множеством внешних ссылок 😂, первый ап и сайт в бане.
IP делал редирект на страницу со множеством внешних ссылок
Я думаю как вариант можно в контент добавлять ссылки на себя (это если знать, что ТС не вырезает ссылки). :)
Во-первых, ссылки убиваются одним preg_replace.
Во-вторых, бан по IP, скорее всего, не через .htaccess дается. Ибо у меня сейчас в чеке 290-350 анонимных живых проксей в любой момент времени (в т.ч. и искажающих). Есть желание прописать все в .htaccess? 😂