wdsg

wdsg
Рейтинг
31
Регистрация
09.02.2009

Заказал 10 статей по строительству. Сегодня получил работу. Как минимум, 2 статьи на 100% неуникальны. После предоставления ссылок на аналоги, ТС заменил неуникальные статьи на уникальные (на момент проверки).

Всплывают периодически. Да и на этом форуме темы регулярно появляются. Точное местонахождение парсера мне, к сожалению, не известно.

seosniks:
этого достаточно чтоб получить куки курлом?
curl_setopt ($ch, CURLOPT_COOKIEJAR, 'cookies.txt'); // вроде куда сохранять
curl_setopt ($ch, CURLOPT_COOKIEFILE, 'cookies.txt'); // вроде откуда брать

Да, вполне. Для надёжности, проверьте, что сливается в cookies.txt

bearman:
$curl = new Curl();
$curl->init("http://google.com")->serverfriendly()->exec();
$c = $curl->init("http://google.com/search?hl=ru&q=link:searchengines.ru")->serverfriendly()->exec();

Ну а это вообще самый доставляющий вариант. ООП - наше всё :)

P.S. Так отдал кому гуголь выдачу или нет?

Попробуйте вот этот сервис: http://rp5.ru/export.php

Gevak, какой источник Вас интересует?

jumash:
Гугл крайне параноидален, ага) Лучше капча чем такое)

Да, гугл есть гугл )

Можно попробовать, перед этим запросом, сходить на главную и получить куки, которые google будет пихать, а потом с ними делать запрос... Но времени уже, к сожалению, нет.

Сейчас попробовал вот такой запрос CURL'ом:


$URL = 'http://www.google.com/search?hl=ru&q=link:searchengines.ru';
$Ch = curl_init($URL);
curl_setopt($Ch, CURLOPT_HEADER, false);
curl_setopt($Ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($Ch, CURLOPT_FOLLOWLOCATION, true);
curl_setopt($Ch, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($Ch, CURLOPT_SSL_VERIFYHOST, false);
curl_setopt($Ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.7) Gecko/20070914 Firefox/2.0.0.7');
curl_setopt($Ch, CURLOPT_REFERER, 'http://www.google.com');
$HTML = curl_exec($Ch);
echo $HTML;

На данный момент, гарантированно нарывается на 403 "We're sorry but your query looks similar to automated requests from a computer virus or spyware application". Раньше такого небыло... Я негодую :) Руками выбрасывает капчу.

Зачем платить деньги за то, что можно сделать самому в течении 10 минут: http://v2.easy-designs.net/articles/replaceSelect/

Тут я Вам, к сожалению, не советчик. Видимо, проблема в настройках CMS.

CunninGFox:
wdsg, да в том и дело, что такая ссылка всего одна - на главную страницу.

Если такая ссылка одна на весь HTML-код, то наиболее простой вариант - исправить её руками.

Всего: 392