помогите разобратся с библиотекой simple_html_dom

T
На сайте с 02.02.2015
Offline
35
733

В общем нужно спарсить каталог организаций, конечные страницы отдают инфу без проблем а вот ссылка такого вида (http://www.orgpage.ru/resp-bashkortostan/суды/) на которой собственно находятся ссылки по которым нужно пройтись парсеру возвращает ошибку

Warning: file_get_contents(http://www.orgpage.ru/resp-bashkortostan/суды/) [function.file-get-contents]: failed to open stream: HTTP request failed! HTTP/1.1 404 Not Found in D:\OpenServer\domains\test\simple_html_dom.php on line 39

код:

require_once 'simple_html_dom.php';

$data = file_get_html('http://www.orgpage.ru/resp-bashkortostan/суды/');
if($data->innertext!='' and count($data->find('a.name'))){
foreach($data->find('a.name') as $a){
echo $a->plaintext.'</br>';
}
}

пробовал так

//include 'simple_html_dom.php';


//define('INDEXURL', 'http://www.orgpage.ru/resp-bashkortostan/суды/');

//$ch = curl_init(INDEXURL);
//curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
//curl_setopt($ch, CURLOPT_HEADER, 0);
//curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
//curl_setopt($ch, CURLOPT_USERAGENT,'mozila');
//$result_data = curl_exec($ch);
//curl_close($ch);

//$html = new simple_html_dom;
//$html->load($result_data);

//$search = $html->find('.name', 0);
//echo $search->outertext;

получаю белый лист.

Помогите разобратся. Там не одна тысяча организаций ручками делать вообще не варик.

domen4you
На сайте с 08.03.2013
Offline
53
#1

проблема с наличием русских символов в урл, скорее всего

---------- Добавлено 19.02.2015 в 23:03 ----------

$url_eng = 'http://www.orgpage.ru/resp-bashkortostan/';

$url_rus = urlencode('суды/');

$url = $url_eng . $url_rus;

$get = file_get_contents ($url);

echo $get;

T
На сайте с 02.02.2015
Offline
35
#2
domen4you:
проблема с наличием русских символов в урл, скорее всего

---------- Добавлено 19.02.2015 в 23:03 ----------

$url_eng = 'http://www.orgpage.ru/resp-bashkortostan/';
$url_rus = urlencode('суды/');
$url = $url_eng . $url_rus;
$get = file_get_contents ($url);
echo $get;

Да спасибо действительно проблема была в этом. Все работает, еще раз благодарю.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий