Ёхан Палыч

Ёхан Палыч
Рейтинг
169
Регистрация
07.05.2006
Docikstorm:
у нас еще остались места где нет компьютеров по ряду причин

Сори за офтоп, но что за места и что за причины?

Einstein02:
Теперь когда ввожу большое количество сайтов - многие отображаются как N/A. В чём проблема?

Смотрите что находится в $content

Einstein02:
Каким образом? Сорри в php не силён...

Ну тогда и не надо)

Я не использовал ваш download.php для простоты, верните в исходную:

<?php
print_r(get_yandex("forum.searchengines.ru"));

function get_yandex($url){
$ret = array();
include('download.php');
if( substr($url,0,7) != 'http://' )
$url = 'http://' . $url;
if( $content = get_download('http://bar-navig.yandex.ru/u?ver=2&show=32&url='.$url) ){

if( class_exists('SimpleXMLElement') ){
if( $xmldoc = new SimpleXMLElement($content) ){
$tcy = $xmldoc->tcy;
if( !empty($tcy) ){
$ret["tic"] = $tcy['value'];
}
$yaca = $xmldoc->yaca;
if( !empty($yaca) ){
$ret["url"] = $yaca['url'];
}
}
}
else{
preg_match("/value=\"(.\d*)\"/",$content,$tic);
if( !empty($tic[1]) ) $ret["tic"] = $tic[1];
preg_match("/yaca url=\"(.*)\"/",$content,$tic);
if( !empty($tic[1]) ) $ret["url"] = $tic[1];
}
}
return $ret;
}
?>

В curl желательно добавить список прокси и юзерагентов.

P.S. Для справки, может пригодится - поиск по зеркалам tcy.in выдает список зеркал в перевариваемом виде http://tcy.in/out/adresa.ru/

Einstein02:
Верно. Всё исправил! Спасибо! Но увы теперь такая проблема: парситься может только около 50 сайтов, при вводе большого количества - проверка не выполняется...

Это не ко мне, а к Яндексу. Хотя, я в сутки 3-4млн запросов делаю и ничего.

Может ограничения при file_get_contents, у вас в download.php надеюсь curl?

Einstein02:
а чтобы выводилось:

Парсер bar-navig? Нужно основное зеркало?

<?php

print_r(get_yandex("forum.searchengines.ru"));
function get_yandex($url){
$ret = array();
//include('download.php');
if( substr($url,0,7) != 'http://' )
$url = 'http://' . $url;
if( $content = file_get_contents('http://bar-navig.yandex.ru/u?ver=2&show=32&url='.$url) ){

if( class_exists('SimpleXMLElement') ){
if( $xmldoc = new SimpleXMLElement($content) ){
$tcy = $xmldoc->tcy;
if( !empty($tcy) ){
$ret["tic"] = $tcy['value'];
}
$yaca = $xmldoc->yaca;
if( !empty($yaca) ){
$ret["url"] = $yaca['url'];
}
}
}
else{
preg_match("/value=\"(.\d*)\"/",$content,$tic);
if( !empty($tic[1]) ) $ret["tic"] = $tic[1];
preg_match("/yaca url=\"(.*)\"/",$content,$tic);
if( !empty($tic[1]) ) $ret["url"] = $tic[1];
}
}
return $ret;
}
?>
assas:
Понял, спасибо. А яже подумал, что меня мусором обсыпать хотят

Из приведенного куска кода не совсем понятно хотят они обсыпать или нет. Подлинные намерения можно узнать из полного содержимого страницы.

assas:
Эта ссылка является частью кода страницы чужого сайта. При чем здесь заход куда-то?

Это долго объяснять, в кратце: чужие сайты могут менять часть своего кода и даже вставлять в него различные переменные для того чтобы считать своих посетителей. Более того, некоторые сайты умеют рисовать картинки с изображением адреса вашего сайта или вашего ip.

assas:
Что может значить следующий код на сайте секс-шопа

Это может значить, что вы зашли на этот сайт из статистики лиру и вас подсчитали.

pchol123, у меня есть такой скрипт, все за меня делает, даже деньги снимает и в кабаке пропивает.)

1. Сбор какой информации? Любой? С lib.ru подойдет?

2. На какой сайт? WP, DLE, суперCMS на файлах?

Всего: 1593