Ёхан Палыч

Ёхан Палыч
Рейтинг
169
Регистрация
07.05.2006
skAmZ:
Ваш т.е.)) Кто-то из нас 2-х тупит

Да? Мне показалось, что в первом посте было написано, мол, нефиг фантазировать - дело в safe_mode. Оказывается это был пост "согласен с предыдущим оратором". Ну да ладно :)

skAmZ, это, конечно, да, самое простое в httpd закомментировать php_admin_value open_basedir ну и safe_mode выключить. Но бывают ситуации, что надо фантазировать.

Вообще то проблема распространенная, решения все обсосаны.

Например, вариант собственного обхода редиректов:

<?php

$url="http://www.yandx.ru/";
//$url="http://www.yndex.ru/";

$uagent = "Mozilla/5.0 (Windows; U; Windows NT 5.1; ru; rv:1.9.0.8) Gecko/2009032609 Firefox/3.0.8";
$ch = curl_init( $url );
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); // возвращает веб-страницу
curl_setopt($ch, CURLOPT_HEADER, 1); // возвращает заголовки!!!
// @curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); // переходит по редиректам
curl_setopt($ch, CURLOPT_ENCODING, ""); // обрабатывает все кодировки
curl_setopt($ch, CURLOPT_USERAGENT, $uagent); // useragent
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 120); // таймаут соединения
curl_setopt($ch, CURLOPT_TIMEOUT, 120); // таймаут ответа
curl_setopt($ch, CURLOPT_MAXREDIRS, 10); // останавливаться после 10-ого редиректа

$content = curl_redirect( $ch );

echo $content;


function curl_redirect( $ch )
{
$loops = 0;
$max_loops = 10;

if ($loops++ >= $max_loops)
{
$loops = 0;
return FALSE;
}
$data = curl_exec($ch);
$temp = $data;
list($header, $data) = explode("\n\n", $data, 2);
$http = curl_getinfo($ch, CURLINFO_HTTP_CODE);
if ($http == 301 || $http == 302) {
$matches = array();
preg_match('/ocation:(.*?)\n/', $header, $matches);
$url = @parse_url(trim(array_pop($matches)));
// print_r($url);
if (!$url)
{
$loops = 0;
return $data;
}
$last_url = parse_url(curl_getinfo($ch, CURLINFO_EFFECTIVE_URL));
if (!$url['scheme'])
$url['scheme'] = $last_url['scheme'];
if (!$url['host'])
$url['host'] = $last_url['host'];
if (!$url['path'])
$url['path'] = $last_url['path'];

$new_url = $url['scheme'] . '://' . $url['host'] . $url['path'] . ($url['query']?'?'.$url['query']:'');
//echo "\n redirect to ".$new_url;
curl_setopt($ch, CURLOPT_URL, $new_url);
return curl_redirect($ch);
} else {
$loops=0;
return $temp;
}
}
?>
Shonni:
Сайт полностью на html, фреймов нет.

На другом сайте могут быть, а ваш во фрейме показывается.

Леська:
Freezzzbe, вы бы доменчик то не светили, абузщиков ведь много...

А он на это и рассчитывает, конкурента валит, видимо.

Shonni:
Это парсинг?

Ни парсинг, ни сапа статистику li не накручивают. Причин аномальной посещаемости много - фреймы, алиасы, глюки и т.п.

bearman:
аааааа ггг!!! о чем вообще речь то?

Говорят, что какой-то дикий htaccess задрал какого-то бедолагу, насмерть. Собака с милицией обещала приехать.

RED FOX:
хм..., а что случится-то если сопрут. Нету разницы сопрут их с сайта который проиндексирован или еще нет

Как бы маленькая разница есть - если спереть до индексации, то можно автоматом стать первоисточником, а с проиндексированного тырить себе дороже.

mlsha:
сколько уже таких было топиков и всегда почему-то оказывалось, что то, что владелец сайта называет уникальным контентом, на деле оказывается хреновеньким рерайтом, а то и просто копипастом.

А сколько было топиков когда уникальный контент становился хреновеньким рерайтом именно после засвета урла?

Всего: 1593