LiM

Рейтинг
71
Регистрация
30.11.2001

Нет, это была просто одна из шуток.

Одна из... ;)

Не, маст дай тут не причем. Это именно нард-диск или другое железо виновато (например, контролер HDD).

Гхм... Незачем спорить - я сам это восстанавливал. :)

Дело было именно в том, что для МастДай 95 слишком мало оказалось свободного места на диске в 50 Мегов. В таком случае, как оказалось, он делает лапками вверх, попутно криво скидывая на диск таблицу FAT, что приводит к логической потере данных - информация на диске есть, но вернуть к жизни ее можно только ручками собирая паззл из многих тысяч кластеров...

Ладно, в офф-топик не уходим. :)

Alexx,

У Евгения другая работа - он отвечает за каталог, а не за баны в поисковике - знать надо тех, с кем работаете...

Это да... Рамблер отличается очень долгим "запряганием".

На одном сайте мы первой индексации ждали несколько месяцев. Теперь Рамблер кушает намного больше, чем Яндекс - больше Рамблера кушает сейчас только Google, но тот вообще зверь... :)

Хуже когда глючит МастДай - пару лет назад от винта 1.2 Гига, битком набитого ценной информацией, было оставлено 300 Мегов... Безвозвратно.

Я тебя очень, очень, очень понимаю.

Я знаю несколько подобных запросов. У меня есть предположения, как еще можно объяснить данные результаты, но наиболее логичным и простым кажется ссылочное ранжирование. Как будет время, я обязательно исследую этот вопрос, чтобы точно сказать, кто виноват.

Не обязательно. У Рамблера есть робот-пессимизатор (как они его называют), который "успокаивает" сайты чрезмерно ретивых оптимизаторов. Вполне возможно, что такая ситуация может быть и по результатам его работы.

Тут и вправду стоит отдельно исследовать - без этого ничего, кроме предположений, родить не получится.

Как писал Interitus
А скрипт для расшифровки UTF-8 был у одного из участников форума (LiM, если быть точным).

Пользуйте... (все на Perl) Функции независимы - каждая делает свое, но обе переваривают UTF-8.


sub urldecode{
my($text) = @_;

$text =~ s/\+/ /go;
$text =~ s/%([0-9a-fA-F]{2})/chr(hex($1))/goe;

$text =~ s/%u0401/Ё/go;
$text =~ s/%u0451/ё/go;
$text =~ s/%u04([0-9a-fA-F]{2})/$utf8_tr[hex($1) - 16]/goe;

return $text;
}



sub utf8decode{
my($text) = @_;

my(@chars) = split //, $text;
$text = '';
my($ch, $ich);
for(; $#chars >= 0;){
$ch = shift @chars;
$ich = ord $ch;
unless($ich & 0x80){
;
}elsif(($ich & 0xE0) == 0xC0){
$ich = (($ich & 0x1F) << 6) + (ord(shift @chars) & 0x3F);
if(($ich >= 0x0410) && ($ich <= 0x044F)){
$ch = $utf8_tr[$ich - 0x0410];
}elsif($ich == 0x0401){
$ch = 'Ё';
}elsif($ich == 0x0451){
$ch = 'ё';
}else{
$ch = '?';
}
}else{
$ch = '?';
}
$text .= $ch;
}
return $text;
}

Самое шлавное забыл...

Это (см. ниже) надо вставить в начало проги. Все оптимизировано по скорости, но может это и не последняя версия - последняя работает в офисе, а сейчас немного ночь... ;)


my(@utf8_tr) = split //, 'АБВГДЕЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯабвгдежзийклмнопрстуфхцчшщъыьэюя';
Как писал Nicon

LiM, это не так. Топик не об этом, поэтому скажу только, что ты глубоко ошибаешься. 63.111.236.7:1080 - достаточно? А если хочешь, то я тебя ими завалю :). Тем более, что это HTTP-proxy. А если SOCKS?

Хорошо, пусть так - мне это не сильно важно - proxy.rol.ru вряд ли забанят, тем более, что я им пользуюсь не злоупотребляя... ;)

Яндекс смотрит не по браузерам, а по IP. Если запросы будут идти с одного адореса - это будет поводом для проверки адреса на наличие прокси.

Рамблер увеличивает свою прожорливость со временем - факт. Это, видимо, зависит от многих причин.

Всего: 1000