Нет, это была просто одна из шуток.
Одна из... ;)
Гхм... Незачем спорить - я сам это восстанавливал. :)
Дело было именно в том, что для МастДай 95 слишком мало оказалось свободного места на диске в 50 Мегов. В таком случае, как оказалось, он делает лапками вверх, попутно криво скидывая на диск таблицу FAT, что приводит к логической потере данных - информация на диске есть, но вернуть к жизни ее можно только ручками собирая паззл из многих тысяч кластеров...
Ладно, в офф-топик не уходим. :)
Alexx,
У Евгения другая работа - он отвечает за каталог, а не за баны в поисковике - знать надо тех, с кем работаете...
Это да... Рамблер отличается очень долгим "запряганием".
На одном сайте мы первой индексации ждали несколько месяцев. Теперь Рамблер кушает намного больше, чем Яндекс - больше Рамблера кушает сейчас только Google, но тот вообще зверь... :)
Хуже когда глючит МастДай - пару лет назад от винта 1.2 Гига, битком набитого ценной информацией, было оставлено 300 Мегов... Безвозвратно.
Я тебя очень, очень, очень понимаю.
Не обязательно. У Рамблера есть робот-пессимизатор (как они его называют), который "успокаивает" сайты чрезмерно ретивых оптимизаторов. Вполне возможно, что такая ситуация может быть и по результатам его работы.
Тут и вправду стоит отдельно исследовать - без этого ничего, кроме предположений, родить не получится.
Пользуйте... (все на Perl) Функции независимы - каждая делает свое, но обе переваривают UTF-8.
sub urldecode{ my($text) = @_; $text =~ s/\+/ /go; $text =~ s/%([0-9a-fA-F]{2})/chr(hex($1))/goe; $text =~ s/%u0401/Ё/go; $text =~ s/%u0451/ё/go; $text =~ s/%u04([0-9a-fA-F]{2})/$utf8_tr[hex($1) - 16]/goe; return $text; } sub utf8decode{ my($text) = @_; my(@chars) = split //, $text; $text = ''; my($ch, $ich); for(; $#chars >= 0;){ $ch = shift @chars; $ich = ord $ch; unless($ich & 0x80){ ; }elsif(($ich & 0xE0) == 0xC0){ $ich = (($ich & 0x1F) << 6) + (ord(shift @chars) & 0x3F); if(($ich >= 0x0410) && ($ich <= 0x044F)){ $ch = $utf8_tr[$ich - 0x0410]; }elsif($ich == 0x0401){ $ch = 'Ё'; }elsif($ich == 0x0451){ $ch = 'ё'; }else{ $ch = '?'; } }else{ $ch = '?'; } $text .= $ch; } return $text; }
Самое шлавное забыл...
Это (см. ниже) надо вставить в начало проги. Все оптимизировано по скорости, но может это и не последняя версия - последняя работает в офисе, а сейчас немного ночь... ;)
my(@utf8_tr) = split //, 'АБВГДЕЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯабвгдежзийклмнопрстуфхцчшщъыьэюя';
Хорошо, пусть так - мне это не сильно важно - proxy.rol.ru вряд ли забанят, тем более, что я им пользуюсь не злоупотребляя... ;)
Яндекс смотрит не по браузерам, а по IP. Если запросы будут идти с одного адореса - это будет поводом для проверки адреса на наличие прокси.
Рамблер увеличивает свою прожорливость со временем - факт. Это, видимо, зависит от многих причин.