С другой стороны - проблема с Яндексом явно есть. Я сам видел, как это чудо набежало индексировать большой по объему сайт подняв загрузку в 4 раза. Мне интересно, Яндекс о ней знает? Вы (или не вы, эта проблема на форуме озвучивалась уже раз двадцать) ему писали? Я думаю, что если большое количество людей будет их пинать то рано или поздно они тоже напишут ограничитель своего краулера, как гугл.
robots.txt - это хорошо, только не всегда он применим и не все о нем знают. Раз уж мы о вирт. хостинге говорим.
Все ведь зависит от того, как смотреть. И от чего считать эти проценты. Если от десктопа - да, 10-20% не критичны. Если от двухпроцессорной VDS-ноды - эти 20% - несколько виртуалок, а значит дополнительные деньги.
Не "лохи", просто программисты. Которые поленились написать нормальную обвязку установки, которая бы ставила софт по правилам конкретного дистрибутива - apt\yum\rpmi\ports\portage.
Например ISPmanager-овские не поленились. В итоге - софт можно ставить, удалять, обновлять и менять настройки _системными_средствами_. Эти средства оттестированы, гарантированно работают и имеют мегатонны документации и описание всех возможных ошибок и багов.
Однако нет, надо изобретать велосипед в ввиде собственных custombuild-ов и easyapache-ей, потому, что так проще программисту (не надо держать зоопарк дистров для теста, читать доки по всем и т.д.). А то, что сложнее администратору (система превращается в слакварь) - кодеров волнует мало.
И в итоге установка того же директадмина на сервер задача далеко не всегда тривиальная. А иногда вылезают такие дивные глюки, что волосы на голове встают дыбом. Особенно если в одном флаконе собирается несколько редких параметров, например не самый новый дистрибутив + 64битная архитектура.
Удаление того же директадмина - это вообще отдельная, долгая и красивая песня. Мне к сожалению однажды пришлось это делать, и я очень пожалел, что нельзя было переустановить ОС. Такое количество равномерно размазанных по винту обрезков никакая другая панель за собой не оставляет. Добавим сюда любовь без спроса перезаписывать системные (из пакетов) библиотеки и конфиги своими и получаем форменный ад, где не сразу вообще понятно, что откуда пришло, кто от него зависит и как это убрать.
Про то, что слов "unix-way" авторы директадмина и не слышали - можно складывать легенды. Начиная от банального named restart вместо rndc reconfig и httpd restart вместо apachectl graceful, заканчивая virtual-ами, указанием юзера в трех разных местай и прочим идиотизмом.
Цифрами чего, простите? Сравнения прошлого и нынешнего "поколений" железа? Гугл поможет :)
Технологии - это не только циферка перед "Ghz".
Про тот же Intel Vanderpool пять лет назад слыхом еще не слыхивали. А теперь и на ноутбуках поддерживается.
Аналогично с процессорами (частота, ядерность, инструкции, фичи вроде NX и VT), памятью (частоты, тайминги, объем), HDD (интерфейс, размеры, количество оборотов)..
Так что я согласен, что за год-два железо таки устаревает. Да и при жесткой эксплуатации ему здоровья не прибавляется (особенно кулерам, БП, винтам).
Про софт я и вовсе молчу.
И неправда ваша, у меня ноутбук за 18 часов такое делает. :)
Правда нужно оно было ровно два раза - при исходной настройке cflags и use и когда побилась частично fs на винте, угробив часть файлов в /usr/.
Я не думаю, что кто-то анализировал действия ботов. Тем более я не думаю, что этот "кто-то" - человек. Не хватит на такой поток человека. :)
А создаваемая Яндексом нагрузка и активность и правда легко вгоняет его в бан, если отлов ботов идет по количеству одновременных\в секунду соединений.
0) Не месяцами, а до момента стабилизации (centos - stable, если что. Как и основная ветка Дебиана. А значит версий, вышедших вчера там ждать глупо). :) Если нужен bleeding edge - верный путь на debian experimental, gentoo..
1) Есть неофициальные репозитории.
2) Это не повод "легким движением make install превращать систему в Слакварь". (с) Попробуйте это потом обновить, или упаси Б-же удалить. Удивитесь. Больше так не делайте. :)
Если Яндекс по каким-то причинам не представился - это косяк Яндекса и только Яндекса. В момент индексации он создает зачастую такое число коннектов, что не уезжает в бан только потому, что представляется Яндексом :)
Зачем? :)
RPM отменили, я что-то пропустил?
Еще понимаю сборку с патчами и\или оптимизацией, но нафига чистые сырцы ставить так, если система binary based?