Понятно.... Логика в битой памяти - не просмотрелась, а вот разные ядра это же другое дело 🤪🤪🤪
Так они разные на зависаемых серверах.... Ровно как и страны расположения. :)
ваши варианты?---------- Добавлено 09.09.2013 в 00:04 ----------
Попробуйте запустить несколько серверов без ACPI..
Т.е вы их таки приобрели в одно время.... ????
Если так .... тогда имеет смысл смотреть на железо, может быть там из одной партии битая память .... или Матеря глючные какие-то.... тут уже ядро не ядро... будет виснуть....
На счет точек ничего не скажу, но вот такие вот зависания системы как вы говорите я ловил при следующих случаях:
1) Включенное ACPI.
2) Недостаточное количество питания. (Например в тачке много винтов и в момент какого-то всплеска их активности просто виснет тачка, причем именно виснет, а не отключается... как-то так).
3) Перегрев.
Мой вопрос к вам заключается в следующем: Эти 14 серверов о которых идет речь, они как появились ? Все одним днем ? или вы сперва взяли 1 много лет назад , потом еще и еще и сейчас их 14 и есть проблема? Либо же с момента первого сервера проблема? Потому как действительно на таком количестве + разных ядрах выглядит весьма странно, хотя не буду удивлен если это Java уничтожает так сервер .... имел когда-то дело с Tomcat... так ему и 30 гиг памяти это тьфу.... а каталина это ваще зло :D
Вполне может быть , все что сказали выше и помогло бы, но я уже увеличил и все такое ...... может версия не та... но работало раньше нормально (с слов владельца), пока приостановили разбирательство, перешли на apache, понаблюдаю, там будет видно.
Забаньте все их сети... делов то...
Тоже с 3мя винтами в Raid-0 ?
Если так, то причем же тут mdadm ? :) Явно проблема в контролере, винт вы вроде меняли , то же самое....
Может быть SATA кабель не очень хороший?
Хороший совет на тему 4х винтов для теста... Если у вас есть еще 1 ... попробуйте собрать Raid-0 из 4х дисков, проверим вариант чередования записи...
А что если добавить в огонь вот такое:
Просто забираю Header через Curl.
Стало быть PHP не при делах? Или таки при делах? :)
В нормальном случае получаю такой ответ:
А в этот раз получил описанный выше "HTTP/1.1 504 Gateway Time-out" на стороне курла. При этом , проверялка трогает сайт с двух разных мест, в одно и то же время одна ошибка (интервал 1 минута).
Может какие-то приколы чередования записи?
При двух винтах все просто, при трех уже интересней :D
При тестировании через RAID ... тест то уже проходит через raid0. Стало быть контроллер на три винта разделяет запись.... может не удается догрузить?