Проблемы с сервером (иногда падает и медленно работает мускуль)

PB
На сайте с 10.08.2007
Offline
26
PAB
829

Есть сервер под freebsd6.2.

Конфиг: core2duo e6400, 1gb ddr2 ecc, 2x160bg sata raid1.

На нем крутится несколько сайтов, в общей сложности где-то 400к хитов в день и 25-30к хостов.

Так же на нем крутится phpadsnew, который делает где-то лям хитов в день, наверное даже больше.

Теперь о проблемах

1. Странно работает мускуль. Мускуль постоянно показывает, что от эдсов весит в памяти под 50 конектов. А иногда и больше. У эдсов включено постоянное соединение. База эдсов в формате INNODB. У остальных сайтов в основном myisam. Так же есть несколько сайтов на битриксе. Вот у них какраз самые большие проблемы с производительностью именно по часте запросов к базе. Текущие параметру мускуля в прикрепленном файле.

2. 2 раза было такое, что сервер падал намертво и не отвечал ни по каким портам, оживал только после физической перезагрузки. Хостер говорит, что ничего странного не заметил при перезагрузке. Как понять, в чем может быть проблема, куда рыть и что листать. Хотя бы примерно?

txt mysql.txt
instamag.ru - классные магнитики из инстаграма (http://instamag.ru?r1=forums&r2=armada)
A4
На сайте с 09.08.2007
Offline
55
#1

Для начала в dmesg. Ещё желательно во время зависания перед ребутом поглядеть на консоль (физическую).

Настройка nginx и сопутствующего софта на freebsd/debian. Контакт через PM.
PB
На сайте с 10.08.2007
Offline
26
PAB
#2

в dmesп.today (а сервак какраз сегодня падал) есть только одна строка

ad4: TIMEOUT - READ_DMA retrying (1 retry left) LBA=114935567

в dmesg.boot вроде ничего страшного нет, на что именно смотреть?

A4
На сайте с 09.08.2007
Offline
55
#3

Ну.. Таймаут - значит периодически отваливается винт. Видимо, поэтому и виснет. Поглядите в смарт, скорее всего на нём беды появились.

PB
На сайте с 10.08.2007
Offline
26
PAB
#4
Alexei42:
Ну.. Таймаут - значит периодически отваливается винт. Видимо, поэтому и виснет. Поглядите в смарт, скорее всего на нём беды появились.

как бы это сделать?

A4
На сайте с 09.08.2007
Offline
55
#5

cd /usr/ports/sysutils/smartmontools && make install clean && rehash

smartctl -s on -A /dev/ad4

PB
На сайте с 10.08.2007
Offline
26
PAB
#6
Alexei42:
cd /usr/ports/sysutils/smartmontools && make install clean && rehash
smartctl -s on -A /dev/ad4


=== START OF ENABLE/DISABLE COMMANDS SECTION ===
SMART Enabled.

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 063 063 006 Pre-fail Always - 157492828
3 Spin_Up_Time 0x0003 096 095 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 19
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 082 060 030 Pre-fail Always - 189833800
9 Power_On_Hours 0x0032 099 099 000 Old_age Always - 1605
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 23
187 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 0
189 Unknown_Attribute 0x003a 100 100 000 Old_age Always - 0
190 Temperature_Celsius 0x0022 073 064 045 Old_age Always - 471400475
194 Temperature_Celsius 0x0022 027 040 000 Old_age Always - 27 (Lifetime Min/Max 0/23)
195 Hardware_ECC_Recovered 0x001a 067 046 000 Old_age Always - 85158935
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0000 100 253 000 Old_age Offline - 0
202 TA_Increase_Count 0x0032 100 253 000 Old_age Always - 0
A4
На сайте с 09.08.2007
Offline
55
#7
7 Seek_Error_Rate         0x000f   082   060   030    Pre-fail  Always       -       189833800

По моему жёсткому сильно плохо..

Возможно я конечно и ошибаюсь.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий