Что из железа умирает (вопрос для профи)

12
DA
На сайте с 04.02.2005
Offline
165
1556

Один раз сервер завис , симтпомы: ни на что не реагирует :) .

В логах только это:

Apr 14 20:28:58 kvadroom kernel: BUG: unable to handle kernel paging request at virtual address b0e89f82
Apr 14 20:28:58 kvadroom kernel: printing eip:
Apr 14 20:28:58 kvadroom kernel: 08048855
Apr 14 20:28:58 kvadroom kernel: *pde = 00000000
Apr 14 20:28:58 kvadroom kernel: Oops: 0000 [#2]
Apr 14 20:28:58 kvadroom kernel: SMP
Apr 14 20:28:58 kvadroom kernel: last sysfs file: /devices/pci0000:00/0000:00:02.0/0000:01:00.0/0000:02:02.0/0000:04:00.1/irq
Apr 14 20:28:58 kvadroom kernel: Modules linked in: i2c_dev ipt_REDIRECT xt_state xt_tcpudp iptable_nat nf_nat nf_conntrack_ipv4 nf_conntrack nfnetlink ip_tables x_tables autofs4 hidp nfs lockd nfs_acl rfcomm l2cap bluetooth sunrpc ipv6 dm_mirror dm_multipath dm_mod video sbs button dock battery ac parport_pc lp parport ata_piix libata sg i2c_i801 i2c_core e1000 ide_cd cdrom aic79xx scsi_transport_spi sd_mod scsi_mod ext3 jbd mbcache ehci_hcd ohci_hcd uhci_hcd
Apr 14 20:28:58 kvadroom kernel: CPU: 5
Apr 14 20:28:58 kvadroom kernel: EIP: 0060:[<08048855>] Not tainted VLI
Apr 14 20:28:58 kvadroom kernel: EFLAGS: 00210293 (2.6.22.14-72.fc6 #1)
Apr 14 20:28:58 kvadroom kernel: EIP is at 0x8048855
Apr 14 20:28:58 kvadroom kernel: eax: b0e89f82 ebx: 00000004 ec 00200286 edx: 00004000
Apr 14 20:28:58 kvadroom kernel: esi: c421bf8c edi: ffffffe0 ebp: c421be70 esp: c421be5c
Apr 14 20:28:58 kvadroom kernel: ds: 007b es: 007b fs: 00d8 gs: 0033 ss: 0068
Apr 14 20:28:58 kvadroom kernel: Process local (pid: 773, ti=c421b000 task=f5908c00 task.ti=c421b000)
Apr 14 20:28:58 kvadroom kernel: Stack: 00200286 b0e89f82 b0e89f82 00000000 00000004 00000001 c045ffe2 c04907b0
Apr 14 20:28:58 kvadroom kernel: 00000003 00000000 00000030 00000000 00000000 00000030 00000030 00000000
Apr 14 20:28:58 kvadroom kernel: c0491452 ffffffd0 00000000 00000000 c421bf4c 00000000 c421c00c d06b0180
Apr 14 20:28:58 kvadroom kernel: Call Trace:
Apr 14 20:28:58 kvadroom kernel: [<c045ffe2>] put_compound_page+0x23/0x24
Apr 14 20:28:58 kvadroom kernel: [<c04907b0>] splice_to_pipe+0x1c6/0x1d6
Apr 14 20:28:58 kvadroom kernel: [<c0491452>] sys_vmsplice+0x260/0x289
Apr 14 20:28:58 kvadroom kernel: =======================
Apr 14 20:28:58 kvadroom kernel: Code: Bad EIP value.
Apr 14 20:28:58 kvadroom kernel: EIP: [<08048855>] 0x8048855 SS:ESP 0068:c421be5c

После перегрузки работает абсолютно стабильно уже 2 недели. Собственно до этого зависалова сервер не ребутался около 500 дней. Операционка Fedora Core 6.

Куда копать?

тыщ-пыщ
N
На сайте с 06.05.2007
Offline
419
#1

что угодно. память, бедблоки на swap-разделе, перегрев cpu.

попросите персонал проверить память: в современном линуксе в загрузчике grub обычно есть memtest86+.

На винтах проверьте smart программой smartctl

Кнопка вызова админа ()
DA
На сайте с 04.02.2005
Offline
165
#2
netwind:
что угодно. память, бедблоки на swap-разделе, перегрев cpu.
попросите персонал проверить память: в современном линуксе в загрузчике grub обычно есть memtest86+.
На винтах проверьте smart программой smartctl

перегрев CPU исключен - температура мониторилась - все ОК

насчет memtest и smartctl можно по-подробнее...root доступ имеется

O
На сайте с 13.08.2008
Offline
26
#3

unable to handle kernel paging request at virtual address

Либо память, либо диск, куда оно не смогло отсвопиться.

Outsourcenow.ru: оттюним ваш веб-сервер. 100 млн. запросов в сутки - наш размерчик!
N
На сайте с 06.05.2007
Offline
419
#4
DJ_AlieN:
насчет memtest и smartctl можно по-подробнее...root доступ имеется

для memtest86 нужен доступ к физической косоли. эта программа работает без ядра и тестирует весь диапазон памяти, которая обычным программам недоступна.

ну а со smartctl что может быть непонятно? просто запускаете и смотрите значения счетчиков S.M.A.R.T.

оно и просто так могло сглючить. федора же.

DA
На сайте с 04.02.2005
Offline
165
#5

счетчики smart нули дают

Andreyka
На сайте с 19.02.2005
Offline
822
#6

Все просто, что за устройство /devices/pci0000:00/0000:00:02.0/0000:01:00.0/0000:02:02.0/0000:04:00.1/irq посмотрите

Скорее всего это контроллер диска

Совет - обновить ядро

Не стоит плодить сущности без необходимости
DA
На сайте с 04.02.2005
Offline
165
#7
Andreyka:
Все просто, что за устройство /devices/pci0000:00/0000:00:02.0/0000:01:00.0/0000:02:02.0/0000:04:00.1/irq посмотрите
Скорее всего это контроллер диска

Совет - обновить ядро

1) Как посмотреть

2) yum update kernel ?

Andreyka
На сайте с 19.02.2005
Offline
822
#8

Я бы посоветовал с kernel.org

DA
На сайте с 04.02.2005
Offline
165
#9

жаль что не гугл.ком, совсем непонятно как обновлять

Analitic82
На сайте с 17.01.2009
Offline
70
#10
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий