Centos 5.9 Final + Bus Error

Romka_Kharkov
На сайте с 08.04.2009
Offline
485
1064

Выходные добрые комрады,

Новый фокус у CentOS 5.9 Final:


# rpm -qa
Bus error
# sshd
Bus error

dmesg:


attempt to access beyond end of device
md1: rw=0, want=15627143936, limit=226050304
attempt to access beyond end of device
md1: rw=0, want=15627143936, limit=226050304
attempt to access beyond end of device
md1: rw=0, want=15627143936, limit=226050304
....
....
....

Сразу скажу, что вижу сам данное в первый раз, но google уже в курсе аналогичной проблемы, но беда вся в том, что судя по ошибке, идут обращения в области ФС выходящие за её размеры, об этом говорится по крайней мере в 10 из 10 источниках которые я нашел, на самом деле не ясно как такое может быть в принципе, ну это и не супер как важно, ведь FS то я не трогал.... т.е ничего не создавал не удалял , не менял..... Стоит Soft-Raid (mdadm), один из дисков имеет "проблемки" , ждет замены, но при исключении его из рейда - ничего не меняется. Сейчас поочередно вынимал оба винта из зеркала, и ребилдил по новой.....

Итак , констатирую проблему как-то так: работал себе сервер работал, потом хоп и раздел стал больше ... так что ли ? )

Винты одинаковые, байт в байт и все такое.... Причем интересная особенность, после ребута из демонов по умолчанию не запускается тока sshd (Bus error) и какое-то там avahi... ВСЕ остальное, а это LAMP + парочка сервисов сторонних работает и отвечает !! :) С Консоли все пингаю, все вижу....

WTF ? Кто сталкивался?

С Уважением,

Есть около 15.000 ipv4 !!! (http://onyx.net.ua/price.php#ipv4) Качественный хостинг с 2005 года - лучшее клиентам! (http://onyx.net.ua/)
Boris A Dolgov
На сайте с 04.07.2007
Offline
215
#1

По какой-то причине побились какие-то файлы, видимо с библиотеками. Сделать fsck и rpm -Va.

С уважением, Борис Долгов. Администрирование, дешевые лицензии ISPsystem, Parallels, cPanel, DirectAdmin, скины, SSL - ISPlicense.ru (http://www.isplicense.ru/?from=4926)
Romka_Kharkov
На сайте с 08.04.2009
Offline
485
#2
Boris A Dolgov:
По какой-то причине побились какие-то файлы, видимо с библиотеками. Сделать fsck и rpm -Va.

Так я же писал вывод rpm команды ;)))) Bus Error.. ключи не важны, fsck делал из single user, не помогло...

Boris A Dolgov
На сайте с 04.07.2007
Offline
215
#3

Тогда сделать ldd `which rpm` и проверить md5 этих файлов с файлами соседнего сервера, при необходимости -- попробовать заменить (желательно не трогая libc, libpthread, libdl, librt, ld-linux)

pupseg
На сайте с 14.05.2010
Offline
364
#4

че нить в этом духе:

tune2fs -m 0 /dev/sdX не делали ?

у меня на ext4 года полтора назад вылечилось fsck -y .

узнать бы на каком конкретно файле при чтении ОС помирает.

запуская, например, ssh он же дергает свои либы например......

если в вас не засунули какую-нибудь библиотечку "волшебную", и ссшд ее дернуть пытается, то в нормальном виде должно быть как то так:


[root@host ~]# cat /etc/redhat-release
CentOS release 5.9 (Final)
[root@host ~]# whereis sshd
sshd: /usr/sbin/sshd /usr/share/man/man8/sshd.8.gz
[root@host ~]# rpm -qf /usr/sbin/sshd
openssh-server-6.1p1-5.el5.1
[root@host ~]# ldd /usr/sbin/sshd
linux-vdso.so.1 => (0x00007fffe0e9c000)
libfipscheck.so.1 => /usr/lib64/libfipscheck.so.1 (0x00002b76045b1000)
libwrap.so.0 => /lib64/libwrap.so.0 (0x00002b76047b3000)
libaudit.so.0 => /lib64/libaudit.so.0 (0x00002b76049bd000)
libpam.so.0 => /lib64/libpam.so.0 (0x00002b7604bd5000)
libdl.so.2 => /lib64/libdl.so.2 (0x00002b7604de0000)
libselinux.so.1 => /lib64/libselinux.so.1 (0x00002b7604fe5000)
libcrypto.so.6 => /lib64/libcrypto.so.6 (0x00002b76051fd000)
libldap-2.3.so.0 => /usr/lib64/libldap-2.3.so.0 (0x00002b760554e000)
liblber-2.3.so.0 => /usr/lib64/liblber-2.3.so.0 (0x00002b760578a000)
libutil.so.1 => /lib64/libutil.so.1 (0x00002b7605998000)
libz.so.1 => /lib64/libz.so.1 (0x00002b7605b9b000)
libnsl.so.1 => /lib64/libnsl.so.1 (0x00002b7605db0000)
libcrypt.so.1 => /lib64/libcrypt.so.1 (0x00002b7605fc8000)
libgssapi_krb5.so.2 => /usr/lib64/libgssapi_krb5.so.2 (0x00002b7606200000)
libkrb5.so.3 => /usr/lib64/libkrb5.so.3 (0x00002b760642f000)
libk5crypto.so.3 => /usr/lib64/libk5crypto.so.3 (0x00002b76066c4000)
libcom_err.so.2 => /lib64/libcom_err.so.2 (0x00002b76068e9000)
libc.so.6 => /lib64/libc.so.6 (0x00002b7606aec000)
libresolv.so.2 => /lib64/libresolv.so.2 (0x00002b7606e44000)
/lib64/ld-linux-x86-64.so.2 (0x0000003b50200000)
libsepol.so.1 => /lib64/libsepol.so.1 (0x00002b7607059000)
libsasl2.so.2 => /usr/lib64/libsasl2.so.2 (0x00002b76072a0000)
libssl.so.6 => /lib64/libssl.so.6 (0x00002b76074b9000)
libkrb5support.so.0 => /usr/lib64/libkrb5support.so.0 (0x00002b7607707000)
libkeyutils.so.1 => /lib64/libkeyutils.so.1 (0x00002b7607910000)
[root@host ~]#

один коллега полгода работал с "сюрпризом" на борту, пока не посмотрел ldd и не увидел левока.... подозревал что влили через сипанель.

Качественная помощь в обслуживании серверов. (/ru/forum/661100) Бесплатных консультаций не даю, не помогаю, не обучаю. Минималка от 100$. Как пропатчить KDE-просьба не спрашивать. Есть форумы (http://linux.org.ru) и полезные сайты (http://www.opennet.ru/).
Romka_Kharkov
На сайте с 08.04.2009
Offline
485
#5

В общем после очередного fsck, появился lost+found в который завернуто полвинта сц### н##..... в общем буду ковыряться, вопрос по теме отпал.

pupseg
На сайте с 14.05.2010
Offline
364
#6

Romka_Kharkov, таки фс.... юзайте ext4 и никаких извратов типа xfs + reiser

Romka_Kharkov
На сайте с 08.04.2009
Offline
485
#7
pupseg:
Romka_Kharkov, таки фс.... юзайте ext4 и никаких извратов типа xfs + reiser

Рассмотрим варианты как говорится ;) Поздно пить боржом, реинсталу быть! :)

MT
На сайте с 15.01.2013
Offline
49
#8

Была такая проблема с CentOS 5.3. Причем тоже в конфигурации с mdadm. При этом, 100% на сервер никто не лазил после инстала, и даже ssh не было. Перестало работать нормально Астериск. Все файлы системные чекались на md5sum через Zabbix и когда возникла проблема первым делом проверил суммы - и с ними был полный порядок. С раза 3 после fsck таки завелось и через время опять повторилось. В итоге, пришлось реинсталить так как заказчик просил поднять быстрее. С того момента на том-же железе и с тем-же софтом - полный порядок.

pupseg:
никаких извратов типа xfs + reiser

На вкус и цвет... На вкус и цвет :) Ну для обычного сервера - ext4 более чем.

marcus@cluster:~$
Romka_Kharkov
На сайте с 08.04.2009
Offline
485
#9
MarcusTven:
Была такая проблема с CentOS 5.3. Причем тоже в конфигурации с mdadm. При этом, 100% на сервер никто не лазил после инстала, и даже ssh не было. Перестало работать нормально Астериск. Все файлы системные чекались на md5sum через Zabbix и когда возникла проблема первым делом проверил суммы - и с ними был полный порядок. С раза 3 после fsck таки завелось и через время опять повторилось. В итоге, пришлось реинсталить так как заказчик просил поднять быстрее. С того момента на том-же железе и с тем-же софтом - полный порядок.



На вкус и цвет... На вкус и цвет :) Ну для обычного сервера - ext4 более чем.

MarcusTven, да то же самое, стал бы я тут писать если бы перед этим fsck баловался ))) рабочий сервер ... все работало как часы, рейд как бы не просто так ... и все равно в зад все ушло :( печалька однако :D Главное что бекапы это на наше все :D

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий