Проблемы с дисковой системой.

12
L7
На сайте с 04.06.2008
Offline
68
1349

Доброго времени суток :)

Есть сервер с двумя терабайтниками в raid-1. На них полностью создан один корневой раздел в формате ext3. И уже за полгода существования сервера два раза уходил по нагрузке (wa в top постоянно показывал 99%), помогал только физический ресет сервера.

В первый раз всю нагрузку съедал kjournaled, второй раз все положила проверка квот.

Правильно ли я понимаю, что собственно вся проблема в том, что корень разбит не удачно? (стоит панелька от ispmanager и по совету из оф. документации разбил диск так) Стоит ли переразбить диск в более адекватный вариант (т.е. отдельные логические диски для /home, /var) и сменить на ext4?


$ mount
/dev/cciss/c0d0p2 on / type ext3 (rw,noatime,errors=remount-ro,grpquota,usrquota)
tmpfs on /lib/init/rw type tmpfs (rw,nosuid,mode=0755)
proc on /proc type proc (rw,noexec,nosuid,nodev)
sysfs on /sys type sysfs (rw,noexec,nosuid,nodev)
udev on /dev type tmpfs (rw,mode=0755)
tmpfs on /dev/shm type tmpfs (rw,nosuid,nodev)
devpts on /dev/pts type devpts (rw,noexec,nosuid,gid=5,mode=620)
/dev/cciss/c0d1p1 on /home/backup type ext3 (rw)


$ uname -a
Linux server 2.6.32-5-amd64 #1 SMP Mon Oct 3 03:59:20 UTC 2011 x86_64 GNU/Linux


$ cat /etc/issue
Debian GNU/Linux 6.0


$ df -m
Файловая система 1M-блоков Исп Доступно Исп% смонтирована на
/dev/cciss/c0d0p2 934177 3980 882744 1% /
tmpfs 10059 0 10059 0% /lib/init/rw
udev 10054 1 10054 1% /dev
tmpfs 10059 0 10059 0% /dev/shm
/dev/cciss/c0d1p1 1877764 9801 1772579 1% /home/backup
M
На сайте с 16.09.2009
Offline
278
#1

df -i

покажите

lokid7:
Правильно ли я понимаю, что собственно вся проблема в том, что корень разбит не удачно?

Может только часть проблемы, но да: "все в /" - тупо. Я бы вынес как минимум отдельно /boot, бекап, /tmp, файлы сайтов (/var/www или где они там) и /var.

Опционально - логи (/var/log) и базы (/var/lib/mysql). К сожалению, с логами не так просто из-за тупизны ispmanager.

Помимо прочего, вовсе не обязательно будет включать квоты на всех разделах.

Абонементное сопровождение серверов (Debian) Отправить личное сообщение (), написать письмо ().
N
На сайте с 06.05.2007
Offline
419
#2

lokid7, танцы с бубном. В первую очередь проанализируйте какие процессы нагружают диски и почему. Подумайте как это уменьшить.

Некоторые ньюаны производительности есть при разбивке дисков больших размеров от 2Тб, но это не ваш случай. Смена файловой системы на ext4 может немного улучшить ситуацию, но тоже из серии танцев с бубном.

Кнопка вызова админа ()
L7
На сайте с 04.06.2008
Offline
68
#3
myhand:
df -i
покажите

Может только часть проблемы, но да: "все в /" - тупо. Я бы вынес как минимум отдельно /boot, бекап, /tmp, файлы сайтов (/var/www или где они там) и /var.

Опционально - логи (/var/log) и базы (/var/lib/mysql). К сожалению, с логами не так просто из-за тупизны ispmanager.

Помимо прочего, вовсе не обязательно будет включать квоты на всех разделах.

$ df -i
Файловая система Iнодов IИспол IСвоб IИсп% смонтирована на
/dev/cciss/c0d0p2 60743680 195914 60547766 1% /
tmpfs 2575015 5 2575010 1% /lib/init/rw
udev 2573811 505 2573306 1% /dev
tmpfs 2575015 1 2575014 1% /dev/shm
/dev/cciss/c0d1p1 122093568 191 122093377 1% /home/backup

Насчет разделов примерно так и хотел, но ставил ispmanager впервые и решил четко по советам из документации делать.

---------- Добавлено в 17:16 ---------- Предыдущее сообщение было в 17:14 ----------

netwind:
lokid7, танцы с бубном. В первую очередь проанализируйте какие процессы нагружают диски и почему. Подумайте как это уменьшить.

Некоторые ньюаны производительности есть при разбивке дисков больших размеров от 2Тб, но это не ваш случай. Смена файловой системы на ext4 может немного улучшить ситуацию, но тоже из серии танцев с бубном.

Обычно нагрузку по wa возрастает при обращении к apache и работе mysql (особенно когда приходит запрос на mysql, то за ним по io прыгает процесс kjournaled - смотрю по iotop, во вложении скриншот). Один из сайтов имеет директорию на 29 тыс. файлов, думаю из-за этого не могут возникать проблем? Так же очень активно идет работа по записи данных в БД.

Планирую изъять сервер из дц и провести миграцию на ext4 с новой разбивкой дисков, но остановит ли это проблемы пока не уверен.

gif server.gif
N
На сайте с 06.05.2007
Offline
419
#4

lokid7,

lokid7:
Один из сайтов имеет директорию на 29 тыс. файлов, думаю из-за этого не могут возникать проблем?

Это сомнительно. Как правило, сайты не получают список содержимого файлов, а все остальное работает достаточно хорошо даже если файлов в каталоге много.

Обычно нагрузку по wa возрастает при обращении к apache и работе mysql (особенно когда приходит запрос на mysql, то за ним по io прыгает процесс kjournaled - смотрю по iotop). Так же очень активно идет работа по записи данных в БД.

ну а почему бы не попытаться уменьшить источник этой работы ? разве не очевидно, что наиболее действенным будет сделать так чтобы mysql и apache поменьше нагружали диск. как - это отдельный сложный вопрос.

M
На сайте с 16.09.2009
Offline
278
#5
netwind:
Это сомнительно. Как правило, сайты не получают список содержимого файлов

Зато бекап ой как получает. ТС, обратите внимание!

N
На сайте с 06.05.2007
Offline
419
#6
myhand:
Зато бекап ой как получает. ТС, обратите внимание!

и что, бекап 10 каталогов по 1000 будет быстрее чем бекап одного в 10000 файлов? почему ?

все равно бекап будет считывать все файлы и все списки будь они в одном каталоге или во многих

Andreyka
На сайте с 19.02.2005
Offline
822
#7

Точную модель реейда скажи

Не стоит плодить сущности без необходимости
M
На сайте с 16.09.2009
Offline
278
#8
netwind:
и что, бекап 10 каталогов по 1000 будет быстрее чем бекап одного в 10000 файлов? почему ?

Прежде всего, речь не о "быстрее" - а о "грузить".

netwind:
все равно бекап будет считывать все файлы и все списки будь они в одном каталоге или во многих

"Все равно". И?

Вот и я про то, что такой тип нагрузки (в отличие от обычной работы сайтов) - "будет грузить". Именно из-за "считывания всех файлов".

Ну, дошло?

N
На сайте с 06.05.2007
Offline
419
#9
myhand:
Прежде всего, речь не о "быстрее" - а о "грузить".

не является ли суммарное потраченное время на бекап наиболее простым и доступным показателем для сравнения нагрузки?

L7
На сайте с 04.06.2008
Offline
68
#10
Andreyka:
Точную модель реейда скажи

04:00.0 RAID bus controller [0104]: Hewlett-Packard Company Smart Array G6 controllers [103c:323a] (rev 01)

Subsystem: Hewlett-Packard Company Smart Array P410 [103c:3243]
Kernel driver in use: cciss
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий