Как лучше организовать архив с большим количеством файлов

A5
На сайте с 11.05.2009
Offline
37
1507

Необходимо расположить на сервере(на нескольких дисках) около полумиллиона файлов (вес разнится от 1 до 100 мб.).

Быть может есть какие нибудь рекоммендации для оптимального хранения этих файлов (по какому то кол-ву на каталог, быть может вложенные каталоги и прочее). Понятное дело, что в пару каталогов всё это не сбросишь -вот в общем интересует, как бы всё это расположить в лучшем виде.

предполагаемая операционка - centos

zexis
На сайте с 09.08.2005
Offline
388
#1

Говорят, что в одной папке можно хранить сколько угодно файлов.

Я не проверял.

Но если файлов в папке слишком много, то просматривать папку администратору будет очень долго и не удобно. А это иногда приходится делать.

Поэтому я храню все файлы в паках.

В каждой папке не более 1000 файлов.

Сами папки имеют названия в виде номеров.

1

2

3

444

M
На сайте с 01.12.2009
Offline
235
#2

потёр сории

Администратор Linux,Freebsd. построения крупных проектов.
VO
На сайте с 27.07.2008
Offline
149
#3

Какую FS планируете использовать ?

У Вас объем данных получается от 500 - 50.000 Gb.

Объем реальный известен ? Бэкапить это планируете как-то ?

A5
На сайте с 11.05.2009
Offline
37
#4
Какую FS планируете использовать ?

пока что никакую, но если исходя из операционки (centos) какая-то файловая система будет давать значительные плюсы, то можно использовать её.

У Вас объем данных получается от 500 - 50.000 Gb.

примерно 6тб на 4 дисках

Бэкапить это планируете как-то ?

копия всего архива будет располагаться ещё на одном таком же сервере. Особого ежедневного прироста в кол-ве файлов не ожидается, то есть дополняться будет, но не особо часто.

Andreyka
На сайте с 19.02.2005
Offline
822
#5

Попробуй gluster

Не стоит плодить сущности без необходимости
rtyug
На сайте с 13.05.2009
Offline
263
#6

alex545, а какие Ваши предложение? эти файлы должны будут отдаваться одиним куском? какая посещаемость?

проблема в том что очень много маленьких файлов и в том что на одном сервере все это... сколько файлов размера 1-20метр?

6000000/100=60000 файлов

6000000/1= 6000000 файлов

  • может быть файлы действительно в PgSQL/Oracle/DB\2 поставить? (советовать не будут, такую связки не было :) )
  • можно посмотреть на MogileFS
  • и т.д.

в одном проекте где было 10млн файлов и даже только у некоторых пользователей по 4Тб :)

когда пользователь хотел скачать через httpd, то переходил на страницу http://super-site.ru/file/we32swrs3/porn.avi , скрипт принимал название, смотрел в бд есть ли этот файл и его ид, после кнопки скачать, скрипт отправлял в nginx через внутрений редирект данные (время жизни ссылки и т.д.) и пользовтаь получал эту ссылку через которую можно было скачать файл...

файлы дедились по каталогам, именно так, по 1000 файлов...

узнать какой файл в каком каталоге должен быть и в каком он есть, можно было так:

$f->{new_id_file} - id файла

$c->{files_per_folder} - число файлов в каталоге

название каталога:

sprintf("%05d",$f->{new_id_file}/$c->{files_per_folder});

# perl -e 'print sprintf("%05d",100/10)'

00010
# perl -e 'print sprintf("%05d",101/10)'
00010
# perl -e 'print sprintf("%05d",111/10)'
00011
Спалил тему: Pokerstars вывод WMZ, etc на VISA 0% или SWIFT + Конверт USD/GBP,etc (net profit $0,5 млрд) (https://minfin.com.ua/blogs/94589307/115366/) Monobank - 50₴ на счет при рег. тут (https://clck.ru/DLX4r) | Номер SIP АТС Москва 7(495) - 0Ꝑ, 8(800) - 800Ꝑ/0Ꝑ (http://goo.gl/XOrCSn)
Raistlin
На сайте с 01.02.2010
Offline
247
#7

Не корректнее ли будет запастись большим количеством RAM и вывалить это дело на NAS?

HostAce - Асы в своем деле (http://hostace.ru)
Andreyka
На сайте с 19.02.2005
Offline
822
#8

А если NAS упадет - все сдохнет

Уж лучше gluster

Raistlin
На сайте с 01.02.2010
Offline
247
#9

Ну так рейд и бекап? Не, если в финансы упирается тады я молчу.

Andreyka
На сайте с 19.02.2005
Offline
822
#10

А если сгорит (физически)? Это надо резерв, на него восстановление. Даунтайм.

Gluster лучше. Если правильно приготовить.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий