Большое количество данных - как лучше хранить? - Администрирование серверов - Сайтостроение

90

rusevgen

16 февраля 2011, 11:37

2940

Добрый день

Прошу совета знатоков.

Сейчас есть база mysql в ней хранятся данные о географических точках (то есть поля две цифры + служебные поля принадлежности к объекту). Но этих точек очень много (несколько миллионов) и по мере роста базы все стало тормозить, так как mysql не справляется и съедает большую часть ресурсов. Данные обновляются редко, в основном происходит только добавление новых.

обращений к базе не много (это служебная информация, по которой строятся элементы), то есть по сути никаких множественных обращений не происходит.

Вопрос: как организовать хранение этих данных? если например хранить это все дело в файлах, побив объекты на группы, даст это прирост в скорости доступа?

Раньше не сталкивался с хранением таких больших объемов данных, поэтому буду благодарен за советы, в какую сторону смотреть для поиска решения.

ICQ: 577-662-540 продвижение сайтов за еду (/ru/forum/480944) продвину Ваш сайт за 3000/мес. Портфолио по запросу

388

zexis

16 февраля 2011, 12:31

#1

Лучше данные хранить в базе SQL. Так как это удобно и не факт, что на файлах своего формата будет быстрее.

Используются ли правильно индексы в таблицах и запросах?

Если с индексами все нормально, но все равно тормозит, значит нужно делать репликацию базы данных.

То есть один мастер сервер, в который заносим данные, и несколько Slave серверов в которые данных автоматически переносятся системой репликации.

Запросы Select можно делать к Slave серверам. Это позволит распараллелить запросы на несколько серверов.

Для начала я бы взял мощьный сервер и попробовал поставить на него. Может и один сервер справится при условии правильной индексации.

Особенности работы Яндекс.Метрики Semonitor 3.0 - программа Google позволил выгружать больше

[Удален]

16 февраля 2011, 12:47

#2

rusevgen:
Добрый день

Прошу совета знатоков.

Сейчас есть база mysql в ней хранятся данные о географических точках (то есть поля две цифры + служебные поля принадлежности к объекту). Но этих точек очень много (несколько миллионов) и по мере роста базы все стало тормозить, так как mysql не справляется и съедает большую часть ресурсов. Данные обновляются редко, в основном происходит только добавление новых.

обращений к базе не много (это служебная информация, по которой строятся элементы), то есть по сути никаких множественных обращений не происходит.

Вопрос: как организовать хранение этих данных? если например хранить это все дело в файлах, побив объекты на группы, даст это прирост в скорости доступа?

Раньше не сталкивался с хранением таких больших объемов данных, поэтому буду благодарен за советы, в какую сторону смотреть для поиска решения.

Вы бы описали структуру базы данных, какой тип полей, индексы.

S

315

Stek

17 февраля 2011, 11:52

#3

Структуру таблиц(ы) покажите, какое число данных в базе, какое железо на сервере, конфиг базы меняли или оставили дефолтным ?

Это просто подпись.

111

Zaqwr

17 февраля 2011, 12:59

#4

оптимизировать структуру БД.

Администрирование, Linux, Cisco, Juniper

P

250

Pilat

17 февраля 2011, 13:03

#5

Несколько миллионов точек - это не много. Надо смотреть на то, какие запросы Вам нужны и либо править запросы, либо править индексы. При некоторых типах запросов будет проще поставить postgres или использовать геонадстройку к mysql (если это поделие можно вообще использовать), но для обработки именно геоточек это всё лишнее.

Блог (http://www.pilat66.ru/)

Mail.ru Cloud Solutions и Поиск Mail.ru об обработке Яндекс.Поиск для сайта: дополнительный

[Удален]

17 февраля 2011, 17:32

#6

самое-самое это база данных SQL

263

rtyug

17 февраля 2011, 18:03

#7

rusevgen:

Вопрос: как организовать хранение этих данных? если например хранить это все дело в файлах, побив объекты на группы, даст это прирост в скорости доступа?

можно применить математические алгоритмы...

есть различные решения почти "из коробки", так же Berkeley DB и NoSQL

Спалил тему: Pokerstars вывод WMZ, etc на VISA 0% или SWIFT + Конверт USD/GBP,etc (net profit $0,5 млрд) (https://minfin.com.ua/blogs/94589307/115366/) Monobank - 50₴ на счет при рег. тут (https://clck.ru/DLX4r) | Номер SIP АТС Москва 7(495) - 0Ꝑ, 8(800) - 800Ꝑ/0Ꝑ (http://goo.gl/XOrCSn)

M

278

myhand

17 февраля 2011, 19:29

#8

rtyug:
можно применить математические алгоритмы...

Интересно, а реляционные базы данных - это не "математические алгоритмы"? :) Но звучит солидно: "ща как применим математические алгоритмы..."

rtyug:
есть различные решения почти "из коробки", так же Berkeley DB и NoSQL

Решения чего? Проблемы, которой толком и не сформулировали?

Абонементное сопровождение серверов (Debian) Отправить личное сообщение (), написать письмо ().

111

Zaqwr

17 февраля 2011, 20:03

#9

memcached ещё никто не порекомендовал?

9

149

911ha

18 февраля 2011, 05:58

#10

1) Explain тормознутых запросов нужен,

2) Структуры таблицы

VK приобрела 70% в структуре компании-разработчика red_mad_robot

Как снизить ДРР до 4,38% и повысить продажи с помощью VK Рекламы

Большое количество данных - как лучше хранить?