Посмотрите в сторону key value хранилищ и nosql-хранилища - Веб-строительство

БД гигантского размера

sidorka · 2015-02-15T13:35:41.0000000Z

Порекомендуйте в какую сторону смотреть? Дано: - количество записей - больше, чем много; - структура - простая - id и пара целых чисел; - активно используется сортировка по одному полю; - на запись активность есть тоже, но это можно обойти - актуальность обновления низкая, можно и раз в сутки обновлять, накопив запросы; - возможность бэкапа. Кроме мускула ничем до этого не пользовался. Вот и не знаю куда смотреть :(

334

TF-Studio

17 февраля 2015, 08:39

#21

Пересмотреть архитектуру приложения.

Выделять частые - в отдельную.

в разы больше памяти под кеш.

надо предметно ковырять, слишком нетиповая задача и мелочи могут повлиять не ответ

Всё ещё лучший способ заработка для белых сайтов: GoGetLinks (https://www.gogetlinks.net/?inv=fahbn8).

156

igor3310

17 февраля 2015, 08:50

#22

MySQL на innodb с правильным созданием индексов - нормально и 500 лямов потянет

1

Веб разработка WordPress, OpenCart, Modx Revo и прочее - https://searchengines.guru/ru/forum/1040224

АХ

53

Альтена-Хост

17 февраля 2015, 08:57

#23

sidorka, 500 млн. записей это много. Не уверен, что получится обрабатывать с приемлемой скоростью без кластера.

Судя по тому, что структура данных простая, не факт, что нужен SQL.

Можно посмотреть в сторону key=>value хранилищ и noSQL.

Посмотрите на Hbase, Cassandra. Можно elasticsearch прикрутить как noSQL database, заодно и поиск по данным и масштабирование реализуются "на ура".

По опыту поиска на более сложных данных (web) - 5-10 млн. документов на сервер - предел для разумной (менее 1 сек.) скорости поиска по кластеру.

1

Я просто люблю и уважаю людей.

Профи, как бы вы На каком движке делать Подскажите как организовать бд

211

sidorka

17 февраля 2015, 17:26

#24

siv1987, не пойму про какую избыточность речь.

<id1><id2><views><clicks><ctr>

Все числа целые. Поиск по составному ключу <id1><id2> и сортировкой по <ctr>. <views> и <click> - для вычисления <ctr>, используются только при апе.

---------- Добавлено 17.02.2015 в 21:27 ----------

TF-Studio, а примеры есть какие посмотреть-поковырять-почитать?

---------- Добавлено 17.02.2015 в 21:29 ----------

С перконы эффект есть, пошустрее бегает заметно. Боюсь ненадолго только.

Дешевые домены для дорвеев и не только - от 55р (https://goo.gl/Wtnwqp)

Помогите решить вопрос с renter.ru - Xeon E3v3-1270 Норма CTR Adsense на

N

419

netwind

17 февраля 2015, 18:19

#25

sidorka:
siv1987, не пойму про какую избыточность речь.

Все про ту же. Все уже написали. Три человека про одно и то же твердят.

Ищите решение проблемы не в смене способа хранения и работы с данными, а в переосмыслении алгоритмов и структуры.

Ну вот поставите вы 3 сервера для nosql-хранилища и отдельный для memcache. Что-то там распределите. Но работу по поиску они примерно ту же будут выполнять. И сколько еще их вы сможете поставить, даже при линейном росте производительности ? Это при любом раскладе невыгодно.

Кнопка вызова админа ()

Бюджетный кластер на Linux'e Локальное железо для MySQL Профи, как бы вы

163

Metal Messiah

17 февраля 2015, 20:02

#26

У меня стата игровых серверов в базе примерно с той же проблемой была

Суть примерно в том что опрашиваются тысячи серверов, раз в несколько минут, ответ парсится и сохраняется. На основании этого строятся графики посещаемости. После первых пары месяцев я понял что сделал не так.

Теперь у меня данные за последний период (настраиваемо, сейчас неделя) хранятся в одной табличке, а крон среди ночи забирает их по мере необходимости, считает средние показатели аптайма, посещаемости и прочих дел за каждый час и за сутки, и пишет это в другую табличку, а из той удаляет. Данных в разы меньше. Ну и индексы никто не отменял. Статистика строится по второй таблице

anonymous, думай что говоришь и не забывай подписать отзыв :)

Проблемы в работе хостинга Нужно как-то мониторить состояние Построение таблицы записей на

211

sidorka

17 февраля 2015, 20:58

#27

Metal_Messiah, а чем этот способ отличается от обычного кэширования? Вроде то же самое - выборки на наиболее популярные запросы хранятся отдельно и не грузят БД, пока актуальность не истечет. К чему пляски с двумя таблицами?

siv1987, netwind, Вы бы как решили такую задачу?

---------- Добавлено 18.02.2015 в 01:06 ----------

kxk, дело не в том, что мне реалтайм надо, мне просто быстро из статичной большой таблицы выбрать надо с сортировкой. Активную часть закэширую, естесвенно, но что с НЧ запросами к БД делать?

---------- Добавлено 18.02.2015 в 01:09 ----------

Сразу поясню - образование - ПТУ.

Подскажите с запросом для Оптимизация работы сайта Кэширование

D

153

Dinozavr

18 февраля 2015, 10:44

#28

1. сколько строк в среднем выдаётся по составному ключу?

2. сколько вообще запросов в секунду?

3. мне стыдно спрашивать, но: индексы на всех полях?

A

130

admak

18 февраля 2015, 13:45

#29

sidorka:

<id1><id2><views><clicks><ctr>
Все числа целые. Поиск по составному ключу <id1><id2> и сортировкой по <ctr>. <views> и <click> - для вычисления <ctr>, используются только при апе.

У Вас разве ключ <id1><id2> не уник? Судя по "сортировке" - нет.. Какой у вас ключ уникальный?

А лучше покажите структуру таблицы "CREATE TABLE... и т.д."

.............

211

sidorka

18 февраля 2015, 16:21

#30

1. 30-40 за раз.

2. сложно сказать, как начинают набигать - так вроде и много. Не мерял. То где крутится щас - оценочно 100к в сутки, нужно больше. Сервер убогий, но нужно именно под такой и еще слабее.

Процессор: Atom(Intel® Atom™ Processor D425 (512K Cache, 1.80 GHz)). Оперативная память: 2 Гб. Жёсткий диск: 500 Гб. Выделенных IP-адресов: 1. Цена в месяц: $10

3. Индексы есть вроде как.

admak, спс, что поправили. Запрос выглядит так

SELECT id2 FROM table WHERE id1 = ID ORDER BY ctr LIMIT limit

Структура точная:

CREATE TABLE IF NOT EXISTS `cj` (

  `keyword_id` int(11) NOT NULL,

  `item_id` int(11) NOT NULL,

  `views` int(11) NOT NULL DEFAULT '0',

  `clicks` int(11) NOT NULL DEFAULT '0',

  `ctr` int(11) NOT NULL DEFAULT '0',

  PRIMARY KEY (`keyword_id`,`item_id`),

  KEY `keyword_id` (`keyword_id`,`item_id`,`ctr`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

Зависимость стоимости AdSense от Переезд на https, менять Инструмент для анализа конкурентов

Все что нужно знать о DDоS-атаках грамотному менеджеру

Вышел новый Яндекс Браузер с YandexGPT и YandexART

БД гигантского размера