Попробуйте вариант 13525993. Сделайте выборку через INNER JOIN - Веб-строительство

693

dlyanachalas

23 февраля 2015, 21:36

#31

kalim:
Extra: Using where

Ну понятно, "IN" - поиск по большому неупорядоченному условию ему не нравится.

Попробуйте вариант /ru/forum/comment/13525993 - вполне возможно, что это решит проблему.

K

88

kalim

23 февраля 2015, 21:41

#32

Ladycharm

В blob у меня хранится строка, длинною в 256 символов (вернее, цифр) и ужатая COMPRESS(). Если буду хранить ее несжатой, то таблица увеличится в 2,5 раза.

Разнести все по разным таблицам - это светлая идея, на мой взгляд.

Только 2.5 млн записей - это легкий тест. В продакшен будет намного больше. Если дойдет до этого... Так что хочу сделать все, чтобы максимально оптимизировать все.

693

dlyanachalas

23 февраля 2015, 21:44

#33

kalim:

Разнести все по разным таблицам - это светлая идея, на мой взгляд.
Только 2.5 млн записей - это легкий тест. В продакшен будет намного больше. Если дойдет до этого... Так что хочу сделать все, чтобы максимально оптимизировать все.

Ещё раз - вы ищите по большому, неупорядоченному списку. Естественно, это тормозит.

Достаточно здравое решение - предварительно записать этот список в таблицу с индексами и сделать выборку через INNER JOIN.

K

88

kalim

23 февраля 2015, 21:53

#34

dlyanachalas

Признаться, но могу врубится в этот алгоритм (или же он мне не подходит).

Наборы ID, входящие в IN (....) моего SELECT-запроса никогда не повторяются! Зачем мне хранить эти наборы?

Если я не прав, объясните в двух словах как это работает? Или такую таблицу нужно налету создавать, чтобы избавится от IN в запросе, а потом ее очищать?

Если что, я не привязан к MySQL. Может тут лучше подойдет какая-то другая технология?

693

dlyanachalas

23 февраля 2015, 22:00

#35

kalim:
dlyanachalas
Признаться, но могу врубится в этот алгоритм (или же он мне не подходит).
Наборы ID, входящие в IN (....) моего SELECT-запроса никогда не повторяются! Зачем мне хранить эти наборы?

Хранить не надо, создаете и удаляете каждый раз для каждого запроса.

Если я не прав, объясните в двух словах как это работает? Или такую таблицу нужно налету создавать, чтобы избавится от IN в запросе, а потом ее очищать?

Да, так. А работает за счет того, что так вы столько раз индексы дергаете, сколько у вас параметров в IN. При временной таблице, будете дергать их 1 раз.

kalim:
Если что, я не привязан к MySQL. Может тут лучше подойдет какая-то другая технология?

Причем тут MySQL. Это реляционная алгебра. Неплохо изучить перед работой со сложными данными ;) А то все думают, что если что, "отделаются настройкой кэша" :)

L

351

Ladycharm

23 февраля 2015, 23:25

#36

dlyanachalas:
Ну понятно, "IN" - поиск по большому неупорядоченному условию ему не нравится.

kalim:
dlyanachalasМожет тут лучше подойдет какая-то другая технология?

Похоже, dlyanachalas прав на счёт "IN" - поиск по большому неупорядоченному условию". Проверить - легко, поменяйте условие в запросе

WHERE id in (4144, 5255, 6656, 9695, ...)

на

WHERE (id=4144 OR id=5255 OR id=6656 OR id=9695 OR id=...)

Тогда будет задействован индекс по id. Генерить строку с OR id= можно так же автоматически, если ваши id - в массиве $arr:

"WHERE id=".imlpode(" OR id=", $arr)

PS: А на счйт полей BLOB - 2 месяца назад решала аналогичную проблему с таблицей на 500 000 записей: у меня были поля ТEXT(по сути - те же BLOB, MySQL резервирует под них место большого размера, похоже, даже под пустые). А потом в этом огромном файле очень долго ищет даже по другим индексным полям, причём TEXT - даже не выбирались при SELECT. Вынесла их в другую таблицу и связала по ID - всё стало летать.

K

88

kalim

24 февраля 2015, 00:14

#37

Ещё раз - вы ищите по большому, неупорядоченному списку. Естественно, это тормозит.



Достаточно здравое решение - предварительно записать этот список в таблицу с индексами и сделать выборку через INNER JOIN.

Тормозит даже на небольшом списке. 50 записей по их id берутся за секунду.

Сделал я эту таблицу со временной связкой... И ничего. Ровно то же самое время.

Проверить - легко, поменяйте условие в запросе

Проверил. Время выборки такое же как и раньше.

Огромное спасибо за помощь всем!

693

dlyanachalas

24 февраля 2015, 00:44

#38

kalim:

Сделал я эту таблицу со временной связкой... И ничего. Ровно то же самое время.

Индекс во временной таблице не забыли?

На всякий случай, я бы так делал:

INSERT INTO selections (id) values (4144), (5255), (6656), (9695);

SELECT compkey3_all.* FROM compkey3_all INNER JOIN selections ON compkey3_all.id=selections.id;

TRUNCATE TABLE selections;

А selections - просто с одним столбцом id (Primary Key).

---------- Добавлено 24.02.2015 в 03:45 ----------

kalim:

Тормозит даже на небольшом списке.

Кажется, вы не поняли. Неупорядоченный список - это условие в вашем IN.

K

88

kalim

24 февраля 2015, 07:50

#39

dlyanachalas:
Индекс во временной таблице не забыли?

Не забыл. Связанный из 2 столбцов.

dlyanachalas:
Кажется, вы не поняли. Неупорядоченный список - это условие в вашем IN.

Но ведь даже "список" с 1 id выполняется медленно - 0,2 сек.

427

siv1987

24 февраля 2015, 10:12

#40

kalim, вам уже сказали в чем ваша проблема - локалхост. Переведите тесты на рабочий сервер и тогда можно будет говорить.

Как удалить плохие SEO-ссылки и очистить ссылочную массу сайта

В 2023 году Одноклассники пресекли более 9 млн подозрительных входов в учетные записи

MySQL, огромная таблица, ускорение выбрки