Как ускорить sql запрос?

162

Mister_Black

14 августа 2017, 20:51

2478

Всем привет.

Есть такой запрос он проверяет наличие дублирующих строк в таблице wp_posts по полю post_title и удаляет дубли, всё бы ничего, но когда я его использую то скрещиваю пальцы чтобы БД не рухнула, выполняется он примерно от 3 до 5 минут

ALTER IGNORE TABLE wp_posts ADD UNIQUE INDEX titleindex (post_title(255)) ;

ALTER TABLE wp_posts DROP INDEX titleindex;

сканируется 360000 строк

можно ли как то ускорить его, может какие то значения в my.cnf надо добавить-увеличить, пробовал увеличивать key_buffer_size до 512M, не помогло, может ещё что то надо подкрутить? на vps имеется 2гб памяти.

45

NothingMatters

14 августа 2017, 21:08

#1

А зачем эти выкрутасы с индексом, когда можно просто выбрать все title, найти дубли и через DELETE удалить? Это будет явно быстрее чем строить индексы каждый раз.

1722

LEOnidUKG

14 августа 2017, 21:25

#2

Эм, а если оставить уникальный индекс по титлу и всё. О таком не думали? И дубли просто физически не добавятся.

✅ Мой Телеграм канал по SEO, оптимизации сайтов и серверов: https://t.me/leonidukgLIVE ✅ Качественное и рабочее размещение SEO статей СНГ и Бурж: https://getmanylinks.ru/

396

Оптимизайка

14 августа 2017, 21:26

#3

NothingMatters:
можно просто выбрать все title, найти дубли и через DELETE удалить?

ALTER IGNORE TABLE ADD UNIQUE INDEX именно это и делает.

⭐ BotGuard (https://botguard.net) ⭐ — защита вашего сайта от вредоносных ботов, воровства контента, клонирования, спама и хакерских атак!

45

NothingMatters

14 августа 2017, 21:27

#4

Оптимизайка:
ALTER IGNORE TABLE ADD UNIQUE INDEX именно это и делает.

Да, но учитывая то, как у wp "оптимизированны" таблицы, и сколько там мусора, я бы возложил эту задачу на просто скрипт в 10 строчек.

775

edogs software

14 августа 2017, 21:27

#5

NothingMatters:
А зачем эти выкрутасы с индексом, когда можно просто выбрать все title, найти дубли и через DELETE удалить? Это будет явно быстрее чем строить индексы каждый раз.

В среднем по палате быстрее не будет, но для снижения нагрузки и сохранения целостности базы - лучше на ВП удалять дубли пхп скриптом, не забывая отслеживать связи.

Mister_Black:
Всем привет.
Есть такой запрос он проверяет наличие дублирующих строк в таблице wp_posts по полю post_title и удаляет дубли, всё бы ничего, но когда я его использую то скрещиваю пальцы чтобы БД не рухнула, выполняется он примерно от 3 до 5 минут

ALTER IGNORE TABLE wp_posts ADD UNIQUE INDEX titleindex (post_title(255)) ;
ALTER TABLE wp_posts DROP INDEX titleindex;

сканируется 360000 строк

можно ли как то ускорить его, может какие то значения в my.cnf надо добавить-увеличить, пробовал увеличивать key_buffer_size до 512M, не помогло, может ещё что то надо подкрутить? на vps имеется 2гб памяти.

Так создайте один раз уникальный индекс и оставьте его. Раз Вас заботит только уникальность (и не заботят например потерянные связи с тэгами и т.д.).

Чисто не там где убирают, а там где не мусорят:) Уникальный индекс спасет Вас от создания дублей.

Разработка крупных и средних проектов. Можно с криптой. Разумные цены. Хорошее качество. Адекватный подход. Продаем lenovo legion в спб, дешевле магазинов, новые, запечатанные. Есть разные. skype: edogssoft

Сайт всё ниже в Нужно ли для всех CMS для потрала с

396

Оптимизайка

14 августа 2017, 21:28

#6

NothingMatters, ваш скрипт будет работать медленнее.

45

NothingMatters

14 августа 2017, 21:30

#7

Оптимизайка:
NothingMatters, ваш скрипт будет работать медленнее.

Мой скрипт не будет вешать базу.

MB

162

Mister_Black

14 августа 2017, 23:02

#8

Насчёт уникального индекса, попробую, может и получится.

Дубли попадают из rss фида, новости на сайт добавляются с помощью плагина feedwordpress, если он заработает после добавления уникального индекса на post_title тогда это решит проблему.

MB

162

Mister_Black

15 августа 2017, 16:27

#9

Нет, с уникальным индексом не получается, feedwordpress отказывается вообще добавлять новости на сайт.

Придётся искать другое решение.

334

TF-Studio

15 августа 2017, 16:56

#10

добавьте поле хеш

и md5 - это быстрее будет (или искать по хешу или сделать уникальным, к примеру)

Всё ещё лучший способ заработка для белых сайтов: GoGetLinks (https://www.gogetlinks.net/?inv=fahbn8).

Маркетинг для шоколадной фабрики. На 34% выше средний чек

В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах