Оптимизация Fulltext поиска в MySQL

163

Metal Messiah

2 октября 2015, 21:41

1329

Доброй ночи!

Под статьей выводится блок похожих статей по теме (ссылки).

Было когда-то давно через LIKE, потом переделал через fulltext / against.

Сейчас база чуть выросла и такой поиск занимает 10 секунд и выше, что существенно увеличивает время загрузки страницы. Что посоветуете с этим делать?

Отдельную таблицу создать и кешировать в ней на некоторое время результаты поиска похожих статей? С имеющейся больше ничего нельзя сделать для ускорения?

CREATE TABLE IF NOT EXISTS `news` (
`id` int(8) unsigned NOT NULL AUTO_INCREMENT,
`date` int(4) unsigned DEFAULT NULL,
`section` int(1) unsigned DEFAULT NULL,
`title` varchar(255) DEFAULT NULL,
`text` text,
...
PRIMARY KEY (`id`),
KEY `section` (`section`),
FULLTEXT KEY `title` (`title`)
) ENGINE=MyISAM DEFAULT CHARSET=cp1251 AUTO_INCREMENT=423210 ;

SELECT * FROM news WHERE MATCH (title) AGAINST ('isis вернулась воевавшая домой израильтянка') AND id<>100 ORDER BY date DESC LIMIT 10

anonymous, думай что говоришь и не забывай подписать отзыв :)

197

lutskboy

3 октября 2015, 08:49

#1

кешировать похожие статьи либо в бд прописать для самой статьи id похожих а при последующих запросах выводить уже готовые похожие по id а не делать каждый раз фуллтекст поиск

Сейчас база чуть выросла и такой поиск занимает 10 секунд

на сколько выросла что поиск занимает 10 сек?

возможно хостинг сменить нужно

1

Вопрос к SEO специалистам: Пара вопросов спецам по Кеширование страниц сайта

57

alexbalance

3 октября 2015, 09:17

#2

Metal_Messiah:
Что посоветуете с этим делать?

поставить на сайт поиск от Яндекса или Гугла ))) а если это не подходит то посмотрите эту статью по оптимизации MYSQL http://code.tutsplus.com/tutorials/top-20-mysql-best-practices--net-7855

1

163

Metal Messiah

3 октября 2015, 10:31

#3

Ну сейчас AUTO_INCREMENT=423210, раньше помню когда было 200к записей. Не помню когда именно менял алгоритм, возможно как раз когда было 200к.

Хостинг врядли. Двиг писался больше 6 лет назад, опыта было мало, хостил на хостинге за $1 в месяц. Когда меня оттуда турнули за нагрузку пару лет назад я перебрался сразу на VPS - база загнулась за пол часа после переезда, после чего я все максимально оптимизировал что мог. На серваке еще ресурсы есть, кроме этого сайта там еще несколько, при этом нагрузка CPU не 100%. Не думаю что нужно менять хостинг.

Единственное что я пока не понимаю - раньше было 10к в сутки посетителей, но с начала года Яндекс что-то мутит и с февраля у меня 1-2к, а тормоза жестче стали.

ОК, так и думал что нужно результаты поиска кешировать на скажем пару суток, чтобы новые статьи в "похожие" добавлялись, но поиск шел по индексам и нагрузка была меньше. Для самой статьи нет, только в отдельную таблицу. Просто очень не хочу делать теги как в DLE - мне такая реализация не нравится.

Поиск от Яндекса ерунда, чтобы он был актуален нужно быстрое попадание в индекс чего сейчас нет.

Указанную статью когда-то читал, половина из этого уже применяется.

Бесплатный домен и хостинг Оптимизация скриптов Страницы стали дольше попадать

133

Хелпзонович

3 октября 2015, 10:53

#4

поставить sphinx и не мучать mysql. Или эта беда на хостинге?

Вы там держитесь! Хорошего вам настроения. Здоровья.

163

Metal Messiah

3 октября 2015, 10:56

#5

Из базуки по воробьям... Обычный поиск по сайту, зачем там сложные поисковые движки.

Это не главное, я изначально говорил о подборе похожих новостей по теме.

---------- Добавлено 03.10.2015 в 15:50 ----------

Еще один вопрос, позволю себе задать тут же, хотя тема другая.

В каждой категории идет постраничный вывод новостей от новых к старым. Как уменьшить время запросов вида

SELECT * FROM news WHERE section=1 ORDER BY id DESC LIMIT 86540,20

для очень больших номеров страниц?

Выборка из sql как Работают или не работают Дублирование контента

197

lutskboy

3 октября 2015, 14:07

#6

SELECT * FROM table JOIN (SELECT id FROM table ORDER BY id LIMIT 1000000, 10) as b ON b.id = table.id

1

437

totamon

3 октября 2015, 15:47

#7

Metal_Messiah:
для очень больших номеров страниц?

какое значение номер страницы может иметь на время запроса? БД без разницы откуда делать выборку из начала таблицы или из конца, главное чтобы у вас нормальные индексы были прописаны.

---------- Добавлено 03.10.2015 в 20:48 ----------

Metal_Messiah:
Из базуки по воробьям...

это про использование fulltext для вывода похожих новостей)

1

Домены и хостинг https://8fn.ru/regru | Дедик от 3000р https://8fn.ru/73 | VPS в Москве https://8fn.ru/72 | Лучшие ВПС, ТП огонь, все страны! https://8fn.ru/inferno | ХОСТИНГ №1 РОССИИ https://8fn.ru/beget

Помогите оптимизировать запрос MySQL Последние новости на главной Подскажите с запросом для

163

Metal Messiah

3 октября 2015, 16:14

#8

С "читайте также" разобрался, через пару дней сравню среднюю нагрузку с прошлым периодом.

какое значение номер страницы может иметь на время запроса?

Грубо говоря 5000 страниц по 20 постов на страницу дают то самое значение индекса из запроса. У меня свой лог медленных запросов, включающий время запроса, адрес запрошенной страницы, сам запрос и еще много чего. В нем полно подобных запросов для больших номеров страниц т.е. больших значений индекса.

БД без разницы откуда делать выборку из начала таблицы или из конца

Практика показывает что это не так. Возможно из-за прохода по большому файлу с записями переменной толщины.

главное чтобы у вас нормальные индексы были прописаны

индекс id и категория - все по чему делается WHERE.

SELECT * FROM table JOIN (SELECT id FROM table ORDER BY id LIMIT 1000000, 10) as b ON b.id = table.id

А в чем прикол? Все равно идет чтение индексов из таблицы с динамическим размером записи, а потом по этим индексам подтягиваются остальные поля.

Php сайт без MySql Как вы думаете имеет Оптимизация MySQL

N

419

netwind

4 октября 2015, 00:05

#9

Ну попробуйте для разнообразия optimize table . Обычно это бесполезная операция, но для таких индексов может помочь.

Кнопка вызова админа ()

197

lutskboy

4 октября 2015, 08:44

#10

SELECT * FROM table JOIN (SELECT id FROM table ORDER BY id LIMIT 1000000, 10) as b ON b.id = table.id

А в чем прикол? Все равно идет чтение индексов из таблицы с динамическим размером записи, а потом по этим индексам подтягиваются остальные поля.

Ну если новостей тысячи то прикол есть. Можете по експерементировать.

1

В 2023 году 36,9% всех DDoS-атак пришлось на сферу финансов

Как снизить ДРР до 4,38% и повысить продажи с помощью VK Рекламы