- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
И в базе состоящего из 500К записей Mysql охеревает от каждого такого запроса.
500к фигня, да и от фуллтектс поиска охреневает не меньше
Хз, фуллтекст, на более менее объемах, на моих задачах, стабильно дает приемлемый результат. Прилично меньше 1сек на вполовину меньшее кол-во. Правда с недобазой скулайт. На Mysql, вероятно тоже самое - одно дело индекс, другое - перебрать все с регэксп. Давно не юзал Mysql
стеммер там какой? Плюс переколдовки, терминами яндекса.
Ну типа запрос "1000106 колец поршневых"
Никакой фуллтекст не поймет, что колец и кольца это одно и тоже. Даже со стеммером, лемматизация поможет.
Но, не всегда, плюс ресурсоемко на каждый запрос .В данном случае,
при условии добавления
результат на картинко, а без этого - колец == кольц
Но, это не совсем верный запрос для поиска. Сам ищу.
500к фигня, да и от фуллтектс поиска охреневает не меньше
фуллиндекс ИЗИ обрабатывает 2 ляма записей на обычном HDD, индекс потом вообще закидывается в памяти и диск более не трогается. И там поиск 0,001 секунды происходит.
%LIKE% вообще не использует индексы т.е. это полностью перебор всей таблицы при каждом запросе. А это может быть и 30 минут легко.
Добавлю
Без шума в виде номера. Т.е. запрос "колец поршневых"
Без колец == кольц
если так
то только 1 ответесли так
то -- Result: 1877 rows returned in 28ms
С колец == кольц
А всего то дали понять, что колец == кольц
---------- Добавлено 19.10.2019 в 02:01 ----------
И так, на всякий
без сортировки по бм25, тупо по порядку
Ну или как то так
или так
если не перепутал 1 ссылку со второй
%LIKE% вообще не использует индексы т.е. это полностью перебор всей таблицы при каждом запросе. А это может быть и 30 минут легко.
Да, и в этом главная засада LIKE, естественно. Да и в принципе FTX и нужен для гибкого и быстрого поиска с размытыми критериями, морфологией, настройками весов и проч. Но при небольших объёмах и простых задачах лайк вполне годится.
Геокодирование от "сторонних сервисов" есть. Вполне справляется. Можно приводить адреса к "единому виду" и искать с учётом этого..
Не так все просто. Адрес "ул. Петрова 16" сторонний сервис превратит в "ул. Петрова 17", если у этого стороннего сервиса дома номер 16 в базе нет. И адрес "ул. Петрова 18" - тоже. А адрес "ул. Петрова 16, квартира 23" - сторонний сервис превратит в "ул. Петрова 23", при условии если у сервиса в базе дом 23 есть, а дома 16 нет.
Таким образом у вас в исходном состоянии у вас было два разных адреса, а после использования "стороннего сервиса" - одинаковый. Или наоборот было два одинаковых дома с разной квартирой, - а стало два разных дома.
А еще могу рассказать, как сторонние сервисы интерпретируют "ул. Петрова 16/2" и "ул. Петрова 16 корпус 2" и "ул. Петрова 16/2 корпус 3". Корпуса не во всех городах РФ широко распространены, но есть такие города где "корпус" встречается чуть ли не в половине всех адресов.
А еще вот есть в городе проспект Гагарина, улица Гагарина, и бульвар Гагарина. Допустим адрес "ул. Гагарина 17" существует, а "проспект Гагарина 17" не существует. Что сделает сторонний сервис, если вы ему загадаете "Гагарина 17" или "пр. Гагарина 17"? Я уже не помню ответа на эти вопросы если честно, разбирался давно, но что-то не очень умное.
Если у вас адреса из коммунальных квитанций, то процентной долей ошибок можно пренебречь. А вот если у вас:
- адреса офисов фирм.
- адреса торговых точек.
- адреса объектов недвижимости.
- любые адреса в которых могут быть преднамеренные ошибки.
То никакой сторонний сервис не решит проблему поиска по адресам.
А еще у некоторых сторонних сервисов есть жесткие лимиты на количество запросов к геокодеру и конский прайс при превышении лимитов. Не будем называть имен, хотя речь про гугл. Поэтому их данные не всегда возможно использовать даже не для дела, а чисто в справочных целях.