- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах
Это на 45% больше, чем в 2022 году
Оксана Мамчуева
Что делать, если ваша email-рассылка попала в спам
10 распространенных причин и решений
Екатерина Ткаченко
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
есть MySQL FULLtext
подскажите, есть ли поиск красивый который обработает синонимы русский (морфология) и:
(желательно укр. и англ.)
1) а как сделать чтобы откорректировать поиск если не правильно ввелось слово с раскладкой?
2) и как исправить орфографию на ходу?
Сахор = Сахар
3) и т.д. как у яндекса
нету ли решения, или нужно изобретать это?
Sphinx - это делает? я еще видел яндекс такую программу выпустил
но тут в статье не написано http://habrahabr.ru/blogs/sphinx/47908/
про морфологию, и как ее включить фиг ее знает...
я нашел модули для обработки http://www.opennet.ru/prog/info/2062.shtml
но я не думал что я буду велосипед писать в 21 веке
есть ли решения?
Мне кажется, это вопрос из серии "А на каком движке работает Яндекс?".
Если поставлена задача это реализовать силами MySQL, то я бы отдавал MySQL-ю уже "подготовленный" контент (единственное число, именительный падеж и пр.).
И соответствующим образом "причёсывал" бы и поисковые запросы.
Т.е. возложил бы проблемы морфологии/орфографии/и пр. не на MySQL, а на программный интерфейс.
Вообще, то что вы спрашиваете - это всё очень и очень сложно.
В мильён раз сложней, чем просто полнотекстовый поиск. Как по реализации, так и по нагрузке на оборудование.
Так что для несерьёзного проекта это всё не нужно/не рентабельно, а для серьёзного - лучше пригласить математиков :)
Нормальные алгоритмы "на шару" вряд ли удастся найти.
;6099770']
Вообще, то что вы спрашиваете - это всё очень и очень сложно.
Соглашусь с umka, задачу вы ставите очень серьезную. Такой ли серьезный проект вы делаете?
[umka], полностью согласен с вами. Эта задача очень и очень сложная и не решается путем установки 1-го скрипта.
]1) а как сделать чтобы откорректировать поиск если не правильно ввелось слово с раскладкой?
2) и как исправить орфографию на ходу?
Сахор = Сахар
Если тут ещё можно самому что нибудь придумать, например сравнивать запрашиваемые слова с полной базой русских слов, или что нибудь в этом роде.
То тут:
3) и т.д. как у яндекса
По мне просто не реально, так как и яндекс и гугл в этом случае используют для сравнения свою базу запрашиваемых ключевых слов и очень сложные математические формулы.
Sphinx .
подскажите, есть ли поиск красивый который обработает синонимы русский (морфология) и: (желательно укр. и англ.)
почти никак. Морфология даже для Яндексов с Гуглами до сих пор не решенная окончательно задача... Морфология это вообще штука забавная... Единственное правильное решение (которым все и пользуются) - это сравнение по маске на основании готовых (правильных) словарей. Такую возможность дают те же ispell словари, которые в основе всех клонированных продуктов лежат. Они решают задачу не идеально, но достаточно полно. Так, например, словарь Даля ок. 190 тыс. слов, Академический словарь современного русского 60-х годов ок. 120 тыс., в словаре же Лебедева для ispell ок. 130 тыс. основ из которых на основании правил выделяется больше миллиона словоформ с которыми собственно и будете сравнивать свою поисковую строку.
Для английского ispell словооснов ок. 60 тыс... (для сравнения: Оксфордский словарь ок. 300 тыс. статей, Англо-русский словарь Мюллера. 67 тыс. слов)
Синонимы - а где базу взять толковую синонимов? К словарям Hunspell прилагаются листинги тезауруса - но они не совершенны.
1) а как сделать чтобы откорректировать поиск если не правильно ввелось слово с раскладкой?
Попробовать угадать раскладку пользователя, на основании системного языка, и дальше если введенное не соответствует словарю - попробовать конвертнуть и еще раз сверить со словарем.
2) и как исправить орфографию на ходу?
Сахор = Сахар
3) и т.д. как у яндекса
Никак... Гадание на кофейной гуще в котором тот же Яндекс путается, другое дело что Яндекс имеет частотную базу запросов и может гадать вероятностно... Т.е. выбирать варианты не просто наобум по маске, а еще и выбирать наиболее часто запрашиваемые варианты.
но я не думал что я буду велосипед писать в 21 веке
Велосипеда как такового еще нет... Есть пока только самокаты... Если Вам удасться его изобрести хотя бы для русского (что сомнительно), то те же "самокатчики" вроде Яндекса с Гуглем с удовольствием у Вас его купят...
;6099770']лучше пригласить математиков
очень сложные математические формулы.
В том то и проблема, что математика в делах морфологии никак вообще не рулит...
понятно, всем спасибо!!
проект действительно не серьезный, просто я стаью хотел написать по построению поиска, рассматривал варианты... пытался писать некие алгоритмы для выдачи http://www.x0.org.ua/view_content/84
мне говорили что Sphinx не решает все проблемы
===
вообщем пока остановлюсь на Sphinx....
может вам проще использовать уже готовые решения
http://site.yandex.ru/
http://xml.yandex.ru/
http://company.yandex.ru/technology/server/
А не изобретать велосипед.
Задача реально не простая.