- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ
Экспертная оценка Адмитад
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Интересует такой вопрос, когда я в поисковой системе делаю запрос, например
Dainkin FTXS25G / RXS25G
то поисковик мне находит страницы, где это словосочетание может быть записано
Dainkin FTXS25G/RXS25G (без пробелов)
Dainkin FTXS25G (RXS25G) - со скобками в любых вариантах
и другие варианты написания этой модели кондиционера
Как реализуется поиск в тексте таких близких по написанию слов?
Может быть для этого есть какие-то алгоритмы?
конечно есть какие-то алгоритмы - притом тривиальные. в вашем конкретном примере все 3 варианта:
"Dainkin FTXS25G RXS25G" -
можно привести к такому виду как при индексировании, так и при поиске.
Спасибо, а можно хотябы название или ссылочку где поискать?
тут как раз есть топик по литературе - я там линк на книжку кинул - если интересно тему дальше копать - "поворушите" данный форум - в архиве много чего интересного.
а конкретно про ваш вопрос - чего тут читать то :) достаточно просто самому попытаться написать поисковик (с индексацией либо без) - немножко подумать как google ищет так быстро и на подобные темы... конечно мой предыдущий ответ сводит все к тривиальному отбрасыванию ненужной информации, которая если развивать задачу дальше - может оказаться нужной... ну тут я не помогу - все рассписывать не хочу - как я бы делал... да и книжка "Введение в информационный поиск" - думаю много чего расскажет лучше - сам хочу почитать, полистать.
Спасибо за ответы с нулевой информационной ценностью.
Если кто будет искать подобное - вот названия и краткие описания методов:
http://code.google.com/p/google-refine/wiki/Clustering
ну почему же с нулевой ценностью... по вами приведенной ссылке есть там понятие нормализации к примеру, ASCII символы, использование одного регистра для букв. Да про n-граммы я не упомянул и про оценку... ну я докторских по теме не защищал - так кулибин - извиняй.
На мой взгляд вполне полезная информация - это мое ИМХО =)