- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Достаточно интересная задача встала передомной. Необходимо сделать поиск, причем морфологический поиск по базе статеек. Эти статейки взяты из периодических новостных изданий.
За 2 дня перечитал много всякой информации по поиску и его реализации, но ничего конкретного по алгоритмам реализации не нашел :(
Может кто-нибудь, что-нибудь уже делал или сделал? Посоветуйте, подскажите плиз.
Пишу на PHP, использую rumor для нахождения словоформ.
на этом подфоруме поищите информацию.
rubb, здесь смотрели?
Важно знать где ваши статейки - в базе, в хтмл.
В любом случае можно попробовать Yandex.Server - причем совершенно бесплатно - искать в технологиях яндекса
Когда-то делал простенький поисковик с учетом морфологии.
Берем список окончаний, список слов исключений (у которых конец слова может совпадать с каким-то окончанием, но реально это не окончание)
Эти списки брал у "Ищейки".
И вперед к индексации!
Делаем разбор текста, помещаем в индекс остатки слов без окончаний. Ну а формулу релевантности на сколько фантазия позволит :)
Можно даже как у Яндекса на РОМИП описано, пассажи, мягкость и все такое.
Когда-то делал простенький поисковик с учетом морфологии.
Берем список окончаний, список слов исключений (у которых конец слова может совпадать с каким-то окончанием, но реально это не окончание)
Эти списки брал у "Ищейки".
И вперед к индексации!
Делаем разбор текста, помещаем в индекс остатки слов без окончаний. Ну а формулу релевантности на сколько фантазия позволит :)
Можно даже как у Яндекса на РОМИП описано, пассажи, мягкость и все такое.
Это стемминг - поищите, есть готовые модули и для русского. Перловым могу поделится :)