- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
В 2023 году 36,9% всех DDoS-атак пришлось на сферу финансов
А 24,9% – на сегмент электронной коммерции
Оксана Мамчуева
Что делать, если ваша email-рассылка попала в спам
10 распространенных причин и решений
Екатерина Ткаченко
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Но это уже совсем иная история.
Да, это как раз реализуется стеммингом (вычленение основы слова). Функцию сходу не подскажу, но во многих CMS, поисковых скриптах ее можно позаимствовать за 5 минут:)
Функцию сходу не подскажу, но во многих CMS, поисковых скриптах ее можно позаимствовать за 5 минут
улыбнуло...
Из реально работающих и доступных видел только яшин http://company.yandex.ru/technology/mystem/ . А на счет CMS - это слишком любительские продукты для того, чтобы иметь внутри себя что-то серьезное.
улыбнуло...
Взаимно:)
Морфологический анализ и Стемминг - это разные вещи, причем последний реализуется достаточно простыми алгоритмами, и словари для этого совершенно ни к чему. Разумеется, результаты тоже разные, но у стемминга и не стоит задача полного морфологического анализа, он используется как раз для таких случаев.
Вставлю свои пять копеек. У меня нужный ТС алгоритм используется при выводе сниппетов.
Реализуется все достаточно просто:
RuMor — дешевый и сердитый морфологический анализатор, включает в себя словарь в семь мегабайт, пхп и перл-скрипты для работы, неплохо подходит для извлечения основ слов и построения индексов. Для слов, которые РуМор не в состоянии осилить, использую «классический» стеммер Портера (в качестве примера подойдет версия Котерова).
улыбнуло...
Из реально работающих и доступных видел только яшин http://company.yandex.ru/technology/mystem/ . А на счет CMS - это слишком любительские продукты для того, чтобы иметь внутри себя что-то серьезное.
Ай, не все так сложно.
У меня на diff.biz.ua/keywords.php и стемминг, и морфология юзается. И ничего сложного там нет...
DenIT, sokol_jack, просто привык если делать, то делать. А то получаются очень кривые вещи. Когда используется простая форма стемминга - получается все хорошо, ровно до тех пор, пока тексты написанны без особых изощрений. Попробуйте вспомнить скольок путаницы было на тойже вики лет 5-7 назад. Видимо тоже использовались упрощенные алгоритмы...
У меня на diff.biz.ua/keywords.php и стемминг, и морфология юзается. И ничего сложного там нет...
прикольно. действительно, для большинства обшетематических сайтов подойдет