- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Зачем быть уникальным в мире, где все можно скопировать
Почему так важна уникальность текста и как она влияет на SEO
Ingate Organic
В 2023 году 36,9% всех DDoS-атак пришлось на сферу финансов
А 24,9% – на сегмент электронной коммерции
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Нужно определить релевантность документа запросу. По принципу "соответствует/не соответствует". У каждого документа имеется список ключевых слов и определение соответствия документа запросу должно основываться только на анализе этого списка (он уже заранее задан). Запрос представляет из себя одно или несколько слов. Документ считается релевантным запросу, если не менее половины слов или их словоформ запроса присутствуют в списке ключевых. Основная сложность - как определить, является ли слово словоформой другого? Алгоритм не обязательно должен быть точным (т.е. допускаются ложные распознавания/нераспознования), но должен быть простым и не использовать словарь или его заменители, т.к. должен уметь обрабатывать и всякую кракозябрицу и понимать что
бокренок - словоформа бокра.
бокренок - словоформа бокра.
Боюсь,что на сегодня вряд-ли Вы найдете программу с такой функцией.
Мне пока такую проблему не удалось решить,а хотелось-бы
Это реализовано в программе PagePromoter
Вот это не совсем понятно... половина чего и от чего ?
Иначе говоря, нужно определять словоизменение и словообразование, при этом не используя словаря. Вероятно, словари суффиксов-приставок-окончаний также использовать нельзя. Тогда задача в данной постановке сводится к пустяку: написать алгоритм преобразования слов естественного языка. Тогда ключевым словом становится - "не обязательно точный". В этом случае годится практически любой алгоритм сравнения по буквам, например, сравнивающий последовательность N букв в слове (n-граммы). В случае n=4 этот алгоритм прекрасно сведет бокра и бокренка. Формально все в порядке, конечно, если не обращать внимания на вероятность ошибок :)
бокренок - словоформа бокра.
Без словаря можно использовать только стемминг - то есть описать все классы разрешенных суффиксов/окончаний. Почему он не подходит, если допускаются ложные распознавания?
Насколько я понял, из-за "кракозябрицы". Хотя распознать во многих случаях неправильной кодировку - задача решенная, и довольно давно, если правильно помню, то самим Марковым (вероятности дву- и триграмм). Однако, может, у Des, были дополнительные соображения.
(Не в целях рекламы) Мммм а как на счет вероятностного стэммера А. Коваленко?
Насколько я понимаю, речь идет о бессловарном морфологическом анализе.
Наш модуль морфологии вроде бы такие проблемы решал.
http://www.rco.ru