- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
VK приобрела 70% в структуре компании-разработчика red_mad_robot
Которая участвовала в создании RuStore
Оксана Мамчуева
Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ
Экспертная оценка Адмитад
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Есть ли какой-либо более менее широко признанный формат хранения словарных списков - достаточно компактный и достаточно эффективный?
То есть - как решается задача использования и хранения функциональной связи (туда и обратно!) между рядом натуральных чисел и алфавитно упорядоченным набором ... ммм ... лексических единиц?
Типа того, что можно изобразить таблицей:
id Word
1 аа
2 ААА
3 ааааа
4 Аал
5 АБ
6 Аба
7 Абабково
8 Абабурово
9 Абага
10 Абагайтуй
11 Абагур
12 Абагурской
13 Абагурт
14 Абадзехская
15 Абаевский
16 абажур
17 абажура
18 абажурам
19 абажурами
20 абажурах
21 абажуре
22 абажуров
23 абажуром
24 абажуру
... ...
Морфологический анализатор имени Коваленко.
Морфологический анализатор имени Коваленко.
- на данном этапе мне нужно что-то более формальное: отслеживать "родство" между
в-обр-ать
и
в-бер-у
- мне не нужно.
На пересечении этой темы и Q: что принято считать "словоформой"? :
знает ли кто-нибудь что-нибудь о таких ПОСТАНОВКАХ ЗАДАЧИ - составить как можно более полный список (как бы - словарь) словоформ, встречающихся в предельно широком (русскоязычном) контенте?
Мне кажется, что - на уровне здравого смысла - формулировка достаточно понятная. Черт, как всегда, - в деталях.
Кстати, поверхностно: простая схема "слово-id"- не учитывает словоформ.
Посмотрите, и правда, как построен словаь у Андрея Коваленко (кстати, почему "имени Коваленко"?). У Коваленко есть демо-версия. Посмотрите. Потестите.
Я понимаю, что это два РАЗНЫХ подхода:
1. поддерживать словарь ПАРАДИГМ (то бишь - СЛОВ) и ГЕНЕРИРОВАТЬ слофовормы
2. поддерживать словарь СЛОВОФОРМ, а с парадигмами - РАЗБИРАТЬСЯ на этапе анализа.
- каждый- имеет свои плюсы и минусы.
Я обсуждаю второй путь ...
!Иван FXS,
второй путь представляется мне более ресурсоемким. а вообще, я как новичок в этой области, советовать ничего не берусь.