- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

Что делать, если ваша email-рассылка попала в спам
10 распространенных причин и решений
Екатерина Ткаченко
Может, я и путаю, но насколько я понял, в первых постах шла речь о морфоизменениях (полных лексемах). Это умещается и в 300К, как я сказал.
Дополнительные 50К нужны на морфоинформацию (часть речи, число, падеж, спряжение и т.д.).
Может, я и путаю, но насколько я понял, в первых постах шла речь о морфоизменениях (полных лексемах). Это умещается и в 300К, как я сказал.
Дополнительные 50К нужны на морфоинформацию (часть речи, число, падеж, спряжение и т.д.).
Просто, наверное, правила раскрутки префиксов-суффиксов уже практически всю морфологическую информацию содержат, потому как, например, ать -> ал, ать -> аю только глаголам (и еще кажется деепричастиям применимы) то бишь, чтобы отличать одно от другого еще один битик нужен. Если так, то мы просто говорим об одном и том же, но разными словами.
Не совсем так:
"правила раскрутки" - это и есть морфоизменения, но не морфоинформация. У нас это самое "практически" превратить задаром в полную информацию о данной словоформе, и о ее лексеме не получилось. Вот и потребовались эти 50К. Но, может, еще более дешевое решение и существует.
Ну тогда у меня есть сомнения, потому как информация о морфоизменениях + указатели (как миниум один на каждое слово) дают 100 кб прибавочной массы, оставляя 200 кб на хранение одно текста. Вот я сейчас пойду в разные конференции по сжатию данных и спрошу людей, знают ли они хоть один алгоритм сжатия слабокоррелирующего текста (то есть общие основы уже выделены и даже приставки может быть отрезаны) размером 1 мб в 200 кб :-) Посмотрим, что они скажут.
Ну вот Вы уже и засомневались. Вроде, практически все, что помню, Вам рассказал. Повторяться уж не буду. Единственно, что не забывайте, что это не абстрактная информация в 1Мб, а именно русский язык.
она не абстрактная, однако есть подзрение, что повторяемость внутри словаря, или другими словами энтропия, не слишком велика. какой-нибудь gzip сжимает такие данные максимум в три раза. к тому же, я подозреваю, что пойнтеры могут занимать даже больше места, чем я описал, а необходимость выравнивать битовые последовательности по границе байтов, когда мы приходим в разветвляющийся узел вносит дополнительные накладные расходы. какие точно? я не знаю. а, вообще, это увлекательная тема. я не видел пока еще ни одного серьезного исследования, посвященному именно словарному сжатию.
Ну вот Вы уже и засомневались. Вроде, практически все, что помню, Вам рассказал. Повторяться уж не буду. Единственно, что не забывайте, что это не абстрактная информация в 1Мб, а именно русский язык.
Зодчий, прекратите паясничать. Если еще раз в личке будут шутки с itman, можете серьезно пострадаете. // Модератор
/ru/forum/comment/1105544
будьте добры поясните пожалуйста уважаемый модератор в чем именно я паясничал и в чем были шутки? не нашел к сожалению контактной информации чтобы задать вопрос персонально вам, если не сложно после прочтения удалите этот пост
Уважаемый Модератор, меня поняли превртано. Я имел в виду, что Зодчий, как раз был второй жертвой хулиганства со стороны (я написал предположительно кого). Может это и не хулиганство, а все-таки баг? Можно же ведь это проверить по логам, кто заниматеся таким недостойным дело?
Зодчий, прекратите паясничать. Если еще раз в личке будут шутки с itman, можете серьезно пострадаете. // Модератор
/ru/forum/comment/1105544
будьте добры поясните пожалуйста уважаемый модератор в чем именно я паясничал и в чем были шутки? не нашел к сожалению контактной информации чтобы задать вопрос персонально вам, если не сложно после прочтения удалите этот пост