синонимайзер под РУ, база 2,5к

mustofik
На сайте с 15.05.2005
Offline
112
#411
Zizizi:
чего то жму на кнопку выполнить или на кнопку сохранить ничего не происходит

выберите импортируемый файл в формате TXT,

dimaslenin, отличное дополнение к основной проге,

сразу пару замечаний:

- не работает импорт файлов в формате Word

хотелось бы увидеть в ближайшее время

1) возможность отсеивать слова, для которых в ворде нет синонимов

2) перенос по строкам (т.е. чтобы убрать горизонтальную прокрутку)

эти два улучшения позволят в несколько раз улучшить производительность работы с тузлой,

dimaslenin, одним словом респект, надеюсь прислушаетесь к рекомендациям)

Snowman
На сайте с 29.05.2006
Offline
80
#412
Zizizi:
чего то жму на кнопку выполнить или на кнопку сохранить ничего не происходит

при выборе файла прога берет его в кавычки: "С:\..." - в итоге ничего не происходит. Если кавычки убрать вручную - все отлично обрабатывается ;) и .txt и .doc

(это у меня так - dimaslenin, проверьте и исправьте, если подтвердится)

mustofik:

1) возможность отсеивать слова, для которых в ворде нет синонимов

+1 присоединяюсь))

ЗЫ. А за утилиту спасибо - обработал ею текст, а потом прогнал через синонимайзер - вышла схожесть всего 32% ! правда текст немного дорвейный, но это еще пошаманить немного надо))

Дизайн сайтов + готовые макеты на продажу (от 35wmz) (/ru/forum/840033)
D
На сайте с 01.03.2008
Offline
88
#413

Snowman, ага на счет кавычек - есть такое дело, уже поправили, завтра разошлем :)

mustofik, над этим уже задумались, скоро будет ;)

В общем спасибо за поддержку!

[Удален]
#414
mustofik:
выберите импортируемый файл в формате TXT,
dimaslenin, отличное дополнение к основной проге,
сразу пару замечаний:
- не работает импорт файлов в формате Word
хотелось бы увидеть в ближайшее время
1) возможность отсеивать слова, для которых в ворде нет синонимов
2) перенос по строкам (т.е. чтобы убрать горизонтальную прокрутку)
эти два улучшения позволят в несколько раз улучшить производительность работы с тузлой,
dimaslenin, одним словом респект, надеюсь прислушаетесь к рекомендациям)

про импорт файлов в формате Word пожалуйста подробнее, не совсем понятно.

отсев слов выполнен и уже доступен в новой версии

по поводу переносов строк, так выполнено для сохранения формата словаря хранящегося в текстовом файле, т.е. одна строка это слово и синонимы к нему. если наберется достаточное количество голосов :) по этому поводу то добавим возможность переключения режимов, т.е. хотите с переносами, хотите без переносов.

Eles
На сайте с 28.04.2006
Offline
47
#415

Класс-класс. Поиск синонимов - просто чудо, как в тему.

И работает тоже чэдно.

но вот иногда у меня выдает ошибку программа и не могу понять что за ...

начинает искать, а потом прерывается и пишет "Ошибка тезауруса. Текущий сеанс сбора синонимов завершен". Стоит MS Офис 2003, файл формата txt

Может потому что это была книга Дарьи Донцовой

Дмитрий, вы в программу "хороший вкус" не закладывали? :)

Eles добавил 03.10.2008 в 10:25

Хотя на doc тоже иногда подглюкивает. Есть ограничение на размер файла?

Хотелось бы "Война и Мир" Толстого обработать, чтобы побольше, побольше синонимов найти.

[Удален]
#416

Ограничение на размер конечно же есть :), максимум слов это LongInt (2147483647).

По поводу ошибки тезауруса, тут тоже интересный случай, она возникает даже когда работаешь в VBA :), но так или иначе пороюсь в недрах знаний майкрософта раскопаю что к чему, т.е. исправлю этот баг.

Вкусовые предпочтения в программу не закладывали :), первый текст который был скормлен были Дневники Бриджет Джонс :).

D
На сайте с 01.03.2008
Offline
88
#417

Да, и еще, Алекс забыл добавить: в ближайщее время работа над базой вестись не будет, т.е. пока мы приостановим ее увеличение.

Все силы будут брошены на морфологию.

ПЫСЫ: если у кого-нибудь есть наработки в этой области и он хочет поделиться ими с нами/помочь в развитии продукта - велкам в асю ;)

D
На сайте с 21.06.2008
Offline
8
#418
alexpotemkin:
Добавлена новая утилита к синонимайзеру, сборщик словаря синонимов при помощи тезариуса MS Word, т.е. утилите скармливаем файл в формате *.txt,*.rtf,*.doc на выходе получаем список слов текста синонимов к ним (если таковые имеются). Далее если список нуждается в редактировании его можно редактировать и сохранить в формате простого текстового файла, либо уже в шифрованном формате для синонимайзера.
Спасибо за внимание :).

Спасибо за утилиту, очень полезная вещь.

Но в процессе использования собранных синонимов заметил один недочет. Дело в том что у одного слова может быть очень много значений. При полуавтоматической обработке текста в синонимайзере почему-то не предлагается выбор синонимов слов у которых количество синонимов зашкаливает, а в других случаях выбор синонимов для слов "обрывается" на 9-ти значениях, притом если последнее значение состоит из 2-х слов, то второе слово тоже "обрывается".

[Удален]
#419
Dotman:
Спасибо за утилиту, очень полезная вещь.
Но в процессе использования собранных синонимов заметил один недочет. Дело в том что у одного слова может быть очень много значений. При полуавтоматической обработке текста в синонимайзере почему-то не предлагается выбор синонимов слов у которых количество синонимов зашкаливает, а в других случаях выбор синонимов для слов "обрывается" на 9-ти значениях, притом если последнее значение состоит из 2-х слов, то второе слово тоже "обрывается".

Не совсем понял по поводу синонимов и обрывов, если можно с подробностями или в личку или в аську, т.к. если баг то нужно поправить.

N
На сайте с 02.04.2007
Offline
73
#420

Не идет😕

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий