ortega3000

ortega3000
Рейтинг
32
Регистрация
11.06.2007
lemax:
Хм, а если зделать возможность пользователю создавать свои словари ( было б хорошо,если в txt формате ) ,ну и естественно добавлять синонимы при работе с текстом (в некоторые словари,либо во все ) .
Думаю, возможность создания разных словарей будет полезна, т.к. можно будет использовать какой-то отдельный словарь для отдельной тематики.

Большое спасибо за совет. Обязательно сделаю возможность разделения по темам. В настоящий момент ведутся работы над пользовательским словарем. В частности, новый подход к работе с базой синонимов я описал на своем блоге вот в этом посте.

Очень надеюсь, что уже в понедельник для загрузки будет доступна новая версия программы, в которой будет редактор словарей, позволяющий как импортировать из, так и экспортировать словари в простой текстовый формат.

На странице с результатами анализа поискового запроса было бы неплохо как-нибудь разделить строки в центральной колонке (что между выдачами я и г, "Последнее обновление 31.07.08" и т.д.). Это можно сделать или тонкими горизонтальными полосами между строками, или применив разные цвета для смежных строк. Сейчас достаточно напряжно всматриваться из-за большого расстояния между тайтлами и числами... Но это так, мелочь.

А сам сервис понравился. Спасибо!

Юзаю аллсаб уже более года. Доволен. Другими не пользовался.

monte:
это мне и нужно. просто синонимизированный текст похож как братец близнец, если я буду каждый раз менять ручками, то можно реально сделать несколько оригинальных текстов.

Хорошо, обязательно сделаю! Уже занес в список улучшений. :)

Кстати, только что на своем блоге описал то, как будет реализован режим размножения. Приглашаю всех для прочтения и обсуждения. Блог в подписи.

monte:
к примеру ты сидишь и редактируешь текст, перефразируешь предложения и заменяешь синонимы на правильные или добавляешь новые в базу. Но тебе нужно сделать не один текст, а несколько, тоесть перерабатывать уже есть смысл редактированный вариант, а не исходный.

То есть вы хотите, чтобы была возможность быстрого создания окна для обработки текста, в котором в качестве исходного текста будет уже обработанный текст. Но тут возникает одна загводка: обработанный текст будет обработан еще раз, вследствие чего там появятся новые синонимы.

Поэтому я думаю, что наилучшим выходом из ситуации будет воспользоваться режимом размножения. В этом режиме вы работаете с предварительно обработанным (просинонимизированным) текстом, и выбираете для размножения только те синонимы, которые захотите. К примеру, если у некоторого слова есть три синонима, а вы выбрали только два из них, то в шаблон размножения попадут только они.

Возможно, я не очень ясно объясняю... Просто дождитесь выхода новой версии программы, в которой режим размножения уже будет реализован. Я планирую выпустить эту версию к концу этой недели. К этому времени я сделаю подробное описание функционала этого режима и опишу тонкости работы с ним. Все материалы будут доступны как в помощи к самой программе, так и на официальном сайте.

monte:
скачал последнюю версию: 0.1b1

Кажется баг.
1. Клик левой кнопки мышки. Вылазит контентное меню, делается выделение да и вообще вся работа с текстом только на левом клике. Очень не удобно. Сделайте выделаение и работу на левом, а контентное меню на правом, как и в других програмах.

Это уже исправлено. Ждите в версии 0.1b2

monte:
Для редактиования текста не помешает функция замена исходного текста результатом. Тоесть, ты сидишь и обрабатывашь текст, заносишь синонимы. Потом хочешь прогнать и посмотреть, что у тебя получилось, приходится копировать и вставлять в новое окно ручного режима или заменять самому исходный текст. Было бы неплохо, если бы одним кликом автоматом создавалось окно ручного режима с исходным текстом.

Я не совсем понимаю вопрос... Для проверки результата работы с синонимами вам просто нужно запустить обработку этого текста в этом же окне еще раз. Или вам это нужно для того, чтобы текущие результаты оставались неизменными?

ortega3000 добавил 30.07.2008 в 15:08

MasterOK:
Еще очень не хватает статистики по заменам слов и проверки на похожесть исходного и полученного текста.

Это тоже в разработке. Скорее всего появится в версии 0.1b2.

Авторерайтер, говорите? :)

Этот продукт должен уметь выполнять следующие задачи:

- выделять перво- и второстепенные члены предложения

- понимать морфологию, лексику и грамматику (как минимум)

- различать слова с ошибками и правильно их исправлять

- понимать смысл предложений

- уметь переставлять слова (и предложения?) так, чтобы не терялся общий смысл

- генерировать свои предложения на основе обработанных предложений

Конечно же, этот список неполон, просто это первое, что пришло на ум.

Так вот, если с первыми тремя пунктами особых проблем нет, то последние пункты могут вызвать некоторую ошалелость у тех, кто не очень знаком с правилами русского языка. И если с пониманием смысла можно повременить, то переставлять слова программа должна буквально с первых своих шагов. К слову сказать, перестановка слов - не такая уж и сложная задача. Куда сложнее - генерация своих предложений. Для этого программа должна хоть немножко понимать смысл предложений (хотя бы на уровне понимания взаимосвязи между словами в одном предложении). А это, конечно же, очень и очень непросто. Хотя бы потому, что у нее должна быть очень большая база слов и связей между словами и группами предметных тем, для того чтобы она могла делать выводы хотя бы о теме разговора, чтобы потом на основании полученных знаний о вхождении базовых слов в другие предложения, делать какое-то подобие высказываний на ту же тему. Как вы понимаете, высказывания будут шаблонными. Зато своими и на заданную тему. :)

В заключение могу сказать только одно: синонимайзерам быть. Хотя бы до тех пор, пока не будет написан продукт, описанный в вашем ИКР.

Кстати, вопрос: должен ли этот авторерайтер генерировать безграмотные результаты на основании безграмотных исходных текстов? И должен ли он фразу

"Чиво вылупился, урюк?"
уметь заменять на
"Милостивый государь, любезнейше простите, но не находите ли вы, 

что ваш взор, который вы неосмотрительно бросили на меня,
несколько возмутителен?"
? :)
zalexseo:
последнюю, с сайта

Странно. Использован стандартный компонент для работы с текстом, который просто не может не работать... Кстати, попробуйте перед нажатием на Ctrl-A кликнуть мышой в панель с результатами обработки. Вполне возможно, что во время нажатий на хоткеи фокус имел совсем другой элемент.

zalexseo:

Что не понравилось:
- Объем занимаемой программой оперативной памяти (240 Мб!), и виртуальной - 240
- lowercase незамененных слов, пример ниже
- в программе не работают хоткеи (ctrl-a, ctrl-c, ctrl-ins)

Большое спасибо за замечания! Отвечу по порядку.

- Размер занимаемой памяти определяется размером словаря, который считывается в память для ускорения работы. Кстати, именно из-за этого инициализация программы и производится достаточно долго. Возможно, после чистки словаря занимаемый размер будет меньше, хоть я и не уверен, что намного.

- Ловеркейс слов наблюдается при включенной перефразировке. К сожалению, в настоящий момент эта проблема неразрешена, но я очень надеюсь, что в ближайшем будущем это перестанет быть проблемой.

- Только что проверил - выделение текста результат и копирование в его буфер работает без проблем. В дальнейшем я планирую добавить кнопку для копирования всего результата в буфер.

Кстати, какую версию программы вы тестировали? Последняя версия, доступная для скачивания с официального сайта: 0.1b1.

Maksim-s:
Ну хорошо, значит вам везёт :)
У меня ничего не работает, пробывал и комп перезагружать и уже по аське с ortega3000 всё проверили..
Вообще я больше время терять не буду.
Или подготовьте прогу или досвидания..

Обязательно проверим и подготовим все, чтобы ни у кого не возникало вопросов. Хотя бы по установке.

Также хотелось бы спросить у всех, кто уже попробовал версию 0.1b1 - насколько удобно выпадение контекстного меню для работы с синонимами слова при клике левой кнопкой мыши?

Кроме того, было бы интересно узнать, что еще стоит добавить в это контекстное меню?

Всего: 200