rasiell

rasiell
Рейтинг
180
Регистрация
16.02.2008

A_I_F, планирую. Стоимость программы еще поднимется.

Бывает глюк с повторением некоторых слов и хоть это ни в коем случае отрицательно не влияет на индексацию, но все равно я его обязательно исправлю.

griff92, поправим. Вообще это пока только первая версия доргена, так сказать пилотная, он претерпит еще множество исправлений и дополнений.

wolfston, в том то и дело, что опробован :)

А если вы настолько уверены, что текст палится по связкам слов, то очень скоро добавится поддержка n-грамм, что будет делать текст тематическим

первое выбрасывется ищиется в исходной текстовке потому как правило из-за маленькой начальной текстовки ведь, из.

Вот такой текст сгенерировал генератор по цепям Маркова из ваших слов.

Я могу из своего опыта сказать, что морфологически правильный текст, пусть и полный бред хорошо сидит в индексе.

wolfston:
Похоже вы меня не поняли, при использовании морковки, два стоящих рядом слова всегда встречаются в нормальном предложении, так как это есть основа алгоритма, и морковка ловится по совсем другим признакам, а не по морфологии и бредовсти текста...
Ваш вариант недотягивает даже до морковки.

Он превосходит марковку на голову а то и две.

Я вас понял прекрасно, похоже это вы не разу не генерировали ничего, а так, просто рассуждаете. Вот скажите, при генерации по цепям Маркова, вы что используете текстовку из одного предложения, что у вас эти "два стоящих рядом слова" всегда будут встречаться в живом языке? Это одно, а второе, это то, что чтобы по настоящему определить смысл текста это как минимум нужен ИИ, а вы говорите фильтр...

Морковка, со всеми своими недостатками, будет выглдеть в разы лучше.

Каким местом она будет выглядеть лучше?

Для примера, выбираем любую пару слов стоящей рядом из вышестоящей текстовки, и ищем в гугле например. Вероятность что такая пара встретится на каком либо сайте практически меньше 10%. Перебрав десяток пар, нашол только одну нормальную, тоесть используемую в речи, а три из них выдали доры построенные скорее всего этой прогой.

Вы сами себе противоречите, говоря, что генерация по цепям Маркова читабельнее. Т.е. если взять любые пару слов из текста сгенерированного по цепям Маркова, то это будут часто употребляемые в речи обороты?

Ключевик пеленгатор в каждом 2-м предложении:

Безвкусно драпирующая доказательность опосредованно утилизовывает, пеленгатор, но случается, что закоренелый меховщик пригнулся. Блиндирующий бондарь в паре с абстрактной расставленностью это выпускник, но случается, что взор зацеловывает. Возможно, пеленгатор, охотницы непредсказуемо едва - лишь будут надкатывать кроме скрытой стремительности, в случае когда клоачный золотарь растеряет. Еле подготавливающее оттаскивание спутывает про пешком блиндирующую и дезориентированную беглянку, только когда звоны натужно натужно стерилизуют промежду выплывавшей и несоответствующей радиобиологии. Сидящие плескания усекают, пеленгатор, но иногда ласточка благоустроенно благоустроенно радуется предо автотрансформатором.
Стоящий ифрит покупает согласно равнозначности, пеленгатор, но случается, что многотиражки хрипят об резво жующее горнило. Подготавливающие пыльца конечности психологически психологически могут подстраховаться между кабалистического или безобразно стоящего чикаго, но случается, что засекречивающий видоискатель раскалывает вместо властьимущего зазывалы. Уверяющие непредвиденности вперед вперед умеют перекинуться предо уклонением, пеленгатор, только когда замечательно видящий орешник чрезвычайно отдаленно расплывается. Завопившие фантазии удалятся, но случается, что вересковый экспорт толкнет. Выпеченная или несказанно жующая барби стучит на атональную демилитаризацию, пеленгатор, и фрагментировано гранулирующая космогония изобразит.

Немного приоткрою завесу над тем что планируется добавить в ближайших обновлениях доргена. Во первых будут добавлены n-граммы, что позволит генерировать текст на определенную тематику, также будут генерироваться различные предложения, сейчас пока только сложные повествовательные, появятся вопросительные, восклицательные. Что касается вставки ключевиков, то тут планируется провести большую работу, чтобы можно было перефразировать ключевики, менять падежи и т.д. Также будет добавлен синонимайзер и другие методы генерации и граббинга. Ну и конечно же будут добавлены другие языки!

Все это ожидайте в последующих версиях, работа идет постоянно, добавляются новые фичи, исправляются старые глюки. Enjoy!

griff92:
rasiell, а как выглядит текст с уже вставленными кеями? спалите плз

Ключевик — схемы оптических локаторов

Всем известно, схемы оптических локаторов, что ревностно жующие каноны гладко приедут благодаря лагуне, при условии, что кардинальная асфиксия прищемит.

Rus356, все верно, пофиксил

Вышло очередное обновление. На этот раз исправлена часть найденных глюков. Обновляемся!

Работа идет полным ходом!

Всего: 1316