СССР - Серверный семантический синонимайзер рерайтер

12
garem
На сайте с 08.06.2006
Offline
35
1929

СССР - Серверный семантический синонимайзер рерайтер http://www.blogka.ru

Графематический анализ включает в себя распознавание имен, инициалов, сокращений, дат, цифровых, цифробуквенных комплексов, имен файлов и веб страниц, абзацев, всевозможных знаков препинания, скобок, математических формул и тд.

Морфологический модуль создан на идеях АОТ, и в частности академика А. Сокирко и порождает для каждого слова все возможные морфологические толкования слова, даже если лемма не содержится в словаре, для нее строится вероятностная морфологическая модель. Русский морфологический словарь базируется на грамматическом словаре А. А. Зализняка. Включает на данный момент 174787 лемм. Морфологический модуль синонимайзера - рерайтера СССР с помощью таблиц триграмм снимает морфологическую омонимию.

Модуль синтаксического анализа строит синтаксические группы на одном морфологическом варианте одной клаузы. Цель модуля разделить предложении на клаузы и рассчитать их ценность и значимость. В процессе анализа незначимые и малозначимые клаузы удаляются.

Модуль поверхностной семантики решает вопрос о выборе наиболее подходящего синонима, учитывая семантическую и тематическую составляющую леммы, а также частоту употребления леммы.

В процессе подбора синонимов синонимайзером рерайтером СССР используется семантическая состаляющая леммы, идеи почерпнуты у профессора В.А.Тузова и аспирантов Санкт-Петербургского государственного университета, в частности у Максима Мозгового. Алгоритм и теория обработки тематической составляющей леммы была разработана и опробована самостоятельно.

Траблы конечно есть, выложена бета версия. Можно тестить. Можно бить ногами.

Для купивших Серверный синонимайзер до 5.08.09 - Серверный семантический синонимайзер рерайтер СССР бесплатно

СССР - Семантический Серверный Синонимайзер Рерайтер. (http://www.blogka.ru)
vtomas
На сайте с 19.03.2007
Offline
102
#1

А скрины Web-панели можно увидеть?

Хорошее стоит дорого, на плохое не стоит и тратиться. В поисках VPS захостился здесь (http://ipserver.su), а бэкапы храню здесь (http://billing.markovservers.com/backup/pl.php?65).
garem
На сайте с 08.06.2006
Offline
35
#2

В бета версии одна кнопка - "пошел" )))

vtomas
На сайте с 19.03.2007
Offline
102
#3

А планируется что то делать "руками"? Имею ввиду пополнять базу, самостоятельно выбирать синонимы (ручной режим), пакетный режим. :)

K1
На сайте с 13.01.2008
Offline
26
#4

идеи академиков... а на выходе: "используют стабильной популярностью", "Они распознаются как тщательно зрительно"

такой же бред как и у всех

newseditor
На сайте с 13.11.2006
Offline
123
#5

Обычный бредотекст на выходе, подойдет разве что для дорвеев.

KK
На сайте с 19.07.2009
Offline
57
#6

А мне понравилось, лучше чем во многих рирайтеров, жаль что в бетоверсии ограничение на 1000 символов

garem
На сайте с 08.06.2006
Offline
35
#7
vtomas:
А планируется что то делать "руками"? Имею ввиду пополнять базу, самостоятельно выбирать синонимы (ручной режим), пакетный режим. :)

Естественно, ошибки будут, и их надо как-то править, пакетный -тоже будет, обработка html страниц - будет, вероятно подключение к основным CMS - тоже будет, пополнение базы - маловероятно, хотя может быть.

ortega3000
На сайте с 11.06.2007
Offline
32
#8

Самое сложное во всех программах, которые занимаются анализом текстов - создать правильный словарь и учитывать омонимию. Точнее, снимать ее. Если программу обучить правильно, то остальные задачи реализуемы легко. Кстати, ваш рерайтер омонимию снимает? Если нет, то вначале стоит копать в этом направлении, так как даже самая хорошая база, используемая "в лоб", будет бессильна перед "чудесами" русского языка. :)

garem
На сайте с 08.06.2006
Offline
35
#9

Конечно снимает, и морфологическую и синтаксическую и поверхностно семантическую. Я не толкался от качества базы, база кстати используется одна из самых больших, упор делается на интеллектуальность алгоритма. И что Вы имете в виду под словом "обучить"? Нейронную сеть?

Анатолий
На сайте с 13.03.2009
Offline
138
#10

Планируется выпуск локальной(десктопной) версии?

============================================

Кстати, разберитесь с "ДР":

БЫЛО--------------------

-------------------------

СОСТАВ И СТРОЕНИЕ КОМПОЗИТА

Композиты - многокомпонентные материалы, состоящие из полимерной, металлической., углеродной, керамической или др. основы (матрицы), армированной наполнителями из волокон, нитевидных кристаллов, тонкодиспeрсных частиц и др. Путем подбора состава и свойств наполнителя и матрицы (связующего), их соотношения, ориентации наполнителя можно получить материалы с требуемым сочетанием эксплуатационных и технологических свойств. Использование в одном материале нескольких матриц (полиматричные композиционные материалы) или наполнителей различной природы (гибридные композиционные материалы) значительно расширяет возможности регулирования свойств композиционных материалов. Армирующие наполнители воспринимают основную долю нагрузки композиционных материалов.

По структуре наполнителя композиционные материалы подразделяют на волокнистые (армированы волокнами и нитевидными

==================================

СТАЛО----------------------------

--------------------------------------------

СОСТАВ И СТРОЕНИЕ КОМПОЗИТА

Композиты - многокомпонентные материалы, состоящие из фотополимерной либо ДР. базы армированной наполнителями из химволокон и ДР. Методом подбора состава и свойств наполнителя и матрицы их соответствия, ориентации наполнителя впору взять материалы с требуемым сочетанием эксплуатационных и технологичных свойств. Применение в одном материале нескольких матриц) либо наполнителей разной природы) существенно расширяет возможности упорядочения свойств композиционных материалов. Армирующие наполнители принимают главную долю нагрузки композиционных материалов.

По конструкции наполнителя материалы подразделяют на волокнистые (армированы химволокнами и нитеобразными кристаллами (армированы пленками), дисперсноармир

Пишу на любые темы, в т.ч. и на сложные технические (https://t.me/Pisar1). Стоимость: от 100р./1000сп +- Готов рассмотреть Ваши предложения и выполнить небольшое тестовое задание. Примеры моих статей: ------------------- https://dzen.ru/media/pisec/gerwin--eto-iipisec-realnyi-pomoscnik-i-konkurent-dlia-kopiraiterov-63acb833886e17677f48b4b7 https://nag.ru/news/20989 https://nag.ru/material/20822 http://habrahabr.ru/post/254609/
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий