Оцените качество текста

Revan
На сайте с 09.09.2005
Offline
321
#51

ciber, слишком маленький кусок текста. Имхо, будь он побольше - обязательно бы наделал ошибок.

(конечно, если Вы не правили окончания :))

С уважением, Прокофьев Александр, founder KudaGo.com (http://kudago.com). Отдаем информацию обо всех мероприятиях в РФ + Киев по API (/ru/forum/912869) всем желающим.
S
На сайте с 12.11.2009
Offline
25
shi
#52

Вот мой кусочек: с утра намахал новый алгоритм 😂 Пока буду еще работать :)

Давай возьмем чей-либо на большее. Хотел бы я уж какие же самое о чем. Дофин старается сощурить дополаскивание партии, даже забывая, ничегохонько накликание девчурочка. Козетка, одному парню пришлось ногу отрубить топорищем – бортмеханик до отказа охамел. Хамство даст вам насчет большую мембрану от времени нет, материализовав рассолец пока при необходимости. –*пресвитерианин, я облажался,*– сказал он. Ему нужен перевод, на взял бы на большее не имея возможность уйти. Присмирело говоря, в самом начале они не исключали, себя мишенью курда и есть горновой, и на большее не хотели, туда где был у нас на виду.
spambot
На сайте с 12.12.2008
Offline
55
#53

Плотность редкоупотребимых слов просто зашкаливает, вы бы входную текстовку на более прозаическую сменили что-ли...

Every time you attempt to parse HTML with regular expressions, the unholy child weeps the blood of virgins, and Russian hackers pwn your webapp. (http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454)
S
На сайте с 12.11.2009
Offline
25
shi
#54

Да-да, это просто используется общий словарь на 125к слов, так что как вы можете заметить распределение редкоупотребимых слов равномерно. В конечном варианте это будет генератор узкотематических текстов, он кстати без текстовки работает по сути, просто постепенно обучается, нейронная сеть же :)

spambot
На сайте с 12.12.2008
Offline
55
#55
shi:
Да-да, это просто используется общий словарь на 125к слов, так что как вы можете заметить распределение редкоупотребимых слов равномерно. В конечном варианте это будет генератор узкотематических текстов, он кстати без текстовки работает по сути, просто постепенно обучается, нейронная сеть же :)

И как происходит процесс обучения? :)

потихоньку травите эталонные текстовки - типа делай как тут? 🙄

пока что самая крутая текстовка от Dereka (по сравнению с остальными небо и земля)...

Solo_by
На сайте с 19.06.2009
Offline
220
#56

Ну тут есть ещё вопрос уникальности и на сколько быстро генерится текст. У меня например генерится достаточно медленно, ставлю пакетную генерацию на ночь и ложусь спать.

spambot
На сайте с 12.12.2008
Offline
55
#57
Solo_by:
Ну тут есть ещё вопрос уникальности и на сколько быстро генерится текст. У меня например генерится достаточно медленно, ставлю пакетную генерацию на ночь и ложусь спать.

а обьем получившегося текста в словах там или символах?

Solo_by
На сайте с 19.06.2009
Offline
220
#58

за ночь?) ну с десяток доров по 2к страниц где то) по 60-70 предложений на странице

S
На сайте с 12.11.2009
Offline
25
shi
#59
spambot:
И как происходит процесс обучения? :)
потихоньку травите эталонные текстовки - типа делай как тут? 🙄
пока что самая крутая текстовка от Dereka (по сравнению с остальными небо и земля)...

С удовольствием могу обсудить детали в личке или еще где-нибудь. :o Если вкратце - да, скармливаются тексты нужных тематик.

shi добавил 08.12.2009 в 17:56

Solo_by:
Ну тут есть ещё вопрос уникальности и на сколько быстро генерится текст. У меня например генерится достаточно медленно, ставлю пакетную генерацию на ночь и ложусь спать.

Мой генератор собственнно генерит текст достаточно быстро. 2к сраниц в течение нескольких секунд. Однако парсит тексты оооочень медленно, т.е. обучение сети - гемор) Обычно успевает за ночь схавать около 6-8 метров, с учетом того что я это гоняю на 4 ядерном тазике с 4 гигами рама :)

spambot
На сайте с 12.12.2008
Offline
55
#60
shi:
С удовольствием могу обсудить детали в личке или еще где-нибудь. :o Если вкратце - да, скармливаются тексты нужных тематик.

shi добавил 08.12.2009 в 17:56


Мой генератор собственнно генерит текст достаточно быстро. 2к сраниц в течение нескольких секунд. Однако парсит тексты оооочень медленно, т.е. обучение сети - гемор) Обычно успевает за ночь схавать около 6-8 метров, с учетом того что я это гоняю на 4 ядерном тазике с 4 гигами рама :)

а сама сетка на чем работает? в каком нить мат. продукте смоделированна или компиленная реализация?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий