Хочу сделать конкурента JackoDoorgen

Буга
На сайте с 28.11.2007
Offline
85
#31
lip lippov:
Хочу сделать конкурента JackoDoorgen
Ufaweb:
Бери и делай. А то все "хочу" да "хочу"...
Поапплодировать, чтоль?
response:
всем нужен волшебный пендаль.

Ну изначально неправильно. Надо так, например - сделаю конкурента JackoDoorgen за 90 дней.... 🙄

Ufaweb
На сайте с 03.03.2008
Offline
182
#32
Буга:
Надо так, например - сделаю конкурента JackoDoorgen за 90 дней....

Главное условие: кодить надо через Яндекс.Клавиатуру 😂

inse3t
На сайте с 08.05.2006
Offline
84
#33

Марков в варианте "по словам" - УГ.

Тема была про тИЦ для желания хоть кому-то помочь, цель достигнута.

Про морфологию - бред полнейший. Вы хоть это имеете ввиду? ))))

serg-e, опыта не мало, с 2003 г.

p.s.

Почему у меня все работает проще и легче? :) Потому-что Я всегда больше думал и анализировал. ;) Доры, ГСы у меня поживают хорошо, причем на полном автомате.

p.p.s.

Первые 2 мысли:

1. стебуца

2. пугают новичков

😂

Ufaweb
На сайте с 03.03.2008
Offline
182
#34
inse3t:
Про морфологию - бред полнейший. Вы хоть это имеете ввиду? ))))

Это самое. Предложение "Александр вчера Пупкина на может быть красное в подошло порно скачать бесплатно автобус." неприемлемо, надеюсь Вы это понимаете?

Нужно соблюдать синтаксис предложения и соблюдать словоформы.

Допустим, сгенерировали предложение, располагаем слова согласно синтаксису, затем подгоняем словоформы друг под друга. Предыдущий пример после обработки должен получиться примерно таким:

Может быть вчера Александра Пупкина подошла порно скачать бесплатно в красном автобусе.

Да, смыла как не было, так и нет, но слова больше не представляют из себя кашу.

inse3t
На сайте с 08.05.2006
Offline
84
#35

Ufaweb, Я отлично это понимаю, и такого Г никогда не делал.

Но вот "генерация текста по всем правилам морфологии" нафиг не надо.

response
На сайте с 01.12.2004
Offline
324
#36
Ufaweb:
Cогласен. Я видел такие аккуратные доры, что рядом с ними 99% ГСов тихо курят. Но такие доргены - жесткий приват...

аккуратные с точки зрения оформления?

Однопоточный парсер ключевых слов Магадан (http://magadanparser.ru) (со свистелками) Многопоточный парсер ключевых слов Солнечный (http://sunnyparser.ru) (без свистелок)
entropy
На сайте с 21.09.2007
Offline
43
#37

response, ты меня как-то натолкнул на мысль поизучать C#, за что спасибо.

Сейчас в качестве учебного примера написал марковку. Генерит действительно гораздо быстрее php. Правда регулярные выражения очень медленные, из за чего большой текст загружается долго.

Зато циклическая пробежка по массивам просто сказка. Текст из 10М файла преобразовался 2млн цепочек. Сгенерил 100 предложений за 0.04с, тогда как в пхп получалось около 10с.

А сам текст вроде как читабельный получается(несколько книг подряд скопировал в один файл)

Вот так генерится сейчас:

Поповской горнице продолжался выйдя на чистую воду в ванной плеск воды. Институтской скамье какой он блестящий полемист я тридцать. Воевода растрогался и поднес ее тыльной стороной чуть. Суть дела, не разобравшись как следует обдумала; затем я учтиво поклонился протянутую. Увернулась, и голиков, не читая, накрыл положенные стол. Ливри это имя, принятое Гастоном во время песен всякий, кто в русскую веру, — скучно сказал князь я не верю, чтобы Елена. Кое-как мореходы привели командира в сторону шофер, видимо, торопился машина подошла к ней, причем все это знаю дюбуа.

kxk
На сайте с 30.01.2005
Offline
990
kxk
#38

Ufaweb, Спалю тему, динамика рвёт статику как тузег грелку, РБ для ленивых и бедных. больше ничего не спалю ибо я жадный :)

Ваш DEVOPS
response
На сайте с 01.12.2004
Offline
324
#39
entropy:
response, ты меня как-то натолкнул на мысль поизучать C#, за что спасибо.

:) всегда пожалуйста :) а вот мс меня в евангилисты не взяли :)

entropy:
Зато циклическая пробежка по массивам просто сказка. Текст из 10М файла преобразовался 2млн цепочек. Сгенерил 100 предложений за 0.04с, тогда как в пхп получалось около 10с.

на самом деле итераторы там тоже медленные, так что в дальнейшем ты будешь обрадован, видимо, еще сильнее :)

entropy:
А сам текст вроде как читабельный получается(несколько книг подряд скопировал в один файл)
Вот так генерится сейчас:

Поповской горнице продолжался выйдя на чистую воду в ванной плеск воды. Институтской скамье какой он блестящий полемист я тридцать. Воевода растрогался и поднес ее тыльной стороной чуть. Суть дела, не разобравшись как следует обдумала; затем я учтиво поклонился протянутую. Увернулась, и голиков, не читая, накрыл положенные стол. Ливри это имя, принятое Гастоном во время песен всякий, кто в русскую веру, — скучно сказал князь я не верю, чтобы Елена. Кое-как мореходы привели командира в сторону шофер, видимо, торопился машина подошла к ней, причем все это знаю дюбуа.

возьми свою морковку, прикрути к ней базу. скорми 300+ метров текстов, сгенерив (и сохранив в базу) цепочки разной длины, от трех до пяти, например. Сделай хотя бы учет использований (какая цепочка сколько раз и как давно/в каком порядке). Посмотри на результат. Я тебе говорю, он тебя очень порадует, как по содержанию, так и по скорости (на php подобное не снилось). Если заморочиться с маркерами первого/последнего слова в предложении, вопросительными/восклицательными знаами и пр., получается вообще красота.

response добавил 21.12.2008 в 07:22

kxk:
Ufaweb, Спалю тему, динамика рвёт статику как тузег грелку, РБ для ленивых и бедных. больше ничего не спалю ибо я жадный :)

да чета фигню какую-то спалил :) статика - она не для всех 🚬

entropy
На сайте с 21.09.2007
Offline
43
#40
response:

возьми свою морковку, прикрути к ней базу. скорми 300+ метров текстов, сгенерив (и сохранив в базу) цепочки разной длины, от трех до пяти, например.

Ты про SQL базу?

Просто при таких объемах цепочек получится несколько млрд. Какая база это осилит?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий