Небольшой опрос. Идеальный дорген/генератор сайтов/лендингов etc

T2
На сайте с 24.02.2008
Offline
117
#191
AESCBC192:
если очень приближенно то в готовом виде алго для сниппета - берем запрос, переводим в нормальную форму - ед число, им. падеж итд, лему берем и ищем ее в лематезированном тексте, далее по номеру позиций забираем предложения. две строки и пару циклов.

типа того, можно упростить в части (переводим в нормальную форму - ед число, им. падеж итд,)

так как поисковик уже отсортировал сайты по ключу думаю можно просто брать первые 4-5 знаков из слов запроса

---------- Добавлено 15.09.2016 в 10:56 ----------

сам пробую делать по схеме /ru/forum/comment/14676530

только проверку на соответствие ципф ещё не сделал,

ищю простой код для получения ципфы на пхп

Ташкент кафельщик (https://remontmontaj.ru/)
AESCBC192
На сайте с 11.06.2016
Offline
51
#192

по Ципфу - верхнюю точку берешь за 0.95 от нее отсчитываешь веса других точек, делаешь такие весовые матрицы для 10-11-12 словных итд предложений, а далее просто ложишь посчитанные веса слов на эту матрицу и смотришь расхождения, в местах склеек дергаешь шинглы.

на практике можно делать проще - берешь норм форму по всем словам, смотришь какие самые увесистые, берешь 3-4 и дрегаешь с ними парную чатсь речи. Совпадает с запросом хоть одно - предложение релевантно, а вообще можно просто нормализовать и предложение и запрос и по нему смотерть, опечатки, слэнг и прочие расхождения только нейронкой поймать можно.

---------- Добавлено 15.09.2016 в 11:27 ----------

print_r ($this->Morphy->lemmatize($wprepared, phpMorphy::NORMAL));

берет лему, этой лемой проверяешь предложения в цикле, впринципе этим можно обойтись для первой версии алгоритма.

AESCBC192
На сайте с 11.06.2016
Offline
51
#193

Сниппеты по Ципфу 80-90%, возможно в этом причина их индекса.

T2
На сайте с 24.02.2008
Offline
117
#194
AESCBC192:
Сниппеты по Ципфу 80-90%, возможно в этом причина их индекса.

может накатаеш готовый код для определения ципфы текста на рнр (думаю всем интересно будет)

только не надо phpMorphy использовать

---------- Добавлено 15.09.2016 в 16:26 ----------

AESCBC192:
Сниппеты по Ципфу 80-90%, возможно в этом причина их индекса.
и трафика ихмо.
AESCBC192
На сайте с 11.06.2016
Offline
51
#195
tanir23:
и трафика ихмо.

итого задача сводится к 3м критериям:

мрфология

Ципф

уникальность

+ желательно читабельность и хотябы отдаленное наличие смысла.

чем Morphy плох?

sidorka
На сайте с 17.08.2012
Offline
211
#196

Морфология, Ципф, леммы - это все красиво только на словах и для единичных экспериментов. Практика требует немного другого. Генератор должен быть легким и быстрым - вы же дорвеи генерить собрались, а не графоманить и сервера насиловать.

Дешевые домены для дорвеев и не только - от 55р (https://goo.gl/Wtnwqp)
T2
На сайте с 24.02.2008
Offline
117
#197

Идеальный дорген/генератор сайтов/лендингов etc

Гениальный дорген/генератор сайтов/лендингов etc

Все гениальное - просто!

поэтому первым делом надо и про производительность не забывать

динамический дор-закинул ключи и всё.

AESCBC192
На сайте с 11.06.2016
Offline
51
#198

Если бы ПС имели простые алгоритмы можно было бы пойти по пути упрощения, а сейчас стоит задача сделать сложное простым в использовании.

простой и быстрый - это пачка парсеров с шаблонизатором. это уже реализовано, так что если не востребованы алгоритмы генерации контента могу оставить их для приват версии, или сделать 2 на выбор.

twiprogon
На сайте с 22.07.2013
Offline
189
#199

AESCBC192, давайте уже скрины тестов каких нибудь по индексу, жизни доров, трафу, профиту.

после мутим свой ленд и продаем дорген за 100500кк баксов )))

LimonBucks.com (http://limonbucks.com) - Лучшие условия для конверта мобильного трафика
sidorka
На сайте с 17.08.2012
Offline
211
#200

AESCBC192, что за "алгоритмы генерации контента" у тебя?

Уже хоть что-то реализовано или пока на стадии мечтаний? Пример текстовки показать можешь?

ЗЫ. В хотя бы отдаленное приближение к полезности генерированной текстовки для юзера верится с трудом. Именно текстовки. Про медийку Бабулер все расписал в своей ветке - с ней проще.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий