tanir23

Рейтинг
145
Регистрация
24.02.2008

Идеальный дорген/генератор сайтов/лендингов etc

Гениальный дорген/генератор сайтов/лендингов etc

Все гениальное - просто!

поэтому первым делом надо и про производительность не забывать

динамический дор-закинул ключи и всё.

AESCBC192:
Сниппеты по Ципфу 80-90%, возможно в этом причина их индекса.

может накатаеш готовый код для определения ципфы текста на рнр (думаю всем интересно будет)

только не надо phpMorphy использовать

---------- Добавлено 15.09.2016 в 16:26 ----------

AESCBC192:
Сниппеты по Ципфу 80-90%, возможно в этом причина их индекса.
и трафика ихмо.
AESCBC192:
если очень приближенно то в готовом виде алго для сниппета - берем запрос, переводим в нормальную форму - ед число, им. падеж итд, лему берем и ищем ее в лематезированном тексте, далее по номеру позиций забираем предложения. две строки и пару циклов.

типа того, можно упростить в части (переводим в нормальную форму - ед число, им. падеж итд,)

так как поисковик уже отсортировал сайты по ключу думаю можно просто брать первые 4-5 знаков из слов запроса

---------- Добавлено 15.09.2016 в 10:56 ----------

сам пробую делать по схеме /ru/forum/comment/14676530

только проверку на соответствие ципф ещё не сделал,

ищю простой код для получения ципфы на пхп

AESCBC192:
аппроксимировать и по косвенным признакам вытащить.

если б перевёл на простой язык было бы не плохо, а то это не говорит мне не ничего

---------- Добавлено 15.09.2016 в 10:38 ----------

а чем тебе статистика не подходит

AESCBC192:
можно попробовать лему вытащить из текста, что-то вроде смыслообразующего центра.

типа того, наверное можно ципфу прикрутить к делу вытаскивания смыслообразующего центра.

если новые снипеты будут соответствовать по ципфе с ципфой снипетов.

+ уникализация(не поверхностная) +объём будет круто.

AESCBC192:
Проще сгенерировать свой сниппет, перейдя по ссылке из выдачи, но без ненужных элементов, я об этом. А из этих кусочков уже клеить текст, плюс немного можно морфозаменой перемешать для уникализации.

снипет составлен алгоритмами поисковиков не просто так а с использованием кучи фильтров и условий , полученный результат (снипет) по версии поисковика соответствует запросу пользователя,

по этим же алгоритмам будет ранжироваться и текст с дора.

как минимум необходимо использовать все словосочетания из снипета

AESCBC192:
не тот объем, второй момент - кодировку не нейро правят. думаю важен результат а сниппеты или нет - вопрос вторичный. оставлю сниппеты значит, это уже что-то вроде классики в подобного рода софтах))

так и предлогается брать объём с сайтов по снипету и подправить снипеты,

например тупо перемешать снипеты по запятым, и союзам а уже потом исправить морфологию

AESCBC192:
http://eclipse234565-001-site1.ftempurl.com/shtory_foto/shtory_svoimi_rukami_foto

На стадии багфикса.. В последний момент обнаружилась проблема "кубиков с вопросами", а касательно сниппетов, имхо вообще контент никакой с них, лучше идти по ссылкам с поисковиков и надергивать по предложению.

---------- Добавлено 15.09.2016 в 09:12 ----------

Плюсуйте кто за то чтобы выпилить метку сниппетов вообще и сделать мозаику из предложений текстов по ссылкам на сниппетах? Потому что после чистки снипов от телефонов и смайликов от них остается решето непрезентабельное.

так вот тут на этих снипетах и надо применить то что хотели делать с нейронной сетью.

исправить снипеты до презентабельного вида

vastmanager- не пробывал в своей перелинковке ставить ссылки на старые страницы , не сразу а скажем через день-два?

vastmanager:
Скрипт при работе берет случайные куски текста

то есть случайные предложения?

помнится пробивал на индекс твои тексты, в выдаче не находилось много предлож с одного дора при 3кб такого быть не должно было

Всего: 440