AESCBC192

AESCBC192
Рейтинг
51
Регистрация
11.06.2016

http://eclipse234565-001-site1.ftempurl.com/shtory_foto/shtory_svoimi_rukami_foto

На стадии багфикса.. В последний момент обнаружилась проблема "кубиков с вопросами", а касательно сниппетов, имхо вообще контент никакой с них, лучше идти по ссылкам с поисковиков и надергивать по предложению.

---------- Добавлено 15.09.2016 в 09:12 ----------

Плюсуйте кто за то чтобы выпилить метку сниппетов вообще и сделать мозаику из предложений текстов по ссылкам на сниппетах? Потому что после чистки снипов от телефонов и смайликов от них остается решето непрезентабельное.

Попробовал разны алгоритмы синтеза контента. Получается неплохо, единственный минус - много поисковых запросов уходит на создание текста, задачу обхода бана решил распределением запросов между поисковыми системами, но с другой стороны, если контент не банится так уж ли важен вопрос скорости его создания? Постепенно буду внедрять в софт алгоритмы, в первой версии скорее всго будет только генератор с псевдоморфологией, пример котрого выкладывал.

Генератор с конкатенацией спаршенных предложений в генераторе нужен? Можно релаизовать примерно такой алгоритм: берется целевой ключ, по нему берется 1 предложение, далее из этого предложения выбирается шингл 2-3 слова в состав котрого входит целевой кей в одной из морфологических форм, далее по цепочке набираются предложения по таким шинглам предыдущих. Кто за включение данного алго пишите в тему.

realefs:
слова сгенерированные стыковкой по слогам
и другие извращения, тоже лезут в индекс. но это еще не значит что будет трафик на это

потому что не проходят частотный анализ, если составить качественную частотную базу, отражающую естественное распредление то в для ПС будет естественный контент. Частотная база это и есть нейронка, правда упрощенная и одноуровневая.

---------- Добавлено 12.09.2016 в 21:00 ----------

PS распределение в тесте по Ципфу не отражает распределний естественного контента, для каждой тематики эти распределения разные.

tanir23:
на какой ключ этот текст?

это не на ключ а обычный текст модифицированный базой на основе текста про нейронную сеть. Можно считать что под кей "нейронная сеть".

Lastwarrior, ты лучше по текстовке скажи мнение. Софт еще дописывать.

Можно снизить процент замен, но тогда уникальность снижается, и потом я ставлю задачу научить алгоритм делать полностью уникальный текст, чтобы он при этом был еще и читабельным.

---------- Добавлено 11.09.2016 в 05:04 ----------

Добавил помимо кея еще 1-2 блока на основе случайных слов из базового блока с высокой частотностью в тексте - получилось лучше, но время парсинга возрасло соответственно в 3 раза.

Лучше базу накапливать и в нее добавлять, с другой стороны если контент не будет банится то параметр времени создания страницы отходит на второй план.

Взял за основу этот текст http://host45.altmoney24.ru/

Дальше прогнал базой составленной на основе контента 30 сайтов из выдачи по запросу "нейронная сеть".

я использую еще наши адаптаций обучения тома . составляя свою диссертацию я имею ее от исходный (далее для нашего блог. графиком своё занимается и разобраться на сути дела) не более исходный график диссертации на данный графики основно я )попросту имеет график с gps. и изобретая такого смещения содержится любая чушь. прокомментируем торгово рефрерирует за своем ряду какие- само работы нейронных гур. обучения есть диссертаций на инструментарии ноль, и график не уникален. и вам торгово выбрать рядов от нашу адаптацию выберете хайкину диссертацию на этом. графиком не бумажную. данный ряд несет более исходный график колоссально копипастить. и изобретайте график с том за главе. я вышел на улицу, разобрался на в нейронным обучением есть разобрался на нейронные нейронные раздумья своё засыпая, и называясь за исходном инструментарии нейронного импульса. с называлось уже наиболее длить в практике, едя за диссертацию и эргономичность все, и я усвоил... графику читатель и обучения колоссальной диссертации работа стоит везде, есть за диссертации графиков тоже. также есть исходно мудро, рационально, тогда адаптацию сети не пострадает. в всем не занимается получить веб-мастер? сущность график есть явления диссертации наиболее (далее от график модели не разобралась и своя бабочка?! странно! и не занимается расстраиваться, значит в данный ряд будут свои бабочки-красавицы. адаптацию график есть диссертации нейросетевого смещения торгов разобрался на один диссертаций раньше профессора. разобрался его именем, сказал, и график наиболее сложный, также куча тому не сдаст. прокомментировал дать ряды и смартфоны, сказал, все и выберет их - возьмёт от дверь. ряд разобрался исходный график колоссального тома не разберётся получить в временной также методике. фидбернер свою диссертацию даёт наиболее в данном письме, и не имеет их от несколько на адаптации с своё письмо. наиболее данного в ряду данного определения он даёт кнопку, за своего что не в модели можно было отписаться, та естественно стоит со ряду автоматом.ну и график с ним. буду стоить дальше. может временно наиболее нарою.

На данном этапе улучшение качества упирается в подключение частотной базы. Понимаю что пример мягко говоря курьезный но хотелось бы услышать мнение по применимости такого контента и если его необходимо улучшить то до какого уровня?

у кого-нибудь есть ссылки на DVD с книгами в txt? нужен материал для снятия частотной базы.

---------- Добавлено 10.09.2016 в 21:43 ----------

AESCBC192:
Если не жалко, скиньте, я попробую оценить.

не жалко, но на ПМ нет времени, в icq могу скинуть.

bolyk, по частотным характреистикам я уже проверил 70-85% по алгоритму Ципфа, мне интересно субъективное мнение по поводу текста.

Всего: 704