tanir23

tanir23
Рейтинг
160
Регистрация
24.02.2008
AESCBC192:
не тот объем, второй момент - кодировку не нейро правят. думаю важен результат а сниппеты или нет - вопрос вторичный. оставлю сниппеты значит, это уже что-то вроде классики в подобного рода софтах))

так и предлогается брать объём с сайтов по снипету и подправить снипеты,

например тупо перемешать снипеты по запятым, и союзам а уже потом исправить морфологию

AESCBC192:
http://eclipse234565-001-site1.ftempurl.com/shtory_foto/shtory_svoimi_rukami_foto

На стадии багфикса.. В последний момент обнаружилась проблема "кубиков с вопросами", а касательно сниппетов, имхо вообще контент никакой с них, лучше идти по ссылкам с поисковиков и надергивать по предложению.

---------- Добавлено 15.09.2016 в 09:12 ----------

Плюсуйте кто за то чтобы выпилить метку сниппетов вообще и сделать мозаику из предложений текстов по ссылкам на сниппетах? Потому что после чистки снипов от телефонов и смайликов от них остается решето непрезентабельное.

так вот тут на этих снипетах и надо применить то что хотели делать с нейронной сетью.

исправить снипеты до презентабельного вида

vastmanager- не пробывал в своей перелинковке ставить ссылки на старые страницы , не сразу а скажем через день-два?

vastmanager:
Скрипт при работе берет случайные куски текста

то есть случайные предложения?

помнится пробивал на индекс твои тексты, в выдаче не находилось много предлож с одного дора при 3кб такого быть не должно было

Ringozo:
Достаточно уникальность проверить и все станет ясно

конечно, но везде могут иметься нюансы(не всегда можно всё увидеть)

vastmanager:
На основе готовых текстов все моментально делается и читаемо: http://host40.altmoney24.ru/ - кейворды только нормальные лень было ставить, чтобы в тему.
По любой тематике такой уровень текстовки получается за 10-15 мин. Время работы парсера.
Это образца 2003 года вообще скрипт.

чтоб не гадать расскажи как делаешь

AESCBC192:
это не на ключ а обычный текст модифицированный базой на основе текста про нейронную сеть. Можно считать что под кей "нейронная сеть".

у вас по ципфе-график диссертации ряд

а должно быть-нейронная сеть

да и по генерации , лучше не генерировать а уникализировать

ихмо

у меня по ципфе 53

причём для топа у гугла надо смотреть как он считает, что лучше( нейронная сеть или сеть нейронная)

AESCBC192:
Lastwarrior, ты лучше по текстовке скажи мнение. Софт еще дописывать.

на какой ключ этот текст?

просто уник по теме даст индекс, но возможны проблемы с топом

AESCBC192:
это как? мешанина слов уделывает белый текст?

---------- Добавлено 09.09.2016 в 19:52 ----------

bolyk, вы не просто дисперсию по стандартному распределению смотрите?

думаю ключевое слово--В среднем точность такова:

Мешанина из слов - 98%

Белая статья - 96%

очень интересно, в личку отправлю генерацию провериш?

Всего: 444