Текст созданый по алгоритму цепи Маркова.

[Удален]
#31

Ну для цепей Маркова не обязательно заниматься нейронными сетями как впрочем и быть "супер-пупер" математиком, достаточно быть программистом уровня выше "школьника-самоучки" (что подразумевает знание математики на уровне "чуть выше школьного") и программа такая создастся с нуля за час. (50 минут подумать/прикинуть и 10 минут написать)

P.S. Я не "дорвейщик", и даже толком и не "сеошник" я программист.

L
На сайте с 03.05.2006
Offline
171
#32

На сколько я понимаю понять текст для людей или нет может только человек.

Гугль пользует другие методы.

greenwood
На сайте с 08.09.2003
Offline
519
#33
Parasol:
Просто у меня есть знакомый, отличный математик/программист.

это хорошо, но и самому бы неплохо знать ...

так вот спроси его, может ли сгенеренный по маркину контент иметь заданную плотность ключевого слова ?

urbanajangla
На сайте с 20.01.2005
Offline
52
#34
luxs:
На сколько я понимаю понять текст для людей или нет может только человек.
Гугль пользует другие методы.

Далеко не факт, что программа не сможет сгенерить связной текст. Пример - генератор бреда от Яндекса. Гугль, как и Яндекс, кушают на "ура".

{купить|продать} {морды|мордашки|внутренние|статьи|ссылки в тексте} (http://www.setlinks.ru/?pid=1837)
L
На сайте с 03.05.2006
Offline
171
#35
urbanajangla:
Далеко не факт, что программа не сможет сгенерить связной текст. Пример - генератор бреда от Яндекса. Гугль, как и Яндекс, кушают на "ура".

ага кушают. И никак не могут опредлелить есть там смысл или нету.

I7
На сайте с 07.04.2007
Offline
84
IG7
#36

Судя по последним патентам гугля, маты кацы всерьёз взялись за автоматические / полуавтоматические генераторы текста. Даже новостные порталы с ограниченным лексиконом и словарным запасом сотрудников страдают... Кроме плотности к. слов гугл отслеживает частоту встречабельности тех или иных фраз в массе текста и может отнести текст к низкокачественному/сгенеренному даже за то что там 2 раза упомянулась фраза которая должна была там появиться с вероятностью 1:1000000.

Lor
На сайте с 28.05.2004
Offline
352
Lor
#37
Parasol:
Скажите, как на данный момент гугл относиться к тексту который был создан по алгоритму цепей Маркова? Он его сразу распознает на текстНеДляЛюдей или нормально проходит?

Эти "дети лейтенанта Шмидта" совсем оборзели. Уже и до раздела "Гугл" со своими бомжацкими вопросами добрались.

Йопез - форум без модераторов. https://yopez.com
greenwood
На сайте с 08.09.2003
Offline
519
#38

вопросы ТС больше соотносятся к разделу Doorways, Hallways, Metatags&Cloaking

AiK
На сайте с 27.10.2000
Offline
257
AiK
#39

Я ещё раз толкну мысль: идеально сгенерированный текст Гугль отловить не в состоянии. Но он в состоянии определить стиль текста и на этом основании определить качество текста. Речь идёт о том, что разговорный, газетный, научный и литературный тексты обладают разными ярко выраженными характеристиками - оборотами, словарным разнообразием, частотой употребления терминов и синонимов к нему, прилагательных, глагольных форм и т.п. и т.д. Более того, Гугль обладает очень большой коллекцией n-gramm, т.е. может делать далекоидущие выводы сравнивая соседние документы с сервера: скажем, слишком обширное использование статистически редких n-gramm в разных документах может служить признаком автогенерированности.

Таким образом, если есть желание максимально продлить успешную жизнь таких текстов, необходимо очень тщательно подходить к обучающим коллекциям. Уж всяко нельзя для этого парсить выдачу, т.к. можно накушаться такого же автогенерённого контента и поставить под угрозу проект с самого начала. Вот как-то так.

L
На сайте с 03.05.2006
Offline
171
#40

а вот например текст написанный малограмотным переводчиком? может даже хуже чем автоматическая переводилка - как такой текс рассматривать гуглу?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий