Для цепей Маркова не нужно заниматься нейронными сетями, достаточно быть программистом уровня выше - Doorways & Cloaking

Текст созданый по алгоритму цепи Маркова.

hawk121 · 2007-07-04T20:29:09.0000000Z

Извините что задаю подобный вопрос, но нормальной инфы найти не удается. Что такое цепи Маркова и как их используют в производстве дорвеев?:confused:

[Удален]

10 июля 2007, 22:39

#31

Ну для цепей Маркова не обязательно заниматься нейронными сетями как впрочем и быть "супер-пупер" математиком, достаточно быть программистом уровня выше "школьника-самоучки" (что подразумевает знание математики на уровне "чуть выше школьного") и программа такая создастся с нуля за час. (50 минут подумать/прикинуть и 10 минут написать)

P.S. Я не "дорвейщик", и даже толком и не "сеошник" я программист.

SEO фильтры . Бесплатная Яндекс в третий раз Может ли сайт получить

L

171

luxs

10 июля 2007, 23:22

#32

На сколько я понимаю понять текст для людей или нет может только человек.

Гугль пользует другие методы.

519

greenwood

11 июля 2007, 05:06

#33

Parasol:
Просто у меня есть знакомый, отличный математик/программист.

это хорошо, но и самому бы неплохо знать ...

так вот спроси его, может ли сгенеренный по маркину контент иметь заданную плотность ключевого слова ?

52

urbanajangla

11 июля 2007, 14:55

#34

luxs:
На сколько я понимаю понять текст для людей или нет может только человек.
Гугль пользует другие методы.

Далеко не факт, что программа не сможет сгенерить связной текст. Пример - генератор бреда от Яндекса. Гугль, как и Яндекс, кушают на "ура".

{купить|продать} {морды|мордашки|внутренние|статьи|ссылки в тексте} (http://www.setlinks.ru/?pid=1837)

L

171

luxs

11 июля 2007, 15:09

#35

urbanajangla:
Далеко не факт, что программа не сможет сгенерить связной текст. Пример - генератор бреда от Яндекса. Гугль, как и Яндекс, кушают на "ура".

ага кушают. И никак не могут опредлелить есть там смысл или нету.

I7

84

IG7

11 июля 2007, 15:29

#36

Судя по последним патентам гугля, маты кацы всерьёз взялись за автоматические / полуавтоматические генераторы текста. Даже новостные порталы с ограниченным лексиконом и словарным запасом сотрудников страдают... Кроме плотности к. слов гугл отслеживает частоту встречабельности тех или иных фраз в массе текста и может отнести текст к низкокачественному/сгенеренному даже за то что там 2 раза упомянулась фраза которая должна была там появиться с вероятностью 1:1000000.

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

352

Lor

11 июля 2007, 16:03

#37

Parasol:
Скажите, как на данный момент гугл относиться к тексту который был создан по алгоритму цепей Маркова? Он его сразу распознает на текстНеДляЛюдей или нормально проходит?

Эти "дети лейтенанта Шмидта" совсем оборзели. Уже и до раздела "Гугл" со своими бомжацкими вопросами добрались.

Йопез - форум без модераторов. https://yopez.com

519

greenwood

11 июля 2007, 16:10

#38

вопросы ТС больше соотносятся к разделу Doorways, Hallways, Metatags&Cloaking

257

AiK

11 июля 2007, 16:14

#39

Я ещё раз толкну мысль: идеально сгенерированный текст Гугль отловить не в состоянии. Но он в состоянии определить стиль текста и на этом основании определить качество текста. Речь идёт о том, что разговорный, газетный, научный и литературный тексты обладают разными ярко выраженными характеристиками - оборотами, словарным разнообразием, частотой употребления терминов и синонимов к нему, прилагательных, глагольных форм и т.п. и т.д. Более того, Гугль обладает очень большой коллекцией n-gramm, т.е. может делать далекоидущие выводы сравнивая соседние документы с сервера: скажем, слишком обширное использование статистически редких n-gramm в разных документах может служить признаком автогенерированности.

Таким образом, если есть желание максимально продлить успешную жизнь таких текстов, необходимо очень тщательно подходить к обучающим коллекциям. Уж всяко нельзя для этого парсить выдачу, т.к. можно накушаться такого же автогенерённого контента и поставить под угрозу проект с самого начала. Вот как-то так.

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

L

171

luxs

11 июля 2007, 20:44

#40

а вот например текст написанный малограмотным переводчиком? может даже хуже чем автоматическая переводилка - как такой текс рассматривать гуглу?

Вышел новый Яндекс Браузер с YandexGPT и YandexART

Как снизить ДРР до 4,38% и повысить продажи с помощью VK Рекламы

Текст созданый по алгоритму цепи Маркова.