Определение естественности контента

12
J
На сайте с 08.06.2006
Offline
844
2056

По каким алгоритмам Яндекс определяет естественность контента. Когда то читал, что в естественном тексте каждое слово встречается определенное количество раз. Вроде какой то математический или филологический закон такой есть. Кто в курсе?

Getzzz
На сайте с 06.04.2008
Offline
66
#1

На такие вопросы вам не дадут ответа.

Это знает только яндекс и то если знает...

GeorgeWhite
На сайте с 27.05.2008
Offline
131
#2

Высчитывать слова в тексте для естественности - это все равно что думать при ходьбе как ноги переставлять.

J
На сайте с 08.06.2006
Offline
844
#3
GeorgeWhite:
Высчитывать слова в тексте для естественности - это все равно что думать при ходьбе как ноги переставлять.

точно есть закон, который описывает зависимость естественности до частоты применения слов в тексте

вот вспомнить где читал о нем не могу

O9
На сайте с 12.06.2010
Offline
79
#4
joost:
точно есть закон, который описывает зависимость естественности до частоты применения слов в тексте
вот вспомнить где читал о нем не могу

http://ru.wikipedia.org/wiki/%D6%E5%EF%FC_%CC%E0%F0%EA%EE%E2%E0

Не знаешь где продать свой сайт дорого? Тогда тебе сюда Биржа сайтов Telderi (http://www.telderi.ru/?pid=0aaaf1) Заказать текст для своего сайта можно здесь Etxt биржа контента (http://www.etxt.ru/toissobl.html)
GeorgeWhite
На сайте с 27.05.2008
Offline
131
#5
J
На сайте с 08.06.2006
Offline
844
#6
GeorgeWhite:
Не про закон Зипфа (Ципфа) речь?

он родимый ! СПАСИБО!

DC
На сайте с 17.06.2010
Offline
51
#7

Закон Ципфа едва ли имеет отношение к алгоритму определения естественности контента, скорее он относится к весам слов.

Pavel Medvedev
На сайте с 27.01.2006
Offline
166
#8

Да, у ципфа совсем примитивный алгоритм. Он разве что может показать неестественность текста из случайно сгенерированных символов "ар амва авммер авпмьк парв". Спамный или умело сгенерированный текст вполне нормально подходит под распределение ципфа.

У Яндекса и других исследователей много работ по определению естественности текста в открытом доступе. Можете поискать. Многое, правда, не на русском языке.

Из простых методов - можно смотреть на повторяемость двухсловников и трехсловников в тексте, чтобы выявить аномальные отклонения (текст, заточенный под ключевики). Этот показатель, например можно частично посмотреть с помощью среза в Istio или с помощью сжимаемости текста любыми алгоритмами сжатия.

Консультирую по SEO. Опыт c 2005: окна топ1,Ашан,Фишки,Спортс и др. Пишите в FB.
Filan
На сайте с 26.05.2011
Offline
119
#9

joost, Зачем Вам этим замораживаться? Просто пишите тесты для людей.

TayBuy
На сайте с 29.06.2012
Offline
66
#10

Любой текст, заточенный под ключевое слово, вряд ли уже можно назвать естественным.)

Эффективная реклама в Яндекс.Директе. (/ru/forum/951297) Мои сертификаты: Сертификат Яндекс.Директ. (https://yandex.ru/adv/expert/certificates/XX9cuu7cf) Сертификат Google Adwords. (https://www.google.ru/partners/#i_profile;idtf=101963959640572087741;)
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий