тошнота текста

september
На сайте с 11.09.2009
Offline
591
#31

Алексей Питерский, какие баги?

$ карта для вывода вебмани в любой точке мира (https://www.epayments.com/registration?p=dc2462e885)
Алексей
На сайте с 23.02.2009
Offline
586
#32

september, я про некорректный АП, когда сайт в топе на 1-2 апа, а также аффилиаты, фильтр тошнота, который показывает не релевантную стр.

fivefinger
На сайте с 27.01.2011
Offline
87
#33
Ladycharm:
Вопрос в том, как он определяет эту "естественность". Если по литературным произведениям, типа "Война и Мир" - это одно, если среднее по больнице проиндексированным сайтам - совсем другое.

Вот что по этому поводу думает википедия:

если все слова языка (или просто достаточно длинного текста) упорядочить по убыванию частоты их использования, то частота n-го слова в таком списке окажется приблизительно обратно пропорциональной его порядковому номеру n (так называемому рангу этого слова, см. шкала порядка). Например второе по используемости слово встречается примерно в два раза реже, чем первое, третье — в три раза реже, чем первое, и т. д.

Как видите, "Войной и Миром" здесь и не пахнет. :)

EvilMinds - пока другие делают вид, мы работаем на результат. (/ru/forum/936293)
YaanGle
На сайте с 06.09.2011
Offline
155
#34
fivefinger:
Вот что по этому поводу думает википедия:

Как видите, "Войной и Миром" здесь и не пахнет. :)

достаточно длинного текста

Как определить, что текст достаточно длинный ?

SmileP
На сайте с 18.02.2010
Offline
386
#35
fivefinger:
Как видите, "Войной и Миром" здесь и не пахнет.

Почему? Если брать среднестатистическую языковую выборку- то все технически, юридически и т.п. сайты давно были бы под фильтрами за неестественность.

Есть же тематики, может есть и тематика "война и мир" :)

fivefinger
На сайте с 27.01.2011
Offline
87
#36
YaanGle:
достаточно длинного текста
Как определить, что текст достаточно длинный ?

Ок, можно перефразировать так - достаточно текста произвольной длинны.

SmileP:
Почему? Если брать среднестатистическую языковую выборку- то все технически, юридически и т.п. сайты давно были бы под фильтрами за неестественность.
Есть же тематики, может есть и тематика "война и мир"

Вы утрируете, с чего этим сайтам быть под фильтрами? Вы удивитесь, но если смотреть естественность по тому же Ципфа, то естественность текстов будет в пределах допустимых значений, разумеется если тексты искусственно не были переоптимизированы.

YaanGle
На сайте с 06.09.2011
Offline
155
#37
fivefinger:
Ок, можно перефразировать так - достаточно текста произвольной длинны.

Эта уже ваша выдумка.:) В тексте произвольной длины этот закон соблюдаться не будет.

Вы утрируете, с чего этим сайтам быть под фильтрами? Вы удивитесь, но если смотреть естественность по тому же Ципфа, то естественность текстов будет в пределах допустимых значений, разумеется если тексты искусственно не были переоптимизированы

Если я правильно понял, SmileP имел в виду что в войне и мир слово "оружие" могло встречаться в 10 раз чаще чем слово банкротство. А в тексте юридической тематики наоборот. Поэтому, видимо, при оценке естественности текста специфичной тематики, равнятся на частоту использования слова в всём языке, оценка может быть далеко неточной.

fivefinger
На сайте с 27.01.2011
Offline
87
#38
YaanGle:
Эта уже ваша выдумка. В тексте произвольной длины этот закон соблюдаться не будет.

Готов поспорить что будет, при условии что это некий осмысленный текст. И если его разложить по частоте употребления слов в нем, то закон будет соблюдаться.

YaanGle:
Поэтому, видимо, при оценке естественности текста специфичной тематики, равнятся на частоту использования слова в всём языке, оценка может быть далеко неточной.

Ну вполне возможно, что есть некие индексы по частоте употребления тех или иных слов для тематики, на которые равняются при оценке естественности, но не думаю, поскольку это излишние данные, а тот же Ципфа позволяет смотреть естественность без привязки к тематике и языку.

SmileP
На сайте с 18.02.2010
Offline
386
#39
fivefinger:
а тот же Ципфа позволяет смотреть естественность без привязки к тематике и языку

По:

http://pr-cy.ru/zypfa/

Используя наш сервис, Вы сможете проверить любую страницу вашего сайта по закону Ципфа. Тем самым Вы легко оцените естественность вашего текста на странице. Чем выше процент результата, тем идеальнее ваша страница. Хороший уровень естественности - это от 50% и выше.

Есть страницы в топе по вч юр.тематике:

Результат: 74%

Т.е. вроде как норм. Но я не видел, чтобы контент, написанный человеком был ниже 50%.

Т.е. получается контент написанный человеком будет естественным? Но такой контент может попасть под фильтр.

fivefinger
На сайте с 27.01.2011
Offline
87
#40
SmileP:
Т.е. вроде как норм. Но я не видел, чтобы контент, написанный человеком был ниже 50%.

аналогично.

SmileP:
Т.е. получается контент написанный человеком будет естественным? Но такой контент может попасть под фильтр.

Получается что так, только с одной поправкой, написанный человеком для людей. Если честно, то я пока не видел, чтобы контент написанный людьми для людей попадал под санкции. Это ещё постараться надо. :)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий