Текст по закону Ципфу.

12
ТР
На сайте с 24.09.2016
Offline
224
#11
samimages:
Ктонить сам закон читал или ограничились сниппетом сервиса по проверке?
В doncа, верю, остальные под вопросом, кроме Романа - он не читал))))

Это я к чему:

Естественно, т.к. выявленная закономерность основополагающая... а алгоритм как-бы построен на этом ибо являет собой суть стат. машину



Да, ибо раздрай по Ципфу не есть хорошо ни в рамках документа, ни в рамках всего сайта в целом.


Конечно нет, вы просто не читали закон ;) - отношение леммы к тексту это отношение, ферштейн? Если вам нужно 100 вхождений, а "Ципф" ругается - добавляйте текст, меняйте отношение.


Вот кстати да и если посмотреть на нее внимательно, то в начале формулы можно увидеть TF-IDF, который как раз о том ;)


В 0,001% нет, но вам оно ненужно)))

Тарасов Роман, за весь пост - все не верно. Почитайте, это на самом деле может оказаться интересным... а если заточиться в эту тему, то можно и до корпусов дойти, а это уже уровень.

Теперь обобщим.
Об чем там речь:
1.Ципф обратил внимание общественности, на тот факт, что все носители языка используют его статистически одинаково, т.е. "выдумывая" текст про установку окон (устно или письменно) носитель языка использует лемму окно с ожидаемой частотой, например. Отклонение от нормы в быту иногда называют словами-паразитами.

2.Математики учли это замечание и при расчетах в BM25 ограничились TF-IDF, которая сама по себе довольно хороша для работы с коллекциями.

3.Сеошники и Индекс
Так уж сложилось, что в нашем конкретном случае понятие "нормы" несколько размыто. Вы можете качнуть в русском корпусе статистику и удивиться сколько раз используется та или иная лемма к миллиону лемм на документ. Уже присная нам "окно", едвали на пару раз на лям (точно не помню). А мы лепим по 30 на 1000 б/п, кстати средняя длина в русском 7 знаков на слово итого 1000/7 = 142 слова.

И вот уже отсюда понятие нормы для СЕРПа по запросу, будет каждый раз разным и возможно даже статистически не близким, что-то сгладит алгоритм на основе поведенческих... ну а где-то)))

Важно, Тарасов Роман, Ципф будет работать даже так ;) в этом прикол.

Читаем мой пост со скриншотом. Там текст подогнан под этот закон. Будет он работать? Что-то сомневаюсь.

Я не отрицаю, того что этот закон в определенных случаях работает, но не нужно возносить его в абсолютную истину. Еще раз повторюсь, что текст написанный не идиотом, будет спокойно проходить проверку. Я уже не говорю, про то что не встречал в ТОП 50 текстов, которые не проходят проверку.

p.s. Вообще эту закономерность не Зипф открыл, а Жан-Батист Эсту в 1908 году.

Как копирайтеру хорошо зарабатывать (https://copywriting-tarasov.ru/?p=613) https://copywriting-tarasov.ru/ (https://copywriting-tarasov.ru/) Бесплатный аудит РК в Яндекс.Директе
samimages
На сайте с 31.05.2009
Offline
427
#12
Тарасов Роман:
Читаем мой пост со скриншотом. Там текст подогнан под этот закон. Будет он работать? Что-то сомневаюсь.

Ципф не определяет смысл текста только закономерность. Все сервисы, только считают отношение и погрешность между ними зависит не от математических действий, а от чистоты стемминга, которая, к слову, у pr-cy.ru так себе.

Под Ципфа можно подогнать любой бредотекст и он будет статистически верным, вероятно спамным относительно других статистически верных текстов.

Я потому отдельно упомянул о том, что без запроса и СЕРПа по нему - Ципф в интернетах ничего не определяет, т.к. индекс Яндекса далек от корпуса русского языка по статическим частотам.

Опыт как иммунитет — приобретается в муках! Хостинг: экономия до 1300 руб + домен в подарок ( https://clck.ru/XLscf ) / Аудит семантики от 15К [долго] - ЛС
cblcg
На сайте с 28.06.2012
Offline
232
#13

Мое мнение, что важна низкая водность

SmileP
На сайте с 18.02.2010
Offline
386
#14
cblcg:
низкая водность

На адвего были копирайторы, которые жаловались на заказчиков, которые требовали 0-й водности.

samimages:
иная лемма к миллиону лемм на документ. Уже присная нам "окно", едвали на пару раз на лям (точно не помню). А мы лепим по 30 на 1000 б/п

Сравниваете idf и TF... Естественно idf != TF, (даже если не брать логарифм) вот и лепим.

Корпус же не только про окна.

xtras
На сайте с 03.12.2013
Offline
342
#15

Сегодня нужно было по сантехнике инфу посмотреть, нашел в топе статью - пишет настоящий сантехник - такой черезжопицы вообще мало встречал, мат-перемат, дык, тык, в общем, видно, быдло в самом своем махровом проявлении не только оказывает соответствующие услуги, но и пробует себя в создании "полезных сайтов для людей", ну, а стилистика соответсвует уровню интеллектуального развития - там Ципф плачет и крутится в гробу, как пропеллер от такого надругательства над всеми законами связной речи. Но, тем не менее, сайт в топе, под каждой публикацией миллиард комментов от собратьев по разуму - ыыы, йоу, братан, круть, ...#$@%ля, ..$#%.ать, и т.п.

Вот такоф вот вам Ципф.

The WishMaster
На сайте с 29.09.2005
Offline
2543
#16
cblcg:
Мое мнение, что важна низкая водность

Да глупости это. Водность, плотность, академическая тошнота, главред какой-то там - чисто коммерческие выдумки сайтов с проверками на эти говнопоказатели. К качеству текста и, тем более, к реакции на него поисковиков, это имеет отношения чуть меньше, чем никакого.

Если заказчик требует больше чем один из этих параметров у копирайтера - есть сомнения в том, что он хоть что-то понимает в СЕО.

Пешу текста дешыго! Тематики - туризм, СЕО, творчество, кулинария, шизотерика :)
cblcg
На сайте с 28.06.2012
Offline
232
#17

Если водность не ограничивать, то копиратеры лепят побольше прилагательных и прочей воды в текст, дабы быстрее объем нарастить

SmileP
На сайте с 18.02.2010
Offline
386
#18
cblcg:
то копиратеры лепят побольше прилагательных и прочей воды в текст

Угу, а высокую уникальность делают бредо синонимайзом.

ИМХО, проще натаскать копирайтора, а не писать 100500 требований к тексту.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий