Как это возможно?
Ищите... что-то есть. В коде скорее всего, врятли это контент как таковой. А Платону напишите, на третий раз вам ответит человек.
Нет.
Алкоголь снижает защиту... если пить, то колоться смысла не очень много, Но если пройти первые три укола и если животина под наблюдением, т.е. вы знаете что она не сдохла, то остальные три можно неделать/пить
И там, это... по алкашке не полгода, а полгода после последнего укола, т.е. 9 месяцев от первого шприца ;)
Дропы могут быть... а Платон чего говорит?
И на машине не стоит ездить, можно попасть в ДТП.
А вдруг?!
Ципф не определяет смысл текста только закономерность. Все сервисы, только считают отношение и погрешность между ними зависит не от математических действий, а от чистоты стемминга, которая, к слову, у pr-cy.ru так себе.
Под Ципфа можно подогнать любой бредотекст и он будет статистически верным, вероятно спамным относительно других статистически верных текстов.
Я потому отдельно упомянул о том, что без запроса и СЕРПа по нему - Ципф в интернетах ничего не определяет, т.к. индекс Яндекса далек от корпуса русского языка по статическим частотам.
Ктонить сам закон читал или ограничились сниппетом сервиса по проверке?
В doncа, верю, остальные под вопросом, кроме Романа - он не читал))))
Это я к чему:
Естественно, т.к. выявленная закономерность основополагающая... а алгоритм как-бы построен на этом ибо являет собой суть стат. машину
Да, ибо раздрай по Ципфу не есть хорошо ни в рамках документа, ни в рамках всего сайта в целом.
Конечно нет, вы просто не читали закон ;) - отношение леммы к тексту это отношение, ферштейн? Если вам нужно 100 вхождений, а "Ципф" ругается - добавляйте текст, меняйте отношение.
Вот кстати да и если посмотреть на нее внимательно, то в начале формулы можно увидеть TF-IDF, который как раз о том ;)
В 0,001% нет, но вам оно ненужно)))
Тарасов Роман, за весь пост - все не верно. Почитайте, это на самом деле может оказаться интересным... а если заточиться в эту тему, то можно и до корпусов дойти, а это уже уровень.
Теперь обобщим.
Об чем там речь:
1.Ципф обратил внимание общественности, на тот факт, что все носители языка используют его статистически одинаково, т.е. "выдумывая" текст про установку окон (устно или письменно) носитель языка использует лемму окно с ожидаемой частотой, например. Отклонение от нормы в быту иногда называют словами-паразитами.
2.Математики учли это замечание и при расчетах в BM25 ограничились TF-IDF, которая сама по себе довольно хороша для работы с коллекциями.
3.Сеошники и Индекс
Так уж сложилось, что в нашем конкретном случае понятие "нормы" несколько размыто. Вы можете качнуть в русском корпусе статистику и удивиться сколько раз используется та или иная лемма к миллиону лемм на документ. Уже присная нам "окно", едвали на пару раз на лям (точно не помню). А мы лепим по 30 на 1000 б/п, кстати средняя длина в русском 7 знаков на слово итого 1000/7 = 142 слова.
И вот уже отсюда понятие нормы для СЕРПа по запросу, будет каждый раз разным и возможно даже статистически не близким, что-то сгладит алгоритм на основе поведенческих... ну а где-то)))
Важно, Тарасов Роман, Ципф будет работать даже так ;) в этом прикол.
В этом сценарии она положила бы и стоп хамов и полтротуара... и да это был бы именно естественный отбор ;)
Дык а где они?
Когда был пик трафа? Дайте период дат.