Проверил два сайта, которые пишут хорошо, но на самом деле Яндекс считает плохо - Сервисы и программы для работы с SE

Сервис проверки естественности текста.

loki6982 · 2026-07-01T11:07:01.0000000Z

Авторы этих строк ни в коем случае не претендуют на роль истинны в последней инстанции, скорее это мысли вслух, с которыми каждый вправе согласиться или не согласиться. 1. Что такое хороший текст? Ответить на этот вопрос лучше, чем сделал это Яндекс, вряд ли получится. Всех желающих отсылаем к первоисточнику ( webmaster.ya.ru/replies.xml?item_no=11464 ). А вкратце, суть следующая: текст должен быт для людей, а не для машин. 2. Каковы критерии оценки качества текста? Идея того, что текст должен быть для людей, не нова. С этой целью специалистами были выведены различные показатели количественного измерения этой характеристики: плотность и тошнота текста. С нашей точки зрения применение столь плоской модели анализа текста не выдерживает никакой критики. Основным критерием оценки текста является его «естественность». 3. Естественность текста и диаграмма Ципфа. Качественную оценку естественности текста можно получить, основываясь на работу лингвиста Ципфа. Всех желающих отсылаем к первоисточнику (ru.wikipedia.org/wiki/Закон_Ципфа). А вкратце, суть следующая: график зависимости упорядоченной по убыванию частоты встречаемости слов имеет вид гиперболы, причем, что забавно, это справедливо для любого языка и любого текста. Другими словам, существуют объективные критерии оценки естественности текста, они общеизвестны, и поисковые машины, вероятно, о них знают. Попробуете поспорить?! 4. Что мы предлагаем? Мы предлагаем обсуждать не мифическую «тошноту» страницы или не менее спорный параметр «плотность ключевых слов». Мы предлагаем Вам опираться при оценке качества текста на степень его «естественности», другими словами степень соответствия закону Ципфа. 5. Где это можно сделать? Проверить «естественность» текста можно при помощи сервиса 1y.ru ( http://1y.ru ). Есть возможность проверить веб-страницу, сайт целиком или любой текст на его «естественность». - Проверка веб-страницы позволит вам понять, насколько данная страница вписывается в рамки распределения Ципфа, и получить рекомендации по модификации ключевых слов (увеличение/уменьшение количества слов в тексте). Проверка сайта позволит вам получить общую картину соответствия диаграмме Ципфа страниц вашего проекта. Затем вы можете перейти к анализу отдельных страниц и их последующей модификации. Проверка текста позволит вам заранее проанализировать «естественность» любого текста на соответствие закону распределения Ципфа. Полезная идея для копирайтеров: перед тем как сдавать текст заказчику, проверьте его «естественность».

107

natalya84i

14 сентября 2012, 08:18

#11

Интересный сервис, но почему-то сайт целиком отказался проверять, хотя он на русском :)

Азбука блогера (https://mycrib.ru/)

497

OPTIMER

14 сентября 2012, 08:24

#12

loki6982:
другими словами степень соответствия закону Ципфа

во

хорошо, что вы пишите, что будет соответствие не алгоритмам яндекса, а ципфа, понятно, что тяжело сделать то, что хочет Яндекс, нужны и знания, и умения...

а если говорить вообще, то лучше делать сервис, который будет вообще весь сайт на качество проверять, опираясь не только на его контент, но и его структуру чекать, и т.п.

т.к. проверил два сайта, которые пишет хорошо, но на самом деле Яндекс считает плохо)

но это уже дело не ципфа, а Яндекса)

Тоесть, хочется чего-то нового от сервиса такого рода.
Изюминки.
Новизны.
Изящности.))

ps сайт еще немного долго грузится, но это пофиг

оО Раскрутка сайтов без абон. платы, единоразово от 100.000 руб.

Парсер Яндекса 8.11.13 зеркала Система SeoPult автоматизированное продвижение

152

Urbanoid

14 сентября 2012, 08:25

#13

А как определяется "авторитетность" сайта?

O

52

Oxem

14 сентября 2012, 12:30

#14

tolika:
Задумка, конечно, интересная.

1. Кстати, по "авторитетным" заявлениям некоторых исследователей, поисковики проводят статистический анализ "естественности" сочетаемости слов (пар слов) (биграмм). Ведутся ли разработки в этом направлении?

2. Во многих технических и научных текстах "переспам" некоторыми терминами просто неизбежен (например, инструкция по применению аспирина) - как поисковики относятся к таким "естественно переспамленным" текстам?

3. При определении релевантности текста (ключевого слова) запросу, частотность ключа (imho) должна быть выше среднестатистической... Или это необязательное условие?

============================================================
В качестве эксперимента отредактировал ГС своего блога согласно вашим рекомендациям. Через месяц отпишусь.

Спасибо за комментарии, постараемся ответить на поставленные вопросы.

1.Данные «авторитетные» исследователи ссылаются, очевидно, на публикацию: «Поиск неестественных текстов». Источник: http://download.yandex.ru/company/A_Kustarev_A_Raigorodsky_poisk_neestestvennih_textov_statia.pdf.

Следует обратить внимание, что авторы статьи позиционируют данный метод как один из возможных вариантов определения «естественности текста» и никоим образом не утверждают, что он используется ПС Яндекс.

2.Согласно закону Ципфа частотность встречаемости слов должна ложиться на некую плавную кривую (диаграмма Ципфа ) Мы поставили несколько экспериментов на технических (математических) текстах. Результаты показали «70%» соответствия, при достаточных объемах.

3.По нашему мнению это не обязательное условие.

P.S. ТС сейчас отсутствует, приходиться отвечать за него :)

Ставка на трафик – Как спамить Рамблер. Любителям Ранжирование страниц сайта vk.com

148

site+

14 сентября 2012, 12:46

#15

loki6982:
Ребят это-же явно рекламные тексты . А рекламные текста не может быть естественной:). Что доказывает что теория работает 😂

А если взять эту (вторую) страницу топика целиком, то тоже "Оценка качества: 42% (плохо)"....

Выходит тут боты штампуют посты, а мы читаем, находим смысл...

Размещение статей на 300+ сайтах всего за 80$! Инновационное предложение! ( /ru/forum/874956 )

O

52

Oxem

14 сентября 2012, 13:06

#16

site+:
А если взять эту (вторую) страницу топика целиком, то тоже "Оценка качества: 42% (плохо)"....
Выходит тут боты штампуют посты, а мы читаем, находим смысл...

Здесь больше половины рекламных текстов.

У меня на (второй) странице получилось 59% :)

148

site+

14 сентября 2012, 13:23

#17

Oxem:

У меня на (второй) странице получилось 59% :)

Это потому что уже вместе с моим постом, он внес немного естественности ;)

P

103

pimandr

14 сентября 2012, 13:30

#18

Идея хорошая, и что важнее - при беглой проверке реальной ситуации не противоречит)

2 вопроса к вам:

- планируется ли вариант исключения из текстов страницы участков, закрытых от индексации?

- если не секрет, что за словарь словоформ используется? И насколько он полон?

coolakov.ru/tools (http://coolakov.ru/tools/): определение конкурентов (http://coolakov.ru/tools/most_promoted/), кластеризация запросов (http://coolakov.ru/tools/razbivka/) и т.д.

Google о частоте сканирования Google назвал 2 самые Как создать контент под

[Удален]

14 сентября 2012, 14:46

#19

Cервис не развит, вообще на нулевом этапе...

1. Эта естественность по Ципфу работает для большИх объемов, а не для страницы (да и для яндекса надо проверять совокупно все тексты сайта вместе).

2. Какая цель проверки? оптимизировать страницы? сделать читабельными? для начала я б вообще выкидывал все тексты имеющие словарь менее 400 слов - там и определять нечего.

3. была или есть(но уже доработанная до идеала) у яндекса такая прога - stemmer... там куча строк и правил по приведению текста в ед. число им. падежа (кто успел, тот спи...л ее, она некоторое время лежала в открытом доступе).. вот после обработки ей и надо проверять, но и это не все...

4. после приведения всех слов к ед числу им. падежа, необходимо их привести (в зависимости от тематики текста) к главному(основному) синониму(такую прогу яндекс вроде выкупил у cognitive в 2008 году) и тогда можно сравнивать с другими текстами в этой тематики, и, если будет совпадение более 70-80%, то уже легко найти источники рерайта, перевода, синонимайза - текст будет неоригинальным и не будет высоко ранжироваться яндексом... хотя тут требуется еще и сравнение ссылок (внутренних и внешних) на страницу - легко можно будет просчитать топ

5... много еще чего можно писать, но лень...

Зы сервис сырой, хотя бы не кривую по ципфу указали, а 2 кривых, внутри которых надо оказаться.. да и такую хрень я в икселе несколько лет назад делал, статистику через istio.com собираешь и смотришь на кривую - но работать это будет только по запросу в кавычках - по точной фразе

Как показатель качества страницы NetPromoter 2010: доклад Александра Подбор слов в контекстной

O

52

Oxem

17 сентября 2012, 07:08

#20

pimandr:
Идея хорошая, и что важнее - при беглой проверке реальной ситуации не противоречит)
2 вопроса к вам:
- планируется ли вариант исключения из текстов страницы участков, закрытых от индексации?
- если не секрет, что за словарь словоформ используется? И насколько он полон?

Спасибо за интерес, проявленный к нашему сервису.

-Да, такая возможность будет реализована. Мы постоянно дорабатываем и улучшаем наш сервис.

-Используемый словарь - это наша личная разработка. При обработке текста погрешность в районе 10%

Все что нужно знать о DDоS-атаках грамотному менеджеру

Яндекс Вебмастер вынес товарные фиды в отдельный раздел

Сервис проверки естественности текста.