Page Audit - технический и контентный аудит

Виталий Климин
На сайте с 09.01.2018
Offline
56
#91
vitzer:
Подписался, но сразу письма не получил. Сейчас все норм.

Да, задумано, что код будет дариться не за факт подписки, а только постоянным читателям. Поэтому подарочный код прикладывается именно в конце каждого сообщения.

Все свои утверждения проверяю через Page Audit (https://page-audit.ru)
Виталий Климин
На сайте с 09.01.2018
Offline
56
#92

ПРО СМАРТ-СИНОНИМЫ И РАНЖИРОВАНИЕ

Пожалуй, все понимают, что поисковые алгоритмы должны учитывать синонимы ключевых слов в заголовках.

Но как они это делают, как обрабатывают и какой из синонимов лучший?

Чтобы приоткрыть эту тайну, для общего понимания и правильного анализа текстов необходимо ввести понятие "смарт-синоним". Страждущие знаний могут ознакомиться с его определением в Глоссарии (https://vk.com/topic-187790503_40689215).

⭐ Уже сейчас анализатор Page Audit (https://page-audit.ru) может провести анализ BM25 по смарт-синонимам в заголовке Title, а подписчики «SEO Тайн» (https://vk.com/paudit?w=app5748831_-187790503) лично узнают, как используются смарт-синонимы при формировании Тайтла, и получат бесплатный доступ к анализатору, чтобы первыми проверить качество своих сайтов.

Виталий Климин
На сайте с 09.01.2018
Offline
56
#93

О РОЛИ HTTP/2 В ПРОДВИЖЕНИИ САЙТА

Примерно 5 лет назад был утверждён протокол передачи данных HTTP/2, но до сих пор более половины сайтов Рунета не пользуются его преимуществами.

С чем связана такая ситуация? Какие преимущества предоставляет HTTP/2 для продвижения? Как подключить поддержку этого протокола на своём сервере?

⭐ Уже сейчас анализатор Page Audit (https://page-audit.ru) может проверить ваш сайт на поддержку HTTP/2, а подписчики «SEO Тайн» (https://vk.com/paudit?w=app5748831_-187790503) лично узнают, как HTTP/2 помогает в продвижении, и получат бесплатный доступ к анализатору, чтобы первыми проверить качество своих сайтов.

Виталий Климин
На сайте с 09.01.2018
Offline
56
#94

О РЕДИРЕКТАХ СТРАНИЦ И ПРОЧИХ КОДАХ

Идеально, когда документ возвращает код HTTP 200. Страница, возвращающая иной конечный код, исчезает из поисковой выдачи.

Но в реальной жизни документы могут возвращать не просто код, а целую цепочку кодов, состоящую из разного рода редиректов. В большинстве случаев админы контролируют ситуацию на своих серверах и сайтах. Но как к редиректам в цепочках относятся поисковые боты?

Классический вариант - редирект по коду 301. Тут всё понятно. Рано или поздно ссылающийся документ выпадет из выдачи, и его место займёт документ, на который идёт перенаправление.

Но есть и другие редиректы: 302, 307, 308.

Что с ними? Правильно ли их понимают поисковые системы? Как к этим кодам относятся алгоритмы? Какие отношения у Гугла с 302-й переадресацией, где подводные камни? Можно ли ими пользоваться или стоит стараться избегать?

⭐ Уже сейчас анализатор Page Audit (https://page-audit.ru) может проверить ваш сайт на редиректы, а подписчики «SEO Тайн» (https://vk.com/paudit?w=app5748831_-187790503) лично узнают, какие HTTP-коды лучше исключить, а какими можно безболезненно пользоваться, и получат бесплатный доступ к анализатору, чтобы первыми проверить страницы своих сайтов на наличие переадресаций.

Виталий Климин
На сайте с 09.01.2018
Offline
56
#95
ОПЯТЬ BM25

Никто на своих сайтах не контролирует BM25. По трём причинам.

1. Почти никто не знает, что это такое,
2. никто не понимает, как BM25 влияет на продвижение,
3. и, самое главное, его просто нечем посчитать.

BM25 - основная формула релевантности текстовой информации. Все поисковики пользуются ею уже много лет. Ничего лучше пока не изобретено.
BM25 бывает классическим, бывает по частям документа, бывает в плавающем окне, по леммам слов, по синонимам, по парам слов. При ранжировании поисковики используют комбинации результатов этих формул. Яндекс оперирует несколькими десятками вариаций.

Есть желание создавать идеальный контент? Ускоренно продвигаться в ТОП?

   Уже сейчас анализатор Page Audit (https://page-audit.ru) может посчитать BM25 любой страницы, а подписчики «SEO Тайн» (https://vk.com/paudit?w=app5748831_-187790503) лично узнают, каким должен быть BM25 для оптимального документа, и получат бесплатный доступ к анализатору, чтобы первыми посчитать BM25 страниц своих сайтов.
medexpert
На сайте с 19.02.2012
Offline
83
#96
Виталий Климин #:
ОПЯТЬ BM25

Добрый день, Виталий.

Подписался. Как получить бесплатный доступ? Нужна "проба пера" :)

"... Нет того веселья: Или куришь натощак, Или пьёшь с похмелья."
Виталий Климин
На сайте с 09.01.2018
Offline
56
#97
medexpert #:
Подписался. Как получить бесплатный доступ? Нужна "проба пера" :)

Завтра в обед в рассылке будет ссылка на бесплатный доступ.

Виталий Климин
На сайте с 09.01.2018
Offline
56
#98
СЧИТАЕМ BM25 ВМЕСТЕ

Получив отзывы на последнюю статью, стало понятно, на сколько тема BM25 сложна для понимания. Предлагаю пройтись по ней ещё раз, но медленнее, короткими шажками.

❓ Почему «правильный» BM25 так важен?

Просто потому, что это основной фактор текстового ранжирования для поисковиков, вся релевантность считается с его помощью. Если релевантность находится в «зелёной» зоне, тогда и алгоритмы ранжирования по этому признаку дают документу самый зелёный свет.

❓ На что похож BM25?

BM25 это очень сложная версия «тошноты» текста.


❓ От чего зависит BM25?

  1. От общего количества слов в тексте.
  2. От количества повторов ключевых слов в тексте.
  3. От того, на сколько много у нас сайтов-конкурентов с такими же ключевыми словами.

❓ От чего точно НЕ зависит BM25?

  1. От порядка слов в тексте.

❓ Как можно управлять значением BM25?

  1. Изменяя общий объём текста.
  2. Изменяя количество ключевых слов в тексте.
  3. Скупая и закрывая сайты конкурентов.

⭐ Пример № 1. Считаем BM25.

Поисковая фраза «мама мыла раму».

Текст страницы:

Мама мыла раму, встав на подоконник,

Мягкой тряпкой терла чистое окно…

В этом тексте каждое ключевое слово встречается по одному разу. Но в остальных документах Интернета эти слова встречаются разное количество раз. Наиболее часто используемое из этих слов – это слово «мама», затем идёт «мыла» и далее – слово «раму».

Слово «мама» даёт вклад в итоговое значение BM25 2.62 балла, слово «мыла» - 4.15 балла, слово «раму» - 5.20 балла. 

Обратите внимание, что самое распространённое из слов даёт наименьший вклад, а самое редко используемое – наибольший.
ВM25 поисковой фразы по этому тексту будет равен 2.62 + 4.15 + 5.20 = 11.97.

❓ Откуда взяты числа 2.62, 4.15, 5.20?

Не заморачивайтесь. На то, чтобы вывести эти числа для словаря из 120 миллионов слов, наши сервера собирали статистику с просторов Интернета целый год.


❓ Как увеличить BM25?

Существуют два способа – уменьшить общий объём текста (сохранив при этом количество ключей) или добавить в текст побольше «ключей» (постаравшись не сильно увеличивать объём текста).


⭐ Пример № 2. Уменьшение объёма текста

Поисковая фраза «мама мыла раму».

Уменьшенный текст страницы:

Мама мыла раму, встав на подоконник.

Теперь слово «мама» делает вклад на 2.64 балла, «мыла» - 4.18 балла, «раму» - 5.23 балла.

Итого, BM25 = 2.64 + 4.18 + 5.23 = 12.05. Прирост = 0.08 баллов.


⭐ Пример № 3. Увеличение количества «ключей» в тексте

Поисковая фраза «мама мыла раму».

Увеличенное количество повторов ключевых слов, увеличенный текст страницы:

Мама мыла раму, встав на подоконник,
Мягкой тряпкой терла чистое окно…
Ничего такого, просто мыла раму,
Так же как обычно, но давным-давно...

«Мама» даёт вклад 2.59 балла (вклад меньше, потому что общий объём текста возрос), «мыла» - 4.97 балла, «раму» - 6.22 балла.

Итог по BM25 = 2.59 + 4.97 + 6.22 = 13.78. Прирост = 1,81 балла.


Вывод

Управлять значением BM25 «выгоднее» через количество повторов ключевых слов на странице.


❓ Каких ключевых слов должно быть на странице больше, а каких меньше?

Классический BM25 не даёт ответ на этот вопрос. Считается, что количество повторов должно удовлетворять закону Ципфа, но в рамках анализатора Page Audit это, пока что, не доказано и не опровергнуто.


Есть желание создавать идеальный контент? Ускоренно продвигаться в ТОП?


   Уже сейчас анализатор Page Audit (https://page-audit.ru) может посчитать BM25 любой страницы, а подписчики «SEO Тайн» (https://vk.com/paudit?w=app5748831_-187790503) лично узнают, каким должен быть BM25 для оптимального документа, и получат бесплатный доступ к анализатору, чтобы первыми посчитать BM25 страниц своих сайтов.
katenuha
На сайте с 13.06.2013
Offline
138
#99

умные вещи пишите, BM25 считаете, а в рекомендациях какой-то бред


Нет союзов в description, какой ужас:


Адаптирую Ваш сайт под мобильные устройства. (/ru/forum/946260) за 1 день.
Виталий Климин
На сайте с 09.01.2018
Offline
56
#100

Спасибо за Ваше замечание.

Да, параметр на счёт ссылок в H2 был посчитан по просьбе одного из пользователей. Описание действительно не совсем точное, сейчас исправлю.

Как ни странно, наличие ссылок в H2 считается правильной структурой. H2 может означать не только начало новой главы статьи, но и быть частью раздела "Оглавление", перед статьёй. Размещение ссылок в этом случае в H2 считается хорошей практикой, поскольку улучшает юзабилити страницы за счёт удобного перемещения между частями статьи. Роботу Google такая вёрстка импонирует.

Рекомендация Google

Отсутствие второстепенных членов предложения (в частности союзов) в декскрипшене является признаком бедности текстового наполнения этого мета-тега. Алгоритмы поисковиков, использующие ИИ для анализа текстов легко это вычисляют. Так что использование союзов - хороший признак качественного описания.

На счёт роботс посмотрю внимательно, почему его отсутствие оказывает отрицательное влияние на ранжирование. Причины пока явно не вижу, цифры показывают, что это важно. Может быть кто-то из читателей подкинет версию?

Например, такую. Если в мета-теге роботс указать значение "noarchive", что заставит Яндекс не сохранять в своём архиве копию страницы и не позволит некоторым пользователям посмотреть её нахаляву, не заходя на сам сайт, то это даст прирост посещаемости +0,01 %, что улучшит ПФ страницы, что приведёт к улучшению её ранжирования.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий