Спасибо за развеянные сомненья.
Да, это не панацея. Уже больше полугода таких конструкций нет (ну, практически всё проверил), а после НГ — Я воскресил site/index.html ...вместе с результами старой индексации, проблем-то никаких не возникло, но... легче их предупредить.
Это утверждение проверено?
Два дня назад написал
User-agent: Yandex
Disallow: /index
Host: site.ru
# www.site.ru или site.ru -- зависит от того, как Я знает сайт
Отнёс site.ru/index.html в http://webmaster.yandex.ru/delurl.xml
Засунул роботс
Disallow: /noindex-folder/
Все ссылки вида href="index.php" надо заменить на href="/"
(href="/folder/index.php" на href="/folder/")
Можно не вставлять, особенно если есть предубеждения ко всему невалидному.
Отображается и индексируется предложенный код — вполне корректно (проверено).
Главное — пользователя не_тошнить ключевиками.
Если внутренних очень-очень много — эффект будет заметен.
При десятках внутренних страниц, на новом сайте — эффект будет достаточно мал, чтобы оказаться заметным (Яндекс в выдаче будет писать типа: “Еще с сайта 16”).
Вес морды — легче поднять внешними ссылками (содержащими ключевики) на морду, а уже с неё — распределить по внутренним страницам, сославшись словами их темы — они начинают искаться чуть выше.
Био-роботов надо поменьше кормить ключевиками:
<a href="/"><noindex>на Главную</noindex><span style="display:none"> =слова темы той главной страницы — возможны разные варианты=</span></a>
а если есть опасения про подозрения поисковика — вместо display:none состряпай самодельную всплывающую подсказку, например.
У вас не новостной сайт!
“Совесть” вас не мучила? Экономьте ресурсы робота, если представляете его функционирование.
Следовало предпринять меры к ограничению шмона нормальным периодом.
Вы взаимодействуете не (только) с (кибер) “роботом”, а с живой системой, состоящей из разработчиков, пользователей…
Вам будет легче “обойти подводные камни” в будущем, придерживаясь некой этики, как техники безопасности (и наоборот. Штирлицы возможны — при соблюдении условий, налагаемых погонами обеих воюющих сторон).
Предположим, что в теме ответили на “этот конкретный вопрос” и “редакторы которые желают это видеть” — стали оптом “освежать дату/время”.
Очевидно: Яндексу придётся это прикрыть (вместе с некоторыми другими возможностями), как злоупотребление, например.
Если это уже произошло… +1 (хотя многое в Яндексе мне и не нравится), но жаль того, что прикрыто вместе с этим.
Каков способ генерации?
Как вам такая фраза: «… поисковик … может проверять текст на “естественность”»?
Разных частей речи — некоторое соотношение или некие допустимые пределы частотности, например.
В идеале — надо проводить эксперимент на естественном тексте, на реально существующих фразах запросов, а это — трудновыполнимо и/или громоздко и многое выпадет из внимания.
Когда оптимизацией текста занимается человек — его самого может очень к месту вовремя затошнить и он не напишет того, что генератор текста.
Вот, после свежей индексации попытался найти хвост <title> и пересчитал:
19 слов, 170 символов — хвост выдан в ссылке после многоточия, заменяющего начало. Т.е. столько прочитано в конкретном случае.
Сколько учтено как <title> и с каким весом — непонятно.
Конкретная цыфирь может измениться, вероятно — следует первыми писать более существенные для поиска, а после 60÷80 символов — хоть ещё столько же менее существенных слов. Может быть они учитываются как обычный текст, например?
Надо будет попробовать. Спасибо за вопрос.
svv,
Да, не сами бэки, а то, к чему они приводят.
Дядюшка Яндекс придумал/позаимствовал т.н. "ссылочное ранжирование" -- на странице выдачи результатов поиска (SERP) позиция сайта выше, если на него ссылается больше/лучше других сайтов (и текст ссылки пересекается со словами поискового запроса)...
Вот, придумает Яндекс чего-то ещё и... смысл "жизни" переиначится.
В кейвордс — пиши (исключительно “на всякий случай”) не более 50 слов, только присутствующих в видимом тексте.
С тайтла — слов 14±2 Яндекс учитывает (а когда-то было больше), измерять в символах — можно, тогда наверное действительно не_более 120 — для Яндекса.
Предположительно — первые слова весят больше.
В тексте выдаваемой ссылки — Рамблер покажет больше всего — почти 120 символов.
Яндекс покажет около 80 символов, возможно ...фрагментами из хвоста <title>
Гугл — меньше всех.
<a href="">Библиотека<span style="display:none"> учебной литературы</span></a> — тут display:none — самый примитивный вариант, почитай личку или про самодельный тултип — приведено в качестве примера удлинения текста ссылки за пределы видимого пользователю — можно оформить очень ненавязчиво, блёкло, мелко — главное, что эта самодельная подсказка — текст ссылки.
<a href="" title="Ну, а эта стандартная Подсказка — к тексту ссылки Не относится и в неё можно прятать всё, что лень запихивать в подозрительный <noindex> "><noindex>на Главную</noindex><span style="display:none"> =слова темы той главной страницы=</span></a> — пример надуман в качестве иллюстрации (и работал бы после набора некоторого веса страницы с такой ссылкой).
Вес главной — легче поднять внешними ссылками на неё.
Важнее может оказаться — не концентрация двух-трёх слов, а наличие многих вариантов фраз поисковых запросов, включающих искомые слова и <noindex> поможет это обеспечить — не_уродуя текста. Точные совпадения — Я ценит.
Лёгкая оптимизация — публиковать на жырных сайтах.