Это игры в малозначимые факторы.
Есть страница (62KB, длинный текст) из которой выброшено тегом <noindex> всё, кроме ~350 слов, из которых некоторые повторяются раз 40, некоторые меньше.
Страница хорошо ранжируется Яндексом (по ссылкам).
Если хотите играться во внутритекстовые факторы, то учтите, что (предельная) частота повторов нравится скорее Рамблеру, а Яндексу бы лучше точные вхождения (разных) фраз поисковых запросов в пределах предложения... (ещё бы лучше — в {даже внутренних} ссылках на страницу).
Ну, да... можно скромно пытаться взывать к их, скорее “академическому” интересу... к деятельности их робота.
(когда в начале 2006 года заметил копию десятка страниц <тогда “Ты последний” не был у всех на слуху> и написал в поддержку, ответили так же.
Уточнил: “Кого робот выкинет?”
Ответили: “Не волнуйтесь, если что, пишите.”
Через несколько месяцев скопировавший домен перестал откликаться
<“бизнес”план провалился наверное>)
Это так поумолчанию... иногда лучше и без этого, чтоб чего не надублировать чего в спешке.
Прямо в соседней теме /ru/forum/comment/2543530
http://www.yandex.ru/yandsearch?text=%22%D0%B8%D0%BF%D0%BE%D1%82%D0%B5%D0%BA%D0%B0+%D0%B2%D1%81%D0%B5+%D0%BF%D1%80%D0%B5%D0%B4%D0%BB%D0%BE%D0%B6%D0%B5%D0%BD%D0%B8%D1%8F%22
Сохранёнка firstrealty.ru http://hghltd.yandex.net/yandbtm?url=http%3A%2F%2Ffirstrealty.ru%2F&text=%22%E8%EF%EE%F2%E5%EA%E0%20%E2%F1%E5%20%EF%F0%E5%E4%EB%EE%E6%E5%ED%E8%FF%22&dsn=0&d=6040544&sh=2&sg=60&isu=1
<meta name="description" content="Недвижимость, ипотека, кредитование, Новости рынка недвижимости, Ипотека - лучшие предложения банков, Кредит на улучшение жилищных условий (в долларах США), Кредит на покупку коттеджа СТАНДАРТНОЕ ПРЕДЛОЖЕНИЕ (Доллары США) с плавающими процентными ставками, Ипотечное кредитование, Ипотечный кредит, " />
Каширин, если хотите выводить в сниппет "description"... посмотрите в настройки поиска по умолчанию http://www.yandex.ru/cgi-bin/customize.pl в них уже намёк... часто достаточно, чтобы:
1. запрос отсутствовал в <body>
2. запрос присутствовал в <title>
3. запрос пересекался с "description" (это меняется, поэтому лучше вхождение запроса)
Поверьте, там, где мне удобен дескрипшн, он у меня в сниппете.
Давайте подробно.
(разделил бы: контент, внутренняя оптимизация, ...)
<а ещё мерещится развесистое & на учёт разных факторов, включая например наличие (появление новых) естественных ссылок, хотя вес-то этих ссылок мизерный>
Наверное, как имеющий исчезающую долю во вкладе в итоговую релевантность, коль уж им принято пренебрегать при оценке конкурентности ...по частонным запросам.
<META NAME="Author" CONTENT="Имя Автора">
<META NAME="ROBOTS" CONTENT="ALL"> Индексировать документ, следовать по ссылкам в документе. Синоним <meta name="robots" content="index, follow">
<META NAME="REVISIT-AFTER" CONTENT="3 days"> Предлагает роботу период индексации, но роботы херят.
Хватит и
<meta http-equiv="Content-Type" content="text/html; charset=windows-1251">
<meta name="description" content="описание сайта">
Пытаются задействовать (внутреннее) ссылочное ранжирование, а ано получаеца таким слабоньким, что часто им можно пренебречь (но можно и пользоваться по Низкоконкурентным сверхНЧ запросам? совпадающим с тестом ссылки ...для тех страниц, что в адресе ссылки) хотя, с другой стороны, это же бесплатно, зачем отказываться... если вписывается в юзабилити (ну, есть пара внутренних страничек, живущих так в ТОП3 по сверхРедко-запрашиваемому наименованию товара... морды ведущих его производителей — ниже, но их это не беспокоит).
Зачем вешают на слова в контенте?
Существует поверье, что с одной страницы на (одну и ту же) другую — учтётся только одна ссылка... и что все (открытые для индексации) внутренние ссылки должны (бы наверное) быть уникальны, т.е. единообразная навигация не подходит (и её могут закрывать).
Помещая внутреннюю ссылку в контенте — пытаются разнообразить текст ссылки (в который, якобы может оказаться учтён окружающий текст в радиусе 1-2 слов). <поищите подчёркнутое по всем разделам>.
/ru/forum/comment/1842780 тогда было видно, а сейчас можно верить-не_верить, могло и измениться...
desary, в отечественных и буржуйских ПС ... разные способы ограничения доступа... нет одного единственного тега. (честно говоря, не совсем понятно чего вы хотите добиться от Гугла, закрывая повторы, как вы говорите... т.е. если вы сформулируете более общую задачу, вам смогут ответить ... решаема ли она так)
В выдаче Гугла (при поиске точной цитаты) будет отсутствовать (у меня так) страница, показывающая текст с помощью javascript. А уж тронет или нет (как именно тронет) ... есть разные мнения, нуждающиеся в проверке.
В сохранёнке Рамблера нету никакого <noindex> и контента бывшего в ём. То, что он есть (и javascript тоже) в сохранёнках других ПС, конечно ничего не говорит про их индексацию. Смотрим в выдаче...
но сказано-то было другое:
В тексте сохранённой копии отсутствуют слова, помещённые в <noindex> в исходной странице. (т.е. восприятие <noindex> Рамблером... проще увидеть, а тонкости восприятия тега <noindex> Яндексом ... приходится понимать потом)
http://robotstxt.org.ru/RobotsExclusion/noindex а кому интересно, могут посмотреть сохранённую копию Рамблера (ссылка =Восстановить текст= под сниппетом) ...там уже отсутствует то, что в <noindex>
Такого тега нету.
Можете пробовать
<script language='JavaScript' type='text/javascript'><!-- document.write(' =html-код в одну строку (без одинарных кавычков... или как знаете)= ')//--> </script>
И это хорошо, поскольку в сниппете присутствуют более длинные фразы из текста. (количество фрагментов текста ограничено) /ru/forum/171217