http://www.blogovo.ru/archives/12
запятая считается разделителем на подобие пробела.
Автоматически Яндекс находит их по прямым ссылкам на RSS канал, а также по наличию в странице, например такого тега:
<link rel="alternate" type="application/rss+xml" title="RSS 2.0" href="http://www.kernelix.ru/blog/feed/" />
также указывающий на RSS канал.
амальгама
По теме топика:
Зеркала - это сайты, являющиеся частичной или полной копией друг друга. Вебмастера заводят зеркала, как физически разные сайты для большей надежности, в случае отказа одного из них. А также как физически одинаковые, но с разными URL, по разным причинам, простейший пример - www.domain.ru, domain.ru
ПС определяют зеркала при индексировании. Яндекс, в частности, что бы в выдаче присутствовало только одно зеркало - главное, а не несколько одинаковых сайтов. Гугл (впрочем, как и Яндекс тоже) суммируют влияние ссылок со всех зеркал, как буд-то бы они ведут на один.
Основное, что нужно знать о зеркалах - это как ПС указать на главное зеркало. В основном это актуально для Яндекса, сделать это можно при помощи дерективы host: domain.ru в файле robots.txt
Для гугла возможно указать в webmaster tools с www или без выводить сайт в выдаче.
P.S. также возможно пригодится определять зеркала сайта конкурента для анализа его позиции в выдаче. Потому как в топе может быть сайт с 0 или очень маленьким количеством беков, и находится там за счет того, что основная масса беков ведет на прочие зеркала этого сайта.
Да, с параметром d я немного не туда посмотрел.
Вобщем, в любом случае, в момент индексации там был редирект, 404 или еще чего, но не нормальная страница. Кроме того, видим наличие дублей.
И в выдаче Яндекс показывает либо сохраненную копию какого-то склеенного дубля, либо предыдущее содержимое страницы (до редиректа, 404 или еще чего, но не нормальной страницы), сейчас по этому адресу опять нормальная страница.
По вашему запросу в кавычках у Вас последняя с конца "с" - английская!
Ну и результат -
"Результат поиска: страниц — 17, сайтов — не менее 7"
и найден по ссылке, соответственно.
Возможно, дело в этом
"Первая помощь Регистрация Вход на bigmir)net. на главную, работа e-mail рейтинг sms карты новости объявления телепрограмма гороскопы погода туризм магазины"
Слишком мало уникального контента оказалось.
В приведенном примере редирект. Хотя может и нет :)
Склеяны страницы
Видимо, там редирект был или 404 или еще чего, поэтому и размер такой, поэтому и найден по ссылке. А сохраненная копия в Вашем примере - это страница дубль, в чем можно убедиться по id сохраненной копии (d=) из моего примера.
Цель любого бизнеса - это зарабатывание денег.
Яндекс организация коммерческая. Соответственно он естественно заботится о своих доходах, которые в том числе зависят от его посетителей. Чем лучше будет выдача, тем больше будет посетителей. Разностороняя и уникальная информация в выдаче - это один из показателей хорошей выдачи.
Для того, что бы стимулировать веб мастеров к размещению уникальной информации Яндекс пропогандирует это:
"... следование рекомендациям, приведенным ниже, поможет в ранжировании и индексации вашего сайта, в то время как применение обманных техник может привести к понижению его позиций или исключению его из поиска.
Основные принципы
1. Создавайте сайты с оригинальным контентом или сервисом...."
А также совершенствует свои алгоритмы в этом ключе, другое дело что не всегда удачно...
А у меня другая рекомендация, лучше воспользоваться вот этой ссылочкой :)