А можно как-то вам намекнуть, что есть и другие (ортогональные кагбе) измерения у тех же самых коротких-длинных урлов?
Проблема в том, что вы нихрена не понимаете необходимость формулировки вашей реальной задачи. Стату дебильных ответов собрать?
Да, бывают:
http://yandex.ru/yandsearch?text=url%3Ahttp%3A%2F%2Fhelp.yandex.ru%2Fwebmaster%2F%3Fid%3D1108950
http://yandex.ru/yandsearch?text=url:http://help.yandex.ru/webmaster/?id=1108951
http://yandex.ru/yandsearch?text=url%3Ahttp%3A%2F%2Fhelp.yandex.ru%2Fwebmaster%2F%3Fid%3D1122788
http://yandex.ru/yandsearch?text=url%3Ahelp.yandex.com%2Felement%2Fopera%2Fservices.xml
http://yandex.ru/yandsearch?text=url:help.yandex.com/webmaster/?id=1113851
http://yandex.ru/yandsearch?text=url%3Ahttp%3A%2F%2Fhelp.yandex.com%2Fsearch%2F%3Fid%3D1113649
http://yandex.ru/yandsearch?text=url:help.yandex.ru/webmaster/?id=1079306
http://yandex.ru/yandsearch?text=url:help.yandex.ru/webmaster/?id=995300
Зачем задавать такие вопросы на этом форуме? Не говорит ли это о том, что вы во всём видите лишь SEO? Ну и где оно в
<a href="/search?newwindow=1&site=&q=%D0%A0%D0%B5%D0%BC%D0%B1%D1%80%D0%B0%D0%BD%D0%B4%D1%82+%D0%B2%D0%B0%D0%BD+%D0%A0%D0%B5%D0%B9%D0%BD&oi=ddle&ct=rembrandt_van_rijns_407th_birthday-1993005"><img alt="407 лет со дня рождения Рембрандта ван Рейна" border="0" height="210" src="/logos/doodles/2013/rembrandt_van_rijns_407th_birthday-1993005.3-hp.jpg" title="407 лет со дня рождения Рембрандта ван Рейна" width="418" id="hplogo" onload="window.lol&&lol()"></a>
Ещё на сайты Тёмы Лебедева залезьте, там много странного можно найти.
У искателей этой проблемы нет. Они делают другие запросы...
И поищите
site:searchengines.ru
site:https://searchengines.guru/
и вы подразумеваете, что этот текст и будет в выдаче по любым запросам?
В операторе site:текст-домена.влияет-на-сниппет // вам это что-то говорит?
Проверяйте
url:www.domen.ru*
или
url:domen.ru*
если хотите совсем избавиться от эффекта, упомянутого выше. Но это не значит, что вам обязательно покажется описалово.
Если это проблема, то решится она не ранее, чем изобретатель, запатентовавший оператор site, подаст на Яндекс в суд... какой-нибудь страны, где доля Яндекса вдруг станет > почти 0.
Ну напишите роботс, который исключит все возможные дубли типа:
http://www.joomla.org/announcements.html?start=51&гавно
http://www.joomla.org/announcements/general-news/5421-30-million.html
http://www.joomla.org/announcements/general-newS/5421-30-million.html
http://www.joomla.org/announcements/general-news/
http://www.joomla.org/announcements/general-news
http://www.joomla.org/announcements/general-neWs/
200 OK
http://www.1c-bitrix.ru/about/life/newS/
http://www.1c-bitrix.ru/about/life/news
http://www.1c-bitrix.ru/about/life/news/
http://www.1c-bitrix.ru/about/life/&
http://www.1c-bitrix.ru/about/life/
http://www.1c-bitrix.ru/about/life//
Вот в индексе, они это так и хотели?
Эту страницу продвигать или
http://www.1c-bitrix.ru/about/life/&08?
Можно будет сделать запрос на удаление /robots.txt из индэхса. Остальные страницы индексируются так же.
А вот если написать типа Disallow: /sitemap.xml
то в WMT и ЯВМ будет ругань, что-то там про запрет сайтмапа.
Оставлять Disallow: /sitemap.xml не пробовал.
А что такое актуальный индекс?
И покажите его тут... для любого документа.
А из <h4> не полюбили?
Не борется. Это явление зависит от запроса. В Гугле тоже.
Посмотрите, из чего сформирован заголовок сниппета и дочитайте абзац, он появился уже давно.
А кто будет проводить собеседование и принимать решение о приёме на работу? Вы же не специалисты. Может быть и для этого надо обратиться к специалисту?
А подрядчик вас пошлёт далеко (особенно, если кто-то попытается им руководить), и будет прав... договор уже подписан. И вам должны только то, что там написано (но не произвольную расшифровку этого... которая может оказаться в запоздавшем ТЗ).
ТС находится в удобном для ПС/конкурентов тупике, думая при этом, что сможет прилично сэкономить.
Давайте сформулируем проблему честнее:
Как индексировать/продвигать сайты, содержащие списки поисковых запросов? Не один-два-три запроса... а десятки и сотни.
Решать её надо не в рамках документа, а в рамках сайта (и можно именно в рамках сайта, а не группы сайтов — как с субдоменами).