богоносец

богоносец
Рейтинг
777
Регистрация
30.01.2007
JuniorVov:
Предполагаю что они могут воспринять ссылку magaz.com/shop/telefon/#filter=22475_3 и показать мне в выдаче её тайтл(если задам) будет что то вроде magaz.com/shop/telefon/#красны но при переходе с серпа я окажусь на magaz.com/shop/telefon/

Ну почему, при переходе по ссылкам

История - ‎Структура URL - ‎Схемы (протоколы) URL - ‎Кодирование URL

https://www.google.ru/search?q=url

браузер прокрутит до #***

но это делает именно браузер. А по HTTP #якоря не используются.

Т.е. запросив https://ru.wikipedia.org/wiki/URL#История индексатор получит https://ru.wikipedia.org/wiki/URL

а все остальные ссылки#якоря сформирует по другим источникам.

Но вряд ли вы сможете прямо задать тайтл страницы magaz.com/shop/telefon/#красны

JuniorVov:
волнует другой вопрос:
означает ли это что с помощью такой конструкции magaz.com/shop/telefon/#filter=22475_3 мы закрыли фильтр от ПС но оставили для юзера?

Да.

Ну от гугла ещё закройте в роботсе ваши JS, а то он грозится их выполнить...

Ну или посмотрите в индексе вашего примера. Уже не удивлюсь, если проиндексит... когда-то и в Яндексе показывали пример, но см оговорки выше.

Древний ответ ТП:

Сообщение от Yandex.Addurl 18.11.2010
Здравствуйте!

Спасибо за Ваше письмо.

На текущий момент робот воспринимает якоря (#) только как инструмент навигации в рамках страницы и не учитывает их. В ближайшее время данную логику менять не планируется. Если со временем окажется что в интернете множество документов разных по содержимому доступны по адресам отличающимся только якорем, мы обязательно подумаем над пересмотрением своей позиции.
--
С уважением, Платон Щукин
Служба поддержки Яндекса
Но пример сцылки из выдачи Яндекса на #якорь позже показывали на этом форуме
JuniorVov:
Видел так фильтры в ИМ закрывали, конструкция на подобии magaz.com/shop/telefon/#filter=22475_3
SeVlad:
Ты или путаешь с !# или у них на это есть причины (напр они идиоты или разводилы)

Поищи ООО на http://m.kad.arbitr.ru/ перекинет на /#results

JuniorVov:
1) краулер читает урл до этого знака # значит если с него начинаеться урл он его вобще не читает, првавильно?

Хотя по HTTP передается до #

боты могут читать и даже в выдаче ссылаться на урл#якорь https://www.google.ru/search?q=url

хотя обрабатывается #якорь только клиентом / JS.

В sitemap.xml не ссылки, а упоминание урлов/дат/... вес через них не насчитывается.

А хоть какие-то сцылки (<a href="/page">) могут быть учтены в расчете веса страницы /page (что на их индексацию может влиять).

Поэтому, если у вас нет в индексе пагинации, сделайте HTML-карту сайта для людей (и пр. ботов).

А так да, в выдаче страницы пагинации не нужны... но их не так уж и много.

INWOXER seo:
Все равно переходит робот.

Как в HTTP выглядит обращение к / ?

Как надо?

Надо подсовывать боту (и в коде, и в сайтмапе) лишь те сцылки, которые имеет смысл индексить.

Количество обращений к сайту ограничено...

т.е. если бот скачал страницу, обнаружил там meta-robots-noindex или rel=canonical-другой-урл

это фактически означает замедление индексации того, что надо индексить.

Когда же хотят на страницах пагинации указать rel=canonical-категория|первая-страница

то:

это же не обязательно дубль, тексты могут отличаться...

Если кто-то хочет выкинуть из индекса страницы пагинации, то надо подумать — есть ли вообще сцылки на все страницы сайта (с других страниц), это может влиять на их индексацию.

KrutE:
А кто вбросил то, источники находил кто?

Сбер тоже опровергал...

Efremof:
"Яндекс" заставят продать долю государству

А в продаже смысла нету — при этом голосующая способность акций уменьшается.

Там же ещё чем-то владел. И вообще список длинный...

xakep1:
вброс, чтобы сиюминутно заработать на акциях компании

Заработали, позвонили Воложу, ну он и опроверг.

Да прочитайте вы хелпы про костыли rel=canonical — это какую страницу из похожих/дублей надо показывать в выдаче (страницы пагинации — не дубли, вообще говоря, но содержат сцылки, т.е. возможно влияние на индексацию). Индексацией должен управлять другой набор... хлама, не rel=canonical

JuniorVov:
он прийдет туда вспомнит что в роботсе ему говорили не индексируй и на этом его путешествие на этой странице закончиться, но если он увидет там каноникал то начнет сомневаться, мол если её не нужно индексировать то почему здесь важная для меня информация в виде каноникал.

Напишите олгоритмы упомянутых вами терминов:

  • вспомнит
  • увидет
  • сомневаться

Если вам удастся написать код этой человечины — озолотитесь. Или убьют по канону...

Смысл/польза в обосновании костыля rel=canonical

aleksandrbol:
а на краулерный бюджет это не повлияет?

Скорее на его бессмысленное расходование.

Если делаете сцайт для поисковиков — в их выдачу и смотрите — бывает там там такое/другое/третье (про что хочется тему завести) или нет.

Моё предсказание: корреляция будет не с влиянием на ранжирование, а с канонами сферических вебмастеров во вселенной:

toxic steel:
Н - блочный элемент, А - строчный.

Что во что вкладывается говорит о культуре пишущего.

А по культуре не ранжируют.

А в CSS есть display: block | inline | inline-block | inline-table ...

Sitealert:
все и делают по новым канонам. Спецификация HTML5 отличается от спецификации HTML4

Покажите учёт ранжирующими системами например <!DOCTYPE

... им на это ресурсов расходовать не надо. Не отобьются затраты железо...

Всего: 13677