robot.txt

12
EstranhoRu
На сайте с 01.04.2014
Offline
112
#11

настроить редиректы в htaccess и все, например

редирект с www на "без www"

Продвижение сайтов любой тематики (http://estranho.ru). В поиске интересных проектов.
M
На сайте с 04.12.2013
Offline
223
#12

goyan, помимо страниц есть еще статические файлы, например:

Disallow: /assets/ – технические

Disallow: /files/ – вложения и т.п.

Disallow: /images/ – картинки, хотя их часто оставляют открытыми для поиска картинок

Также у вас могут быть дубли страниц, технические и т.п. И что это за сайт, если на нем нет ни одной «мусорной» страницы?! :)

Домены и скрипт для коротких ссылок: https://u75.ru/domains-for-shortcuts
Tryd0g0lik
На сайте с 24.04.2012
Offline
99
#13
J-ran:
С точностью до наоборот.
host - это директива robots.txt для Яндекса (была). Google её не...

J-ran, соглашусь. Сейчас облазил справку гугл и

Google не читает директиву HOST.
Объясню, почему. В Blogger есть возможность писать свой robots.txt. Но robots с host система Blogger считает невалидной и не принимает. Это создало очень много проблем с Яндексом (думаю, это всем понятно почему). Я конечно начал наезды на инженеров Гугла, в ответ получил пачку документаций, что host не декларирован и система Гугла про него не знает.

и

В Google нет зеркал, как у Яндекса, и технически отличается система сканирования похожих страниц и доменов.
Грубо говоря, если Яндекс сканирует и индексирует то, что нужно. То Гугл сканирует всё, что разрешено, а потом определяет, что нужно индексировать (похожие страницы, междоменная и внутридоменная канонизация), если таковое не оговорено тегами и заголовками. ....
Ко мне можно на ТЫ!
J-ran
На сайте с 24.06.2012
Offline
262
#14
Tryd0g0lik:
J-ran, соглашусь. Сейчас облазил справку гугл и...

Tryd0g0lik, здесь и соглашаться-то особо не с чем. То что гугл игнорирует директиву host всем известный и неоспоримый факт.

Для меня весьма удивительно, что для человека, предлагающего услуги по аудиту и SEO, это стало открытием.

Без обид :)

Tryd0g0lik
На сайте с 24.04.2012
Offline
99
#15
J-ran:
Tryd0g0lik, ....

Для меня весьма удивительно, что для человека, предлагающего услуги по аудиту и SEO, это стало открытием.

Без обид :)

Да какие обиды.

Во-первых: Директива host была рабочей еще не так давно. Кажется только в Апреле Яша сообщил о том, что начинает игнорировать дерективу.

Вот и получаем, что до 04.2018 host был обязательным в robots.txt, еще два - четыре месяца назад.

Во-вторых: Если rambler такой директивы не имел, то mail по ранжированию и индексации, в свое время копировал Google и читал (ет) host . Директиву host он еще не отменил, я не видел заявление об отмене.

Ну и на наконец-то, сама директива host для простоты в работе всегда проставляется под User-agent: *

Вот поэтому и не предал значение в отношении Google🍿

NDControl
На сайте с 19.01.2017
Offline
44
#16
Tryd0g0lik:
Во-первых: Директива host была рабочей еще не так давно. Кажется только в Апреле Яша сообщил о том, что начинает игнорировать дерективу.
Вот и получаем, что до 04.2018 host был обязательным в robots.txt, еще два - четыре месяца назад.

Для Яндекса была обязательной, а не для Гугла. Гугл ее сроду не читал и не читает.

Tryd0g0lik:
Во-вторых: Если rambler такой директивы не имел, то mail по ранжированию и индексации, в свое время копировал Google и читал (ет) host . Директиву host он еще не отменил, я не видел заявление об отмене.

"В свое время" - ключевое.

Я здесь невидимка, тебя обнимаю, ты спишь и не знаешь...
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий