Все вопросы по robots.txt

M
На сайте с 04.12.2013
Offline
223
#901

В личку писать можно, но подсказывать особо нечего. Все, что вы не хотите, чтобы попадало в индекс, закрываете. Остальное оставляете открытым. Я не использую сложные маски в роботс. Мне вполне хватает того, что я показал в примере выше.

Домены и скрипт для коротких ссылок: https://u75.ru/domains-for-shortcuts
S
На сайте с 27.02.2017
Offline
15
#902

Добрый день! Некоторые моменты уточнил, а по этим вопросам можете что-нибудь посоветовать ? :)

Подскажите, пожалуйста правильный и самый современный файл robots.txt для WP на 2017. На сайтах все авторы приводят разные примеры
4) Для сайта нужно закрыть раздел авторизации wp-admin / wp-login, (понятно, что это нужно сделать disallow:/wp-login.php), но для безопасности в настройке WP страница авторизации имеет собственный URL, (например site.ru/*****), где -***** - название для авторизации на сайте. Что следует указывать в robots.txt, чтобы эта страница не индексировалась роботами.

5) Где можно посмотреть названия всех роботов, чтобы некоторым запретить доступ к сайту через disallow.

C ув. Spektrof

csnet
На сайте с 05.08.2016
Offline
103
#903

Доброго времени суток, помогите разобраться с robots.txt. Ситуация такая, сайт то маленький на 35 страниц, но в поиск робот грузит уж слишком дофига:

Не могу понять что и как верно закрыть, вроде капал в инете по robots.txt и Worpress везде все одно и тоже пишут, теперь переходим к структуре сайта, опять не понятки, откуда только берутся такие ссылки:

Сам файл robots.txt строго не судите, ибо я сам делал все исходя из статей в инете, если что ни так прошу вашей помощи.

txt robots.txt.txt
P0
На сайте с 05.06.2015
Offline
50
#904

Извините, вопрос, делаю сайт под США, но как вижу в роботсе всех англоязычных сайтов - нет строки Host, я тоже ее не вписывал. Правильно?

K7
На сайте с 03.11.2015
Offline
13
#905

Здрасвтуйте! У меня снова вопрос по robots уже более конкретный. Что если я хочу открыть индексацию для страниц всех поисковых роботов и указать где находится карта сайта. Как я точно должен буду прописать это в robots.txt?


User-agent: *
Allow: /
Sitemap: http://мойсайт.ру/sitemap.xml

Так правильно будет? или как то по другому прописать?

v_ovan
На сайте с 14.05.2008
Offline
165
#906
Provizor-071:
Извините, вопрос, делаю сайт под США, но как вижу в роботсе всех англоязычных сайтов - нет строки Host, я тоже ее не вписывал. Правильно?

Host только у Яндекса есть. Если продвижение в Яндексе не нужно, то можно не писать.

---------- Добавлено 11.03.2017 в 23:04 ----------

kirilf78:
Здрасвтуйте! У меня снова вопрос по robots уже более конкретный. Что если я хочу открыть индексацию для страниц всех поисковых роботов и указать где находится карта сайта. Как я точно должен буду прописать это в robots.txt?




Так правильно будет? или как то по другому прописать?

Нет директивы Allow.

Если нужно что-то закрыть от индексации, то Disallow. Если закрывать нечего, то не пишите лишнего.

Горящие туры (https://teplo.ru/)
S1
На сайте с 04.08.2010
Offline
56
#907

Удалил пост, писал в личку

P
На сайте с 12.05.2016
Offline
9
#908
User-agent: Yandex
Disallow: /

User-agent: *
Disallow: /*?

Если в роботс заданы такие строки. Сайт будет индексироваться Яндексом или нет?

v_ovan
На сайте с 14.05.2008
Offline
165
#909

Если имя файла такое, какое у вложенного, то поисковый робот, думаю, не читает его. Правильное имя файла robots.txt

А не robots.txt.txt

Hammer8
На сайте с 04.08.2011
Offline
175
#910

Прикрепляю robots.txt, который решает проблему с страницами ? и php.

txt robots.txt
Полный спектр услуг по продвижению сайтов ()

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий