Прошу помощи по Robots.txt !

[Удален]
544

Добрый день уважаемые форумчане.

Вопрос такого характера: есть сайт на wordpress (ему 6-7 месяцев), там стоит Robots.txt, все на сайте индексируется замечательно

User-agent: *
Disallow: /cgi-bin
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /wp-content/themes
Disallow: /trackback
Disallow: /feed
Disallow: /comments
Disallow: /category/*/*
Disallow: */trackback
Disallow: */feed
Disallow: */comments
Disallow: /*?*
Disallow: /*?
Allow: /wp-content/uploads

# Google Image
User-agent: Googlebot-Image
Disallow:
Allow: /*

# Google AdSense
User-agent: Mediapartners-Google*
Disallow:
Allow: /*

# Internet Archiver Wayback Machine
User-agent: ia_archiver
Disallow: /

# digg mirror
User-agent: duggmirror
Disallow: /

Sitemap: http://мойсайт/sitemap.xml

User-agent: Yandex
Crawl-delay: 5

Disallow: /tag

Результаты в Яндекс-Вебмастере :

-загружено роботом 232

-исключено роботом 48.

Сейчас запустил еще два сайта на этом движке и взял этот robots.txt

Результаты в Яндекс-Вебмастере :

-загружено роботом 35

-исключено роботом 35

Плюс на новых сайтах Яндекс не видит внутрение ссылки.

Прочитал много информации в инете, увидел, что каждый тянет одеяло в свою сторону. Знающие люди, подскажите ...

Спасибо.

FladeX
На сайте с 07.11.2008
Offline
163
#1

Неправильно у вас составлено. Для яндекса, например, нет никаких запретов на индексацию, хотя судя по первой части файла они должны были быть.

Disallow после Crawl-delay не должно идти

Disallow: /*?* - это зачем?

Услуги посредника на бирже контента: информационные статьи 40₽/1000, «продающие» тексты 50₽/1000. Пишите в личку. Помогаю правильно переехать на https (/ru/forum/973447). Подписывайтесь на мой канал в телеграм: https://t.me/fladex (https://t.me/fladex).
[Удален]
#2
Disallow: /*?* - это зачем?

сам не знаю. Я раньше (не помню где) нашел этот robots.txt и по отзывам и коментариям решил, что вродь подходит... Индексация первого сайта тоже устроила, а теперь задумался...

Точно не помню, но это чуть пределаный robots от Лякактуса.

FlyAway
На сайте с 01.06.2005
Offline
439
#3

User-agent: Yandex

Disallow: /cgi-bin

Disallow: /wp-admin

Disallow: /wp-includes

Disallow: /wp-content/plugins

Disallow: /wp-content/cache

Disallow: /wp-content/themes

Disallow: /trackback

Disallow: /feed

Disallow: /comments

Disallow: /category/*/*

Disallow: */trackback

Disallow: */feed

Disallow: */comments

Disallow: /*?*

Disallow: /*?

Allow: /wp-content/uploads

Crawl-delay: 5

вот так надо тогда для яндекса

Сердюченко Андрей (http://www.serdyuchenko.ru/) Масонская ложа — SЕ-Team.ru (http://goo.gl/YIjV6h) :)
[Удален]
#4

FlyAway спасибо. Поставлю ваш варант !

FlyAway
На сайте с 01.06.2005
Offline
439
#5

lexxxus, это для яндекса нужно изменить правило, Crawl-delay: 5 вообще можно нах убрать

A
На сайте с 10.12.2009
Offline
5
#6

Здраствуйте!

Подскажите кто ни будь. У меня подобная проблема. Сделал сайтик про кино за смс. Загрузил. Зашел робот яши и сообшил Загружено роботом 1 Исключено роботом 1. Как я не искал фаил robots.txt не нащел. Сайт остался не в индексе, что делать?

FlyAway
На сайте с 01.06.2005
Offline
439
#7

anzh, пора в школу тебе мой друг!

[Удален]
#8

FlyAway спасибо, это понятно ...

A
На сайте с 10.12.2009
Offline
5
#9
FlyAway:
anzh, пора в школу тебе мой друг!

Не понял? Что Вы имели ввиду?

K
На сайте с 31.01.2001
Offline
737
#10
lexxxus:
Disallow: /*?*
Disallow: /*?

Первая строчка из них точно лишняя, они запрещают одно и то же.

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий