Все вопросы по robots.txt

B4
На сайте с 27.04.2012
Offline
94
#211
shram:
А как закрыть ссылку вот такого вида?

http://www.site.com/index.php?&MY_REQUEST_URI=/page1.html

Disallow: /*&MY_REQUEST_URI=*
Правильно будет?

Так как основные ссылки http://www.site.com/page1.html

да, данным правильном вы закроете такой урл. Звездочку в конце можно и не ставить.

либо так:

User-agent: *

Disallow: *&MY_REQUEST_URI=

---------- Добавлено 26.09.2014 в 09:10 ----------

Sinnn:
Подскажите. Нужно закрыть в robots.txt все ссылки содержащие элемент ?cur_cc. Правилен ли будет такой вариант: Disallow: /*?cur_cc*
Верно или нет?

все верно, звездочку в конце можно и не ставить.

SA
На сайте с 27.09.2013
Offline
8
#212

Добрый день!

Начал анализировать проиндексированные страницы сайта и обнаружил следующие моменты:

1. На сайте создан раздел - каталог с видео.. ссылка на объект (видео) имеет следующую структуру - сайт.ру/video/item/-n-/

так вот обнаружил что в поиске попадаются следующие страницы:

- сайт.ру/video/item/-n-/

- сайт.ру/video/item/-n-/?to=2/

причем если есть страница с */?to=2/ - то в поиске нет нормальной с адресом сайт.ру/video/item/-n-/

не пойму откуда берется этот /?to=2/ ???

Как избавиться от этого /?to=2/ в поиске оставив только нормальную ссылку на объект?

1.1. каждый объект каталога видео имеет возможность получить код iframe для вставки его по тексту в любом другом месте, например при написании статьи - _<iframe src="http://сайт.ру/video/frame/-n-/?width=570" width="570" height="200"></iframe>

так вот в поиске присутствуют все iframe к каждой странице видео, такого вида - сайт.ру/video/frame/-n-/?width=570

Стоит ли закрыть от индекса эти страницы с iframe ?

Geers
На сайте с 12.04.2011
Offline
487
#213

Правильно ли для каждой пс robots прописывать отдельно?

Например сейчас прописано так:

User-agent: Yandex
User-agent: Googlebot
User-agent: *

Или достаточно только так?

User-agent: *

Везде закрытые папки одинаковы.

Zegeberg
На сайте с 30.09.2010
Offline
302
#214

Если

Везде закрытые папки одинаковы.

И по индексации требования к разным пс одинаковы, то

User-agent: *

достаточно.

Ссылки с форумов, блогов и соц сетей ( https://forumok.com/p/c1710b6b/ ) Создание, настройка и ведение РК Директ
Geers
На сайте с 12.04.2011
Offline
487
#215
Zegeberg:
Если

И по индексации требования к разным пс одинаковы, то

достаточно.

Т.е. User-agent: * это будут настройки для всех пс?

Zegeberg
На сайте с 30.09.2010
Offline
302
#216
Geers:
Т.е. User-agent: * это будут настройки для всех пс?

Да, и в этом ничего плохого.

Борис С
На сайте с 21.11.2008
Offline
109
#217

Как быстро после изменения в robots.txt дубли страниц и прочий мусор пропадет из индексации яндекса? У меня уже 2 недели прошло, а в вебмастере и так индексируется папка и страницы из нее , которые я закрыл в robots ? Папка обычная в корне сайта - то есть ошибиться и написать не так ничего точно не мог

A
На сайте с 20.08.2010
Offline
775
#218

Борис С, ждать можно сколько угодно.

B4
На сайте с 27.04.2012
Offline
94
#219
Борис С:
Как быстро после изменения в robots.txt дубли страниц и прочий мусор пропадет из индексации яндекса? У меня уже 2 недели прошло, а в вебмастере и так индексируется папка и страницы из нее , которые я закрыл в robots ? Папка обычная в корне сайта - то есть ошибиться и написать не так ничего точно не мог

Возможно вебмастер не обновился, проверьте выдачу в ручную.



---------- Добавлено 13.10.2014 в 10:05 ----------

sergik_a:
Добрый день!

Начал анализировать проиндексированные страницы сайта и обнаружил следующие моменты:

1. На сайте создан раздел - каталог с видео.. ссылка на объект (видео) имеет следующую структуру - сайт.ру/video/item/-n-/
так вот обнаружил что в поиске попадаются следующие страницы:
- сайт.ру/video/item/-n-/
- сайт.ру/video/item/-n-/?to=2/

причем если есть страница с */?to=2/ - то в поиске нет нормальной с адресом сайт.ру/video/item/-n-/

не пойму откуда берется этот /?to=2/ ???

Как избавиться от этого /?to=2/ в поиске оставив только нормальную ссылку на объект?

1.1. каждый объект каталога видео имеет возможность получить код iframe для вставки его по тексту в любом другом месте, например при написании статьи - _<iframe src="http://сайт.ру/video/frame/-n-/?width=570" width="570" height="200"></iframe>

так вот в поиске присутствуют все iframe к каждой странице видео, такого вида - сайт.ру/video/frame/-n-/?width=570

Стоит ли закрыть от индекса эти страницы с iframe ?

1) Закрывается, общее правило:

User-agent: *

Disallow: */?to=2

Частное правило:

User-agent: *

Disallow: /video/item/-n-/?to=2

Можно и так и так, разница лишь в том, что первое закроет на всем сайте, второе закроет в конкретной категории.

В поиск попадает 1 из страниц, поэтому когда уберете дубль, в индексе будут правильные страницы. Появляются из-за особенности CMS.

1.1 Они на данный момент индексируются?

SA
На сайте с 27.09.2013
Offline
8
#220

bulatbulat48

По п.1. кажись разобрался - приставка /?to=2/ появляется из-за подключения связей между объектами. С этим моментом сейчас разбираюсь, с разработчиком модуля каталогов.. Почему то страницам с /?to=2/ присваивается link rel="canonical"

Тогда получается эти страницы нельзя закрывать в robots.txt? или если их закрыть - то ПС начнет индексировать нормальные адреса объектов - без /?to=2/ ???

1.1 Они на данный момент индексируются?

Да индексируются и страницы самих объектов и iframe к каждой странице объектов.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий