Закройте папку и страницы с iframe - Вопросы новичков в SEO

Все вопросы по robots.txt

Cell · 2026-07-01T11:06:55.0000000Z

Вопросы по файлу robots.txt часто волнуют пользователей форума. Для облегчения поиска нужной информации создаётся отдельный топик, где вы можете задавать любые вопросы по составлению, оптимизации и работе файла robots.txt, отвечающего (если кто забыл) за ограничение доступа к содержимому сайта поисковым роботам. Базовые знания можно почерпнуть у: Википедии Яндекса Google - Инструменты для веб-мастеров Сайта robotstxt.org.ru P.S. Проверить свой robots.txt можно по ссылкам - в Яндекс: http://webmaster.yandex.ru/robots.xml#results в Google: https://www.google.com/webmasters/tools/robots-testing-tool?hl=ru Если после прочтения информации по ссылкам выше у вас остались вопросы - задавайте их в этом топике.

B4

94

bulatbulat48

26 сентября 2014, 05:09

#211

shram:
А как закрыть ссылку вот такого вида?

http://www.site.com/index.php?&MY_REQUEST_URI=/page1.html

Disallow: /*&MY_REQUEST_URI=*
Правильно будет?

Так как основные ссылки http://www.site.com/page1.html

да, данным правильном вы закроете такой урл. Звездочку в конце можно и не ставить.

либо так:

User-agent: *

Disallow: *&MY_REQUEST_URI=

---------- Добавлено 26.09.2014 в 09:10 ----------

Sinnn:
Подскажите. Нужно закрыть в robots.txt все ссылки содержащие элемент ?cur_cc. Правилен ли будет такой вариант: Disallow: /*?cur_cc*
Верно или нет?

все верно, звездочку в конце можно и не ставить.

SA

8

sergik_a

11 октября 2014, 12:05

#212

Добрый день!

Начал анализировать проиндексированные страницы сайта и обнаружил следующие моменты:

1. На сайте создан раздел - каталог с видео.. ссылка на объект (видео) имеет следующую структуру - сайт.ру/video/item/-n-/

так вот обнаружил что в поиске попадаются следующие страницы:

- сайт.ру/video/item/-n-/

- сайт.ру/video/item/-n-/?to=2/

причем если есть страница с */?to=2/ - то в поиске нет нормальной с адресом сайт.ру/video/item/-n-/

не пойму откуда берется этот /?to=2/ ???

Как избавиться от этого /?to=2/ в поиске оставив только нормальную ссылку на объект?

1.1. каждый объект каталога видео имеет возможность получить код iframe для вставки его по тексту в любом другом месте, например при написании статьи - _<iframe src="http://сайт.ру/video/frame/-n-/?width=570" width="570" height="200"></iframe>

так вот в поиске присутствуют все iframe к каждой странице видео, такого вида - сайт.ру/video/frame/-n-/?width=570

Стоит ли закрыть от индекса эти страницы с iframe ?

Как вставить в dle Влияние поиска по тегам Помогите разобраться со странным

487

Geers

11 октября 2014, 15:10

#213

Правильно ли для каждой пс robots прописывать отдельно?

Например сейчас прописано так:

User-agent: Yandex
User-agent: Googlebot
User-agent: *

Или достаточно только так?

User-agent: *

Везде закрытые папки одинаковы.

311

Zegeberg

11 октября 2014, 15:19

#214

Если

Везде закрытые папки одинаковы.

И по индексации требования к разным пс одинаковы, то

User-agent: *

достаточно.

1

Создание, настройка и ведение РК Директ. Решу проблемы с Joomla

487

Geers

11 октября 2014, 15:50

#215

Zegeberg:
Если

И по индексации требования к разным пс одинаковы, то

достаточно.

Т.е. User-agent: * это будут настройки для всех пс?

311

Zegeberg

11 октября 2014, 16:46

#216

Geers:
Т.е. User-agent: * это будут настройки для всех пс?

Да, и в этом ничего плохого.

1

109

Борис С

12 октября 2014, 15:47

#217

Как быстро после изменения в robots.txt дубли страниц и прочий мусор пропадет из индексации яндекса? У меня уже 2 недели прошло, а в вебмастере и так индексируется папка и страницы из нее , которые я закрыл в robots ? Папка обычная в корне сайта - то есть ошибиться и написать не так ничего точно не мог

Изменение User-Agent робота РСЯ Яндекс внес изменения в Платон Щукин об успешной

A

775

awasome

12 октября 2014, 16:54

#218

Борис С, ждать можно сколько угодно.

B4

94

bulatbulat48

13 октября 2014, 05:57

#219

Борис С:
Как быстро после изменения в robots.txt дубли страниц и прочий мусор пропадет из индексации яндекса? У меня уже 2 недели прошло, а в вебмастере и так индексируется папка и страницы из нее , которые я закрыл в robots ? Папка обычная в корне сайта - то есть ошибиться и написать не так ничего точно не мог

Возможно вебмастер не обновился, проверьте выдачу в ручную.

---------- Добавлено 13.10.2014 в 10:05 ----------

sergik_a:
Добрый день!

Начал анализировать проиндексированные страницы сайта и обнаружил следующие моменты:

1. На сайте создан раздел - каталог с видео.. ссылка на объект (видео) имеет следующую структуру - сайт.ру/video/item/-n-/
так вот обнаружил что в поиске попадаются следующие страницы:
- сайт.ру/video/item/-n-/
- сайт.ру/video/item/-n-/?to=2/

причем если есть страница с */?to=2/ - то в поиске нет нормальной с адресом сайт.ру/video/item/-n-/

не пойму откуда берется этот /?to=2/ ???

Как избавиться от этого /?to=2/ в поиске оставив только нормальную ссылку на объект?

1.1. каждый объект каталога видео имеет возможность получить код iframe для вставки его по тексту в любом другом месте, например при написании статьи - _<iframe src="http://сайт.ру/video/frame/-n-/?width=570" width="570" height="200"></iframe>

так вот в поиске присутствуют все iframe к каждой странице видео, такого вида - сайт.ру/video/frame/-n-/?width=570

Стоит ли закрыть от индекса эти страницы с iframe ?

1) Закрывается, общее правило:

User-agent: *

Disallow: */?to=2

Частное правило:

User-agent: *

Disallow: /video/item/-n-/?to=2

Можно и так и так, разница лишь в том, что первое закроет на всем сайте, второе закроет в конкретной категории.

В поиск попадает 1 из страниц, поэтому когда уберете дубль, в индексе будут правильные страницы. Появляются из-за особенности CMS.

1.1 Они на данный момент индексируются?

OpenAI разрешила сайтам закрывать Мэтт Катс объяснил, зачем В Яндекс Вебмастере появится

SA

8

sergik_a

14 октября 2014, 04:36

#220

bulatbulat48

По п.1. кажись разобрался - приставка /?to=2/ появляется из-за подключения связей между объектами. С этим моментом сейчас разбираюсь, с разработчиком модуля каталогов.. Почему то страницам с /?to=2/ присваивается link rel="canonical"

Тогда получается эти страницы нельзя закрывать в robots.txt? или если их закрыть - то ПС начнет индексировать нормальные адреса объектов - без /?to=2/ ???

1.1 Они на данный момент индексируются?

Да индексируются и страницы самих объектов и iframe к каждой странице объектов.

Яша и Гоша упорно Чрезвычайно большое количество URL-адресов Закрыть от индексации или

В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах

Зачем быть уникальным в мире, где все можно скопировать

Все вопросы по robots.txt