Что нужно сделать, чтобы странички не были найдены - Вопросы новичков в SEO

Все вопросы по robots.txt

Cell · 2026-07-01T11:06:55.0000000Z

Вопросы по файлу robots.txt часто волнуют пользователей форума. Для облегчения поиска нужной информации создаётся отдельный топик, где вы можете задавать любые вопросы по составлению, оптимизации и работе файла robots.txt, отвечающего (если кто забыл) за ограничение доступа к содержимому сайта поисковым роботам. Базовые знания можно почерпнуть у: Википедии Яндекса Google - Инструменты для веб-мастеров Сайта robotstxt.org.ru P.S. Проверить свой robots.txt можно по ссылкам - в Яндекс: http://webmaster.yandex.ru/robots.xml#results в Google: https://www.google.com/webmasters/tools/robots-testing-tool?hl=ru Если после прочтения информации по ссылкам выше у вас остались вопросы - задавайте их в этом топике.

121

Ave Lecter

4 марта 2014, 16:48

#121

alexspb:
Через Ливхедер или сервисы проверяли заголовки?

Нет, подскажите где это сделать?

alexspb:
настраивайте движок.

Мне нужно сделать так, чтобы странички без / отдавали 404 ошибку? Заодно и остальные урлы, например, если ввести какую нибудь стороннюю букву в урле страницы - тоже нужно настроить 404?

187

alexspb

4 марта 2014, 17:28

#122

Ave Lecter:
Мне нужно сделать так, чтобы странички без / отдавали 404 ошибку? Заодно и остальные урлы, например, если ввести какую нибудь стороннюю букву в урле страницы - тоже нужно настроить 404?

да

Сам проверяю http://livehttpheaders.mozdev.org/

_

31

_math

4 марта 2014, 23:40

#123

Установил <meta name="robots" content="none"> на странице, на которой есть внутренние ссылки на другие страницы сайта, которые нужно индексировать. Будет ли поисковик ходить по этим ссылкам, если они есть на других страницах (без nofollow)? Не выпадут ли они из поиска? Вдруг поисковик запоминает, что по ссылке ходить не надо и никогда туда не пойдет.

Как закрыть от индесации Почему поисковики игнорируют noindex? Апдейт поисковой базы 08.03.2014

121

Ave Lecter

5 марта 2014, 05:08

#124

alexspb:
да

301 редирект - это неверный списоб?

427

siv1987

5 марта 2014, 09:40

#125

_math:
Будет ли поисковик ходить по этим ссылкам, если они есть на других страницах (без nofollow)?

Будет.

Ave Lecter:
Мне нужно сделать так, чтобы странички без / отдавали 404 ошибку? Заодно и остальные урлы, например, если ввести какую нибудь стороннюю букву в урле страницы - тоже нужно настроить 404?

А причем тут роботс.тхт? Заголовки сервера - это тема про настройки сервера, а не роботса

187

alexspb

5 марта 2014, 11:58

#126

Ave Lecter:
301 редирект - это неверный списоб?

Если бы на ненужные дубли стояли ссылки внешние, то можно было бы мудрить с 301 редиректом.

Если поисковик глючит, и в выдаче есть без слэша страницы (я сталкивался с таким), тоже можно. Но учитывая возможность таких глюков, я теперь предпочитаю .php или .html

Играет ли роль закрывающий вопрос DLE: 301 редирект с

D

11

Dinozavrys

7 марта 2014, 09:48

#127

Господа хорошие, суть моего вопроса на 12-й страниц ене раскрыта, прошу помощи от знающих.

K4

128

kolpa4ok

9 марта 2014, 06:51

#128

Есть страницы типа http://site.ru/stranica. На них установлен виджет фейсбука.

После проверки через xenu links выдает адреса с http://site.ru/stranica#fb-root на всех страницах.

Как правильно настроить robots.txt, чтобы эти ссылки не были найдены? И это нужно делать?

Четыре инструмента по поиску У Рекламной сети Яндекса РСЯ: добавление зеркал к

94

project33

9 марта 2014, 09:31

#129

ничего не надо настраивать. классические анкоры такого рода не индексируются поисковиками

112

ebitok

11 марта 2014, 14:02

#130

Ламерский вопрос от меня, точней уточнение)

На сайте есть несколько страниц ?page=1 ?page=2 и т.д.

На этих страницах ссылки на страницы: index.php?news=1 index.php?news=2 и т.д.

в robots.txt у меня:

Disallow: /*?page=

Нужно: что бы не индексировались страницы ?page , но news должны индексироваться.

Вопрос: будет ли индексироваться news если закрыты ?page ? и доступ к этим News лежит только через page

Просто хз уже на что думать, уже 2 апа не индексит(

Такое ощущение, что робот не обходит вообще странички которые в Disallow, хотя должен обходить, но не индексировать их

Надеюсь поняли меня😂

Состоялся запуск сервиса Page В Яндекс.Вебмастере появился валидатор Google: хорошие Core Web

Что делать, чтобы попасть в ответы Google Bard

В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах

Все вопросы по robots.txt