Переходит ли робот по ссылкам со страниц запрещенных в robots.txt?

62

Garnet_Fox

23 марта 2016, 07:38

2375

Всем привет!

Собственно сабж, хочется понять отличие запрета в robots.txt от запрета индексации через метатег robots.

Т.е. запрет в robots.txt равнозначен noindex, follow или noindex, nofollow?

230

genjnat

23 марта 2016, 08:01

#1

Во всех трех вариантах боты забивают на запрет, т.е. - по ссылкам ходят. Запрет в роботе, по факту запрещает только индексировать контент, сканировать (т.е. ползать по странице и ссылкам) не запрещает. Ноиндекс, фолоу - то же самое. Ноуиндекс, ноуфолоу, вроде как должен запрещать и сканирование, но игнорируется.

3

canonical для пагинаций nofollow Закрыть доступ к ссылка

A

15

aliencash

23 марта 2016, 11:16

#2

Слышал мнение, что нужно по возможности сократить количество заблокированного в robots.txt, т.к. сайт могут посещать не только роботы ПС, но и роботы всяких агрегаторов и проч.нечисть - они могут специально сканировать закрытые страницы в поисках уникального контента с целью разместить его у себя.

Как страшно жить...

Магазин аккаунтов с балансом Litres,DNS,Ozon,Rotapost и еще 50+ других сервисов тут - vk.cc/7QK0Sk

Сервис Новости Google начал Количество твитов в результатах Закрытый от индексации Google

66

Smart Shot

23 марта 2016, 11:21

#3

genjnat:
Ноуиндекс, ноуфолоу, вроде как должен запрещать и сканирование, но игнорируется.

Пруф?

Не "вроде как должен", а запрещает.

Если что, ответ Платона:

"Если страница закрыта от индексирования в robots.txt, робот не посещает такую страницу и не скачивает ее содержимого, в том числе и ссылки."

SEO группа в ВК, где ответят на любой ваш вопрос! (https://vk.com/hello_seo_world) Книга по интернет-маркетингу (http://smartshot.ru/seo-dlya-seoshnikov/) Блог по SEO (http://smartshot.ru/blog/)

L0

76

Leks007

23 марта 2016, 12:44

#4

Смотрю тема использования robots.txt будоражит не только мой мозг. )

У Гугла есть инструмент проверки удобства сайта для пользователей мобильных устройств. Проверял я там один сайт, где в роботс тхт закрыт каталог с темой сайта.

Так после анализа сайт на скрине (на стр анализа) отображается без стилей. Что это значит, что робот не может перейти в каталог темы и считать файлы стилей.

Но когда тестим, через PageSpeed Insights, то сайт на скрине отображается нормально, все стили читаются.

думайте товарищи, думайте

Да, я опасен! Я говорю вам - правду

AdSense: три быстрых способа Google запустил инструмент для PageSpeed Insights начал использовать

292

Seo-Seo

23 марта 2016, 12:53

#5

Более скажу, видел страницы в индексе Гугла, по которым шло ранжирование и которые были закрыты в роботсе. на них была крепкая ссылочная масса. Так что роботс не следует воспринимать никак иначе, кроме как "рекомендацию".

1

Комплексное продвижение от группы профи. Внимательно, качественно, грамотно. Дизайн, контекст, таргет. (/ru/forum/1024059) hugo.digital (https://hugo.digital)

О факторах ранжирования сайта Пример работы ссылочных факторов Google «заблокировал» отдельные страницы,

66

Smart Shot

23 марта 2016, 13:12

#6

Seo-Seo:
олее скажу, видел страницы в индексе Гугла, по которым шло ранжирование и которые были закрыты в роботсе. на них была крепкая ссылочная масса. Так что роботс не следует воспринимать никак иначе, кроме как "рекомендацию".

1. Страницы могли уже находиться в индексе, их закрыли в robots, но им нужно будет время, чтобы вылететь из индекса.

2. При обходе роботом сайта robots мог быть недоступен, составлен некорректно и робот обошел сайт без него.

Какой смысл поисковым системам придумывать инструменты для вебмастеров, а потом игнорировать их? Просто бы не давали бы возможности пользоваться таким функционалом как robots.

Да и тем более никто не будет закрывать в robots важные страницы сайта, которые могут генерировать траф, это чушь.

На каждом проекте используем robots и на каждом проекте он отрабатывает нормально. Я вам могу привести множество примеров адекватной работы этого файла, попробуйте привести хоть парочку с косячной работой...

Платон Щукин об успешной Интеграция Вебмастера и Метрики Яндекс.Вебмастер поможет найти дубли

239

D.iK.iJ

23 марта 2016, 14:36

#7

Smart Shot:
Пруф?

Не "вроде как должен", а запрещает.

Дело в том, что у меня, например, страницы с переадресацией Китайцы прогнали по каталогам, сделав переадресацию на дорвей. И совсем скоро прилетел бан от Яндекса с пометкой "мобильный редирект на опасные страницы".

Ну да, могли по поведенческим определить. Мог не основной робот зайти, а какой-то дополнительный. Но факт в том, что глупо думать, что можно скрыть что-то от ПС обычным запретом в роботс. Нужно будет - проверят хоть даже вручную.

Адаптивный дизайн в 2 строчки ( https://dikij.com/wm/adaptaciya-saytov.php ). + Принимаю заказы любой сложности ( https://searchengines.guru/ru/forum/926323 ). 💎 Еще я делаю классные кулоны с опалами ( https://mosaicopal.ru/ ).

Google наказывает сайты за Яндекс предупреждает о вредоносном Google будет наказывать за

230

genjnat

23 марта 2016, 15:50

#8

Smart Shot:
На каждом проекте используем robots и на каждом проекте он отрабатывает нормально. Я вам могу привести множество примеров адекватной работы этого файла, попробуйте привести хоть парочку с косячной работой...

Во-первых, не Яндексом единым. Во-вторых

Это и есть, последствие

genjnat:
запрещает только индексировать контент, сканировать (т.е. ползать по странице и ссылкам) не запрещает..

Или, если хотите так

Настройки файла robots.txt являются указаниями, а не прямыми командами.

Ну и третье, вопрос был не про индексацию страниц, и вывод их в поиск по контенту, а ползают ли ним боты, переходят ли по ссылкам. Понаблюдайте за логами на сервере, и вы убедитесь, что по этим страницам боты шуршат, ровно с той же активностью что и по любым другим.

Но ТС почему-то изменил вопрос :)

Каков прок от неактивных Обмен ссылками и backward Вывод из-под фильтра.

13

Relevance

24 марта 2016, 10:36

#9

Это все из разряда гадания, мое мнение что ходят, но страницы не индексируются, для экономии ресурсов.

Кроме роботса пауку нужно еще думать о ловушках, так что если вы не удачно сделаете бесконечный генератор странц, то сайт может вообще никогда не загрузиться :D

Яндекс: с www и Ссылка на непроиндексированную страницу: Почему не индексируется этот

L0

76

Leks007

25 марта 2016, 08:57

#10

Smart Shot:

Какой смысл поисковым системам придумывать инструменты для вебмастеров, а потом игнорировать их? Просто бы не давали бы возможности пользоваться таким функционалом как robots.
Да и тем более никто не будет закрывать в robots важные страницы сайта, которые могут генерировать траф, это чушь.

На каждом проекте используем robots и на каждом проекте он отрабатывает нормально. Я вам могу привести множество примеров адекватной работы этого файла, попробуйте привести хоть парочку с косячной работой...

Я вечером сюда вам вышлю пример такого роботс тхт, где главная стр. закрыта для бота, но сайт в топе

Open AI тестирует память для ChatGPT

Что такое Power BI и зачем это нужно бизнесу