Поведение робота на неизвестном ему сайте.

Stripe
На сайте с 05.09.2006
Offline
222
334

Добрый день.

Кто ни будь может подсказать как ведет себя любой поисковый робот при таких условиях:

1. robots.txt

User-agent: *

Disallow:

Disallow: /cgi-bin/

Disallow: /login.html

2. Сайт новый и роботы про него не знают.

Вопрос собственно про следующее..

Роботы входя на сайт, прочитав robots.txt идут на главную страницу и по ссылкам ползают дальше или же посмотрев в файл берут страницы с корня?

Сайты от 30р почти по любой теме или наполнение ваших сайтов (/ru/forum/887821) дешевым контентом. Базы товаров и контента (http://nakovalnja.ru). Вечные ссылки за 1$ или 30р. (/ru/forum/741397)
Santim
На сайте с 03.06.2006
Offline
105
#1

Этот файл указание для поисковых роботов что нужно и что не нужно делать. Робот прочитав ваш файл будет кушать всё кроме того, что запрещено в указаниях. Да и зачем пустая инструкция Disallow ?

P.S. ну и читаем FAQ /ru/forum/86666

Stripe
На сайте с 05.09.2006
Offline
222
#2

Santim, Спасибо за разъяснения.

-EX-
На сайте с 07.07.2006
Offline
180
#3

Stripe, должны идти по ссылкам с морды... Исключая папку cgi-bin и файл login.html. Вроде так...

С уважением, Андрей aka EX
Santim
На сайте с 03.06.2006
Offline
105
#4

Для более плодотворного "кормления" роботов, сделайте карту сайта. Робот ходит по ссылкам. Если к примеру на страницу googi.html не идет ни одной ссылки, то робот её собственно и не проиндексирует. Ставьте ссылку или укажите роботу, применительно к Я, через аддурлку.

Stripe
На сайте с 05.09.2006
Offline
222
#5

Santim, -EX-, Были сомнения в вопросе куда он пойдет, теперь их нет. Спасибо.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий