Используйте robots. Txt во внутреннюю папку - Google

222

-=Илья=-

7 мая 2004, 08:45

#41

Как писал Cossack

А слабо проверить какая из них учитывается ;)?

Какая учитывается разумеется не знаю, но в беквардах обе (это сайт со ссылкой переехал).

279

Cossack

7 мая 2004, 08:58

#42

Это что за бред еще? robots.txt согласно стандарту, соблюдаемому всеми известными поисковиками, находится только в корне домена ('This file must be accessible via HTTP on the local URL "/robots.txt".' и т. п., http://216.239.41.104/search?q=cach...obots.txt&hl=en).

Interitus, URL не = домен ;). Корень сайта может быть по адресу: domain.tld/something/ ;).

Стандарт позволяет ;).

Однако, я слышал слухи, что не все поисковики берут robots.txt за пределами domain.tld, но в Google полно примеров, подтверждающих, что такие файлы он находит, в принципе можно и протестировать ;).

-=Илья=-, дай посмотреть - может поймем ;).

Прощание славянки... (http://www.youtube.com/watch?v=0xf9lFMWfKw)

best-hoster.ru более месяца нельзя Яндекс кобласит Google может игнорировать файлы

[Удален]

7 мая 2004, 09:12

#43

Cossack, URL "/robots.txt" всегда соответствует domain.tld/robots.txt. Стандарт допускает запрет индексации с помощью robots.txt только с корня домена, и всё. Остальное - твои вымыслы.

[Удален]

7 мая 2004, 09:15

#44

Interitus, вот по быстрому нашел: f-cpu.seul.org/olivier/robots.txt, в принципе можно и протестировать .

И чего ты нашел? Лежит текстовый файл внутри папки, это ничего не значит.

M

31

mathematician

7 мая 2004, 09:19

#45

Как писал Cossack

Фактически формула PR не предполагает учета traffic, а нацелена на определение близости сайта к "корню" Интернета, а это может быть и хорошо и плохо.

Как писали Sergey Brin and Lawrence Page в статье The Anatomy of a Large-Scale Hypertextual
Web Search Engine
PageRank can be thought of as a model of user behavior. We assume there is a "random surfer" who is
given a web page at random and keeps clicking on links, never hitting "back" but eventually gets bored
and starts on another random page. The probability that the random surfer visits a page is its PageRank.

ІТ-Аналітика (http://it.ridne.net) - аналітичні матеріали світу інформаційних технологій

279

Cossack

7 мая 2004, 09:30

#46

Interitus, давай проверим: положил файл robots.txt во russian.cossack.org.uk/computers:

User-agent: *
Disallow: /

и можно ходить и смотреть. Сейчас там 2 страницы и 3 старых ссылки в индексе. В google.com/addurl.html закинул ;).

З.Ы. Выдумки не мои, а данном и конкретном случае - Рамблера, см. пред. посты.

mathematician: The probability that the random surfer visits a page is its PageRank.

Чем ближе к "корню", тем больше шансов, тем больше "вес" ссылок на документ, но оно не значит, что больше посетителей ;).

Яндекс кобласит РКН доступ ограничивается к Редирект устаревших беклинков интернет-магазина:

[Удален]

7 мая 2004, 09:57

#47

Не закрыл, а положил файл robots.txt во внутреннюю папку. Это не означает закрыть. Страницы в индексе есть и будут, если их стандартными методами не закрывать.

З.Ы. Выдумки не мои, а данном и конкретном случае - Рамблера, см. пред. посты.

Возможно в Рамблере такие же чайники сидят, хотя вряд ли - от наличия robots.txt где-то, где он не предусмотрен, ничего не меняется.

google Indexing API - Страницы в индексе, но Все вопросы про продвижению

279

Cossack

7 мая 2004, 10:02

#48

O'k, поправил на "положил". В корне не трогаю для чистоты опыта ;).

222

-=Илья=-

7 мая 2004, 10:39

#49

Как писал Cossack
-=Илья=-, дай посмотреть - может поймем ;).

Больше месяца назад убралось. Ситуация простая - сайт переезжал, как раз в денс, была на нём хорошая такая ссылочка с pr4. И до самого до следующего обновления беквардов на меня стояли две ссылки, со старого домена и с нового.

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

279

Cossack

7 мая 2004, 10:52

#50

В Guidelines есть такой абзац:

In order to save bandwidth Googlebot only downloads the robots.txt file once a day or whenever we have fetched many pages from the server. So, it may take a while for Googlebot to learn of any changes that might have been made to your robots.txt file. Also, Googlebot is distributed on several machines. Each of these keeps its own record of your robots.txt file.

-=Илья=-, жаль, но проверку запустил, подождем, оно того стоит.

Вышел новый Яндекс Браузер с YandexGPT и YandexART

Что делать, чтобы попасть в ответы Google Bard

Связь PR и посещаемости