Связь PR и посещаемости

-=Илья=-
На сайте с 05.12.2003
Offline
222
#41
Как писал Cossack

А слабо проверить какая из них учитывается ;)?

Какая учитывается разумеется не знаю, но в беквардах обе (это сайт со ссылкой переехал).

Cossack
На сайте с 17.12.2002
Offline
279
#42
Это что за бред еще? robots.txt согласно стандарту, соблюдаемому всеми известными поисковиками, находится только в корне домена ('This file must be accessible via HTTP on the local URL "/robots.txt".' и т. п., http://216.239.41.104/search?q=cach...obots.txt&hl=en).

Interitus, URL не = домен ;). Корень сайта может быть по адресу: domain.tld/something/ ;).

Стандарт позволяет ;).

Однако, я слышал слухи, что не все поисковики берут robots.txt за пределами domain.tld, но в Google полно примеров, подтверждающих, что такие файлы он находит, в принципе можно и протестировать ;).

-=Илья=-, дай посмотреть - может поймем ;).

Прощание славянки... (http://www.youtube.com/watch?v=0xf9lFMWfKw)
[Удален]
#43

Cossack, URL "/robots.txt" всегда соответствует domain.tld/robots.txt. Стандарт допускает запрет индексации с помощью robots.txt только с корня домена, и всё. Остальное - твои вымыслы.

[Удален]
#44
Interitus, вот по быстрому нашел: f-cpu.seul.org/olivier/robots.txt, в принципе можно и протестировать .

И чего ты нашел? Лежит текстовый файл внутри папки, это ничего не значит.

M
На сайте с 05.01.2003
Offline
31
#45
Как писал Cossack

Фактически формула PR не предполагает учета traffic, а нацелена на определение близости сайта к "корню" Интернета, а это может быть и хорошо и плохо.
Как писали Sergey Brin and Lawrence Page в статье The Anatomy of a Large-Scale Hypertextual
Web Search Engine

PageRank can be thought of as a model of user behavior. We assume there is a "random surfer" who is
given a web page at random and keeps clicking on links, never hitting "back" but eventually gets bored
and starts on another random page. The probability that the random surfer visits a page is its PageRank.
ІТ-Аналітика (http://it.ridne.net) - аналітичні матеріали світу інформаційних технологій
Cossack
На сайте с 17.12.2002
Offline
279
#46

Interitus, давай проверим: положил файл robots.txt во russian.cossack.org.uk/computers:


User-agent: *
Disallow: /

и можно ходить и смотреть. Сейчас там 2 страницы и 3 старых ссылки в индексе. В google.com/addurl.html закинул ;).

З.Ы. Выдумки не мои, а данном и конкретном случае - Рамблера, см. пред. посты.

mathematician: The probability that the random surfer visits a page is its PageRank.

Чем ближе к "корню", тем больше шансов, тем больше "вес" ссылок на документ, но оно не значит, что больше посетителей ;).

[Удален]
#47

Не закрыл, а положил файл robots.txt во внутреннюю папку. Это не означает закрыть. Страницы в индексе есть и будут, если их стандартными методами не закрывать.

З.Ы. Выдумки не мои, а данном и конкретном случае - Рамблера, см. пред. посты.

Возможно в Рамблере такие же чайники сидят, хотя вряд ли - от наличия robots.txt где-то, где он не предусмотрен, ничего не меняется.

Cossack
На сайте с 17.12.2002
Offline
279
#48

O'k, поправил на "положил". В корне не трогаю для чистоты опыта ;).

-=Илья=-
На сайте с 05.12.2003
Offline
222
#49
Как писал Cossack
-=Илья=-, дай посмотреть - может поймем ;).

Больше месяца назад убралось. Ситуация простая - сайт переезжал, как раз в денс, была на нём хорошая такая ссылочка с pr4. И до самого до следующего обновления беквардов на меня стояли две ссылки, со старого домена и с нового.

Cossack
На сайте с 17.12.2002
Offline
279
#50

В Guidelines есть такой абзац:


In order to save bandwidth Googlebot only downloads the robots.txt file once a day or whenever we have fetched many pages from the server. So, it may take a while for Googlebot to learn of any changes that might have been made to your robots.txt file. Also, Googlebot is distributed on several machines. Each of these keeps its own record of your robots.txt file.

-=Илья=-, жаль, но проверку запустил, подождем, оно того стоит.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий