Ссылки на страницы сайта, которые закрыты для индексирования

Zexh
На сайте с 04.09.2002
Offline
398
10790

Я думаю может возникать ситуациии, когда другие сайты ссылаются на страницы сайта, которые в robot.txt запрещены к индексированию.

Куда же в данном случае будет деваться PR ссылок на данные страницы? Ведь для того же Яндекса они будут как бы не существовать, а ссылки внешние на них ведут?

Будет ли PR, который приходит на эти страницы вообще приходить на этот сайт, будет ли он оставаться безвылазно только на этих страницах или он будет нормально перераспределяться по внутренним ссылками по всему сайту потом?

Garant.PRO (/ru/forum/835207): аттестат, аккаунт 2002г, BL->1250+ гарант сделок в интернете (http://Garant.PRO/).
Polite Moose
На сайте с 22.04.2002
Offline
85
#1
Куда же в данном случае будет деваться PR ссылок на данные страницы? Ведь для того же Яндекса они будут как бы не существовать, а ссылки внешние на них ведут?

Если страница неизвестна поисковику, то соответственно и PR с неё на другие страницы не передается. Нет смысла её учитывать при рассчетах. PR как бы уходит в никуда, то есть ссылка на такую страницу уменьшает долю PR передаваемого другим, известным страницам, но сама она ничего не получает, хотя для неё, образно говоря, зарезервировано некоторое количество веса. И если страница станет доступной, то при ближайшем пересчете PR она сразу же будет включена во все рассчеты.

Отмечу, что по GB можно увидеть примерный PR даже неизвестных для Гугля страниц, но в этом случае, PR вычисляется примерно, то есть это, как бы предполагаемый PR.

Будет ли PR, который приходит на эти страницы вообще приходить на этот сайт

PR приходит только на страницы. Сайт тут не причем.

будет ли он оставаться безвылазно только на этих страницах
Реально его там не будет, до тех пор, пока страница не станет доступной.
или он будет нормально перераспределяться по внутренним ссылками по всему сайту потом?
Как только, так сразу :) Пока страница недоступна, недоступны и внутренние ссылки с неё.
Удачи, доброго пива (http://www.fifth-ocean.ru/) и настроения! Релевантность определяется не тИЦ, не ВИЦ, не количеством ссылок, не частотой ключевого слова, а соответствием запросу!
wolf
На сайте с 13.03.2001
Offline
1183
#2
PR как бы уходит в никуда, то есть ссылка на такую страницу уменьшает долю PR передаваемого другим, известным страницам, но сама она ничего не получает, хотя для неё, образно говоря, зарезервировано некоторое количество веса.

PR у таких страниц есть, они могут прекрасно находиться в поиске благодаря ссылочному ранжированию.

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
Polite Moose
На сайте с 22.04.2002
Offline
85
#3

Привет wolf, рискну поспорить.

PR у таких страниц есть, они могут прекрасно находиться в поиске благодаря ссылочному ранжированию.
Ты смешиваешь два связанных, но разных понятия - ссылочное ранжирование и вес конкретной страницы.

Поясню: При ссылочном ранжировании принципиальны только две вещи - текст ссылки и вес страницы которая ссылается. Сколько PR было отдано, куда он делся и как его учитывает (хранит) поисковик - совершенно не важно. То есть, имхо, при ранжировании результатов поиска, собственный вес страницы совершенно не оказывает влияния. А если и оказывает, то только в случае равенства всех остальных критериев (что практически невозможно, если это не дубли на бесплатном хостинге).

Другими словами, PR страницы это:

1. Показатель того, что на страницу ссылаются некие ресурсы разной значимости и показатель того, что при удачном тексте ссылки есть шанс повыситься в результатах. По сути, собственный PR, в данном пункте только индикатор не оказывающий влияния на ранжирование.

2. Показатель того, что при ссылке с данной страницы на другую, текст ссылки окажет влияние на выдачу другой страницы, в той или иной степени.

Если бы PR страницы оказывал влияние на ранжирование этой самой страницы, то в выдаче были бы только сайты с большим весом.

Возвратясь к началу топика, еще раз отмечу, что, имхо, поисковику нет смысла учитывать PR неизвестных страниц, поскольку они всё равно не используются при рассчетах.(Зачем хранить данные которые не используются?) PR находится "в резерве" на ссылающихся страницах, до тех пор, пока страница получатель не станет известной.

[Удален]
#4
Ты смешиваешь два связанных, но разных понятия - ссылочное ранжирование и вес конкретной страницы.

Это не он смешивает, это поисковик при ранжировании смешивает.

Поясню: При ссылочном ранжировании принципиальны только две вещи - текст ссылки и вес страницы которая ссылается. Сколько PR было отдано, куда он делся и как его учитывает (хранит) поисковик - совершенно не важно. То есть, имхо, при ранжировании результатов поиска, собственный вес страницы совершенно не оказывает влияния. А если и оказывает, то только в случае равенства всех остальных критериев (что практически невозможно, если это не дубли на бесплатном хостинге).

Ссылочное ранжирование - один из факторов, оно не действует само по себе.

Другими словами, PR страницы это:
1. Показатель того, что на страницу ссылаются некие ресурсы разной значимости и показатель того, что при удачном тексте ссылки есть шанс повыситься в результатах. По сути, собственный PR, в данном пункте только индикатор не оказывающий влияния на ранжирование.

Нет! PR никак не связан с текстами ссылок, как и текстами вообще. Собственный PR - индикатор, всегда оказывающий влияние на ранжирование (при любом запросе).

2. Показатель того, что при ссылке с данной страницы на другую, текст ссылки окажет влияние на выдачу другой страницы, в той или иной степени.

Это 1) некое мерило релевантности, которую ссылка с данной страницы добавит странице-получателю по запросам, слова которых употребляются в тексте ссылки 2) количество PR, которое ссылка с данной страницы добавит странице-получателю.

Если бы PR страницы оказывал влияние на ранжирование этой самой страницы, то в выдаче были бы только сайты с большим весом.

Правильно. По конкурентным запросам, или же по стоп-словам посмотри: в выдаче сплошь сайты с высоким PR.

Проще всего себе представить так:

R=(T+L)*(1+N*PR), где

R - Итоговое соответствие кода страницы запросу

T - релевантность текста (кода) страницы этому запросу

L - добавка к релевантности за счет соответствующих запросу ссылок с других сайтов

PR - PageRank, константа для данной страницы, N - какой-то коэффициент

(естественно, все очень условно)

Экстремальные примеры действия технологии: когда T равно нулю (слова не встречаются на странице), L мало (ссылка с какого-то небольшого сайта), но PR крайне большой. Получаем - первые места в выдаче (dumb motherfucker, "go to hell", геморрой etc.) Другой случай - T ноль, L очень велико, средний PR - тоже первые места, то что мы все так любим :) :) :)

Возвратясь к началу топика, еще раз отмечу, что, имхо, поисковику нет смысла учитывать PR неизвестных страниц, поскольку они всё равно не используются при рассчетах.(Зачем хранить данные которые не используются?) PR находится "в резерве" на ссылающихся страницах, до тех пор, пока страница получатель не станет известной.

Это уже фундаментальный вопрос реализации алгоритма PR: как учитывать страницы, не имеющие исходящих ссылок. Есть вариант для таких страниц считать, что они ссылаются на сайт фирмы, рассчитывающей PR ;)

Сорри, что утрировал, но вроде довольно четко объяснил свое видение проблемы.

Polite Moose
На сайте с 22.04.2002
Offline
85
#5
Это не он смешивает, это поисковик при ранжировании смешивает.

Всё равно не согласен.

Ссылочное ранжирование - один из факторов, оно не действует само по себе.
Согласен, я другого и не утверждал. Я просто рассматривал только этот фактор.
Нет! PR никак не связан с текстами ссылок, как и текстами вообще.

Значимость ссылки растет в зависимости от того, какой PR у ссылающейся страницы. Текст не связан с вычислением и передачей PR, но PR влияет на значимость текста ссылки.

Собственный PR - индикатор, всегда оказывающий влияние на ранжирование (при любом запросе).

Не согласен. Не собственный PR оказывает влияние, а PR того, кто ссылается. Собственный PR - это следствие, а не причина.

Это 1) некое мерило релевантности, которую ссылка с данной страницы добавит странице-получателю по запросам, слова которых употребляются в тексте ссылки 2) количество PR, которое ссылка с данной страницы добавит странице-получателю.

Так и я о том же. 1) PR добавит релевантность ДРУГОЙ странице. Но не текущей. 2) Да, PR страницы получателя будет показывать, что на неё сослались. И чем больше PR получателя, тем лучше, видимо, ссылались. PR получателя - вторичен, он не должен влиять на ранжирование, на ранжирование влияет PR донора.

Правильно. По конкурентным запросам, или же по стоп-словам посмотри: в выдаче сплошь сайты с высоким PR.

Потому, что НА НИХ ссылаются хорошие ДРУГИЕ сайты. И именно ДРУГИЕ обеспечивают хорошую выдачу. Высокий PR у сайтов в результатах - следстивие, а не причина.

Проще всего себе представить так:
R=(T+L)*(1+N*PR)

Ошибка в том, что при такой формуле возможна ситуация: на сайт A есть графическая ссылка (без альта) с главной страницы, например RBC.RU При этом, на этой главной странице практически нет других ссылок. Соответственно вес падает немеряный. И так же на сайт А ссылается 5 станиц с бесплатных хостингов, но ссылка текстовая и точно соответствует запросу. По твоей формуле, сайту А гарантировано 1-е место. А этого нет. Сошлись, например на тот же РБК словом "кондиционер". Он будет первым? Пример с "dumb motherfucker" был реален из-за того, что запрос всё таки редкий, плюс именно этот текст был в ссылке с ресурса имеющего, видимо, не самый плохой вес. А "геморрой" выплывал из-за большого множества мелких ссылок с этим текстом, а не из-за веса MS.

Я бы написал так:

R=T+(1+N*(SUMM(TL*RP[LP])))+K

R - Итоговое соответствие кода страницы запросу

T - релевантность текста (кода) страницы этому запросу

TL - соответствие текста ссылок с других сайтов запросу. Если ссылка без текста или не соответствует, значение этой величины - стремиться к нулю.

PR[LP] - PageRank ссылающейся страницы для каждого TL

N - какой-то коэффициент

К - влияние описания из каталога, наличия в каталоге, и пр. факторы.

(естественно, все очень условно). Конечно!

Другой случай - T ноль, L очень велико, средний PR - тоже первые места, то что мы все так любим

Первые места, в данном, мной тоже очень любимом случае, достигаются за счет большого количества ссылок с "правильным" словом. PR доноров мал, но доноров много.

Как пример, приведу выдачу по двум моим сайтам. Главный имеет ВИЦ ~30, сателит ~ 5. Главный ссылается на сателит один раз, текстом которого нет на странице сателита. По твоей формуле:

У главного - Т>0, L>1, PR относительно велик.

У сателита - T=0, L=1, PR мал.

В выдаче, сателит выше главного, хотя у главного и ВИЦ больше, и текст на странице есть, и на него стоят ссылки с тем же текстом, но с каталогов где PR крайне мал. То есть, влияние оказал PR(ВИЦ) сайта который сослался, а не PR самого сайта.

Это уже фундаментальный вопрос реализации алгоритма PR: как учитывать страницы, не имеющие исходящих ссылок.

Как скрытую массу во вселенной. Вес косвенно но оттягивают, но его не видно :)

[Удален]
#6
Не согласен. Не собственный PR оказывает влияние, а PR того, кто ссылается. Собственный PR - это следствие, а не причина.

Ты путаешь ссылочное ранжирование и учет PR при ранжировании. Собственный PR тоже оказывает влияние. Довольно распространены случаи, когда сайт с очень высоким PR (напр. Yahoo) появляется по таким запросам, с которыми на него вряд ли кто-то сошлется (да почти все запросы, на самом деле).

1) PR добавит релевантность ДРУГОЙ странице. Но не текущей.

Высокий PR добавит релевантности текущей странице. По абсолютно всем запросам, которым эта релевантность отлична от нуля.

PR получателя - вторичен, он не должен влиять на ранжирование, на ранжирование влияет PR донора.

На фактор ссылочного ранжирования - не влияет собственный PR, а на ранжирование в целом - влияет, и сильно.

Проще всего себе представить так:
R=(T+L)*(1+N*PR)
Ошибка в том, что при такой формуле возможна ситуация: на сайт A есть графическая ссылка (без альта) с главной страницы, например RBC.RU При этом, на этой главной странице практически нет других ссылок. Соответственно вес падает немеряный. И так же на сайт А ссылается 5 станиц с бесплатных хостингов, но ссылка текстовая и точно соответствует запросу. По твоей формуле, сайту А гарантировано 1-е место.

А ведь нету этой ошибки. Описанная тобой ситуация: T=0, L->0, PR>>1. Но не надо забывать, что собственный PR влияет на всё, но очень несильно (как иногда говорят - при прочих равных), т. е. N очень мало. Так вот, если сослаться с бесплатных хостингов - L будет близко к нулю, конкретно по Яндексу - не пройдут ссылки через порог ссылочного ранжирования, и будет вообще L=0, и итоговая релевантность 0. А вот поставить одну хорошую ссылку с высоким ВИЦ и словом кондиционер - будет 1-е место.

Как пример, приведу выдачу по двум моим сайтам. Главный имеет ВИЦ ~30, сателит ~ 5.

Вообще случай недостоверный, так как значения крайне малы.

Главный ссылается на сателит один раз, текстом которого нет на странице сателита. По твоей формуле:
У главного - Т>0, L>1, PR относительно велик.
У сателита - T=0, L=1, PR мал.

Э нет. По моей формуле:

У главного T<<1, L=0, PR<<1

У саттелита T=0, L>1, PR<<1

То есть: у главного есть вхождение запроса в текст. У саттелита - вхождение в ссылающийся текст. Последнее, как показывает практика - самый мощный фактор ранжирования (при правильном использовании), релевантность <title> и пр. отдыхает. Ситуация вполне укладывается в мою формулу.

В выдаче, сателит выше главного, хотя у главного и ВИЦ больше, и текст на странице есть, и на него стоят ссылки с тем же текстом, но с каталогов где PR крайне мал. То есть, влияние оказал PR(ВИЦ) сайта который сослался, а не PR самого сайта.

Естественно - у саттелита получилось хорошее значение L.

R=T+(1+N*(SUMM(TL*RP[LP])))+K

Да неправильно это! Собственный PR учитывается даже если тексты ссылок никак не соответствуют запросу. Две копии страницы, не имеющие слов запроса во входящих ссылках, но релевантные запросу, будут отранжированы по собственному PR. Это предельный случай, но даже если остальная релевантность не точно равна, а немного различается - большая разница PR может изменить ранжирование.

На странице с PR=10/10 достаточно написать любое слово, чтобы эта страница была по этому слову в выдаче первой.

Polite Moose
На сайте с 22.04.2002
Offline
85
#7

Пока пишу ответ, вот пример:

На странице с PR=10/10 достаточно написать любое слово, чтобы эта страница была по этому слову в выдаче первой.

Берем ФРАЗУ с главной страницы RBC.RU "Все замечания и пожелания присылайте на" Ищем в Яндексе. (сюда прямая ссылка не влезла). Ну и где RBC? 11-е место. В Гугле - 9-е.

По слову "замечания", в Яндексе rbc нет в первой сотне. В Гугле нет в первых 50-и, дальше не смотрел.

Ок. Я согдашусь с тем, что собственный PR оказывает влияние на релевантность, но это значение можно добавить в формулу как + 0.0001*PR

[Удален]
#8
Берем ФРАЗУ с главной страницы RBC.RU "Все замечания и пожелания присылайте на" Ищем в Яндексе. (сюда прямая ссылка не влезла). Ну и где RBC? 11-е место. В Гугле - 9-е.

По слову "замечания", в Яндексе rbc нет в первой сотне. В Гугле нет в первых 50-и, дальше не смотрел.

11-е и 9-е место - неплохо. Тем более, что фраза имеет очень маленькую плотность. Если бы РБК не имел такой ВИЦ - как думаешь, было бы 11 место?

wolf
На сайте с 13.03.2001
Offline
1183
#9

Interitus, Вы, случайно, мои мысли не читаете? Ибо описали в своих словах точнейшим образом и то, как я понимаю принципы ранжирования поисковых систем (ну, за исключением, Teoma - у нее особый случай). Под любым Вашим словом в этой дискусси, я лично подписываюсь безоговорочно. Одно лишь дополнение.

Так вот, если сослаться с бесплатных хостингов - L будет близко к нулю, конкретно по Яндексу - не пройдут ссылки через порог ссылочного ранжирования, и будет вообще L=0, и итоговая релевантность 0. А вот поставить одну хорошую ссылку с высоким ВИЦ и словом кондиционер - будет 1-е место.

Не совсем так. Дело в том, что кроме при учете ссылочного ранжирования в Яндексе корме порога по ВИЦ ссылающейся страницы есть еще порог по относительной встречаемости конкретного слова среди всех слов во всех ссылках на ресурс. Допустим, слово "кондиционер" встречается в ссылках (так, какие еще переменные не задействованы?) - А раз, а всего слов в ссылках - В. Так вот, если отношение А/В меньше некоей пороговой величины, то слово "кондиционер" не будет учитываться Яндексом в ссылочном ранжировании.

Итак, легендарную формулу релевантности страницы а запросу х в общем виде предлагаю считать следующей:

Rа(x)=(Tа(x)+Lа(x))*(1+N*PRа),

где Lа(x)=K*SUMM(Lаi(x)*PRi), i=1,...,n

Rа(x) - итоговое соответствие кода страницы а запросу x,

Tа(x) - релевантность текста (кода) страницы а запросу x,

Lа(x) - релевантность запросу x ссылок с других страниц на страницу а,

Lаi(x) - релевантность запросу x ссылок со страницы i на страницу а,

PRа - показатель авторитетности страницы а, константа относительно х,

PRi - показатель авторитетности страницы i, константа относительно х,

N, K - некие коэффициенты.

[Удален]
#10

Хорошая формула получилась, просто и доходчиво :) Статью не мешало бы написать, а то многим, думаю, интересно, а топик не читают, так как не об этом он изначально.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий