Как вам такой эксперимент?

1 234
skat
На сайте с 02.08.2005
Offline
104
#31

предлагаю вот такой эксперимент: человек "А" ставит ссылки откуда только можно любыми доступными способами, засыпаю думает куда же запостить ссылку, просыпается и опять...линкаторы, каталоги, обмен ссылками и т.д.

человек "Б" продумывает схемы, вычисляет логарифмы, все у него под контролем - получил ссылку - записал в свою матрицу - просчитал, спрогнозировал, засыпая думает - а по какой кривой выстроится зависимость по экспоненте или по гиперболе? а может быть применить уравнения Гаусса? просыпается и опять - вычисления, гипотезы, эксперименты...

эксперимент проводится полгода, потом смотрим на PR подопечных сайтов?

имхо получится так "А" - 4/5 (прогнозы не делались, ожидалась минимум 4)

"Б" - 2/3 (по прогнозам должна была быть 6:-)

Saturnus
Т
На сайте с 16.01.2005
Offline
53
#32

skat, А "ожидалась минимум 4" это не прогноз?

И откуда он мог ожидать 4? Думаю, что он и раньше это делал, а это своего рода эксперимент.

Если работать по вашей схеме, то можно было бы работать только с контентом и не задумываться, что еще влияет на релевантность документа.

C
На сайте с 17.08.2002
Offline
82
#33
alut:
Cage, Теркин, ребята, а Вы не хотете сначала расписать эксперимент по пунктам.

А при чем тут я? :)

Я так же, как и Вы, обсуждаю чужой эксперимент. Теркин почему-то не ответил, но если хотите, могу написать свою точку зрения.

1. Цель обсуждаемого эксперимента получить некоторые данные для другого эксперимента, который позволит вычислить damping factor d и позволит выявить зависимость PR на баре от реального PR.

2. Что Вы имеете в виду под инструментами (в данном случае) не очень понятно. Гугл-бар - вот наш инструмент :)

3. Способ использования еще менее понятен.

4. Тоже сомнительный пункт. Гугл-бар показывает какие-то результаты, остальное высчитывается через формулы.

5. Под помехами, скорее всего, Вы имели в виду погрешности. Я до сих пор считаю, что они могут оказаться очень большими. Я также почти уверен, что получить страницу с PR ровно 2 или 1 на баре не возможно.

6. Я не считаю, что это необходимо. Повторяемостью отличается любой научный подход, имхо.

skat:
предлагаю вот такой эксперимент: человек "А" ставит ссылки откуда только можно любыми доступными способами
...
человек "Б" продумывает схемы, вычисляет логарифмы

человек "В" пишет программы для СЕО...

Как Вы вообще можете сравнивать этих людей? Каждому свое. Человек "Б" пытается приумножить знания (причем зачастую, заметьте, не только свои). У всех троих разные цели. Давайте сравним, кто напишет больше программного кода в Kb? :)

Нужно понимать, что вычисление того же d - совершенно бесполезная информация с практической точки зрения. Ссылок это не добавит, и в то же время, вообще ничего не зная о формуле расчета PR, можно не только успешно продвигать сайты, но и иметь очень большой PR на своих сайтах.

Но с теоретической точки зрения значение этого d, как и метод его вычисления, может быть очень интересен. И по-моему, это интересно не только мне одному...

Теркин:
(1-d) это маленькая величина по отношению к x1 думаю она будет соизмерима с погрешностью получения единички из эксперимента.

Вот не понятно, почему Вы так решили. x1 - вот это действительно маленькая величина. Сумма реальных PR всех страниц в интернете равна 1. Представьте, во сколько тысяч раз десятка весомее, чем Ваша единичка. Теперь представьте, сколько миллионов страниц в интернете с разным уровнем авторитетности. И сумма PR для всех равна 1!

Правда, здесь есть небольшая оговорка: для той формулы, которую Вы записали, требуется нормировка, т.е. x1 все-таки может быть >1. Но не очевидно, что после решения системы уравнений для всех страниц интернета еще до нормировки PR у всех страниц будет намного больше (1-d).

Можно посмотреть на это с другой стороны. В формуле уже с учетом нормировки вместо (1-d) будет (1-d)/N, где N - кол-во страниц в интернете. Но и x1 тогда будет порядка 10^(-10) или даже еще меньше...

Т
На сайте с 16.01.2005
Offline
53
#34

alut, Я тоже не совсем понял ваши пункты. Не ответил потому, что надеялся, что Cage все объяснит.

Cage:
Вот не понятно, почему Вы так решили. x1 - вот это действительно маленькая величина.

Выходит что начальный ПР очень большой, а по ссылке передается очень маленькая его часть?

Cage:
Сумма реальных PR всех страниц в интернете равна 1.

Вот здесь я не понял, почему сумма равна 1. Вы наверное хотели сказать не больше 1. А вообще первый раз слышу об этом. Формулу с N видел недавно в одной статье, но не придал этому значения. Видимо все-таки придется прочитать ту статью. =)

C
На сайте с 17.08.2002
Offline
82
#35
Теркин:
Выходит что начальный ПР очень большой, а по ссылке передается очень маленькая его часть?

Нет. Вот там где Вы придумали и выделяли множества различных PR, Вы можете выделить еще одно множество: PR посчитан для всех страниц, но не нормирован по единице. Такой PR можно посчитать по формуле

PR = (1-d) + d*sum(...)

Но после такого подсчета понадобится нормировка, т.к. в результате решения системы таких равенств сумма всех PR может быть больше 1. Здесь значение (1-d) ~ 0,15 и PR имеет сравнительно большое значение.

Но можно воспользоваться формулой

PR = (1-d)/N + d*sum(...)

Здесь в результате решения системы PR будет нормирован по единице, т.е. значения PR будут очень маленькими, но (обратите внимание) слагаемое (1-d) в свою очередь делится на N (число страниц в интернете, очень большое число).

Таким образом, оба слагаемых (и начальный "бонус" страницы за ее существование, и PR, передаваемый внешними ссылками) могут оказаться "сопоставимыми" друг другу (для страниц с очень низким PR).

Теркин:
Вот здесь я не понял, почему сумма равна 1. Вы наверное хотели сказатьa не больше 1.

Считается, что PR - это вероятность нахождения пользователя на какой-то странице в интернете. Также считается, что на какой-то странице он находится в любом случае, поэтому sum(PR)=1.

Теркин:
А вообще первый раз слышу об этом. Формулу с N видел недавно в одной статье, но не придал этому значения. Видимо все-таки придется прочитать ту статью. =)

Конечно ее стоит почитать. И даже ссылку не плохо бы оставить, чтобы ее могли почитать все, в том числе и я ;)

Т
На сайте с 16.01.2005
Offline
53
#36
Cage:
Нет. Вот там где Вы придумали и выделяли множества различных PR, Вы можете выделить еще одно множество: PR посчитан для всех страниц, но не нормирован по единице. Такой PR можно посчитать по формуле
PR = (1-d) + d*sum(...)

Но после такого подсчета понадобится нормировка, т.к. в результате решения системы таких равенств сумма всех PR может быть больше 1. Здесь значение (1-d) ~ 0,15 и PR имеет сравнительно большое значение.

Но можно воспользоваться формулой
PR = (1-d)/N + d*sum(...)

Здесь в результате решения системы PR будет нормирован по единице, т.е. значения PR будут очень маленькими, но (обратите внимание) слагаемое (1-d) в свою очередь делится на N (число страниц в интернете, очень большое число).

Таким образом, оба слагаемых (и начальный "бонус" страницы за ее существование, и PR, передаваемый внешними ссылками) могут оказаться "сопоставимыми" друг другу (для страниц с очень низким PR).

Тут я не спрашиваю, так ли на самом деле, я спрашиваю возможность такой ситуации.

Когда я говорил "большой" и "маленькая часть" я не имел в виду численные значения. Большой в смысле во много раз больше чем маленький. Но это могут быть очень маленькие числа.

Теперь непонятно если начальный маленький, а по ссылке передается его основная часть. То почему нельзя пренебречь маленьким значением?

Cage:
Считается, что PR - это вероятность нахождения пользователя на какой-то странице в интернете. Также считается, что на какой-то странице он находится в любом случае, поэтому sum(PR)=1.

Ну если вероятность, то сумма действительно должна равняться 1.

Теперь представьте ситуацию, что во всем интернете найдется сайт визитка, внутренняя страница или еще что-нибудь на которых (на этих страницах) нет ссылок (любых внешних или внутренних), при этом на них могут ссылаться. Эти страницы не передают свой ПР никому, даже часть.

Мы сложили весь ПР получили 1.

Теперь все эти страницы поставили по одной ссылке на другие страницы. Соответственно ПР на других страницах вырос. Количество страниц не изменилось. Сумма ПР тоже выросла и уже больше 1.

По-моему нельзя предугадать сумму ПР. Можно определить самое большое значение суммы ПР и нормировать. С этим я не спорю, но сумма будет меньше либо равна 1. Она не может быть постоянной.

Cage:
Конечно ее стоит почитать. И даже ссылку не плохо бы оставить, чтобы ее могли почитать все, в том числе и я

Почитал статью, про формулу там ничего нет, да и вообще статья не очень интересная. Ссылку не размещу, так как (насколько знаю) владелец сайта довольно известный человек на этом форуме. Мало ли ему не понравится это. Если все еще заинтересованы скину ссылку в личку.

A
На сайте с 25.10.2005
Offline
219
#37

Что ж - попробывал изложить суть эксперимента, как я его понял из первого поста. Если что не так - поправьте.

I. Цель – определить коэффициент передачи PR со страницы на страницу внутри домена.

II. Инструменты

1) домен1 PR5(Т-бар)

2) страницы второго уровня – 70 шт.

3) страницы третьего уровня –4550 шт.(Группы 1)

4) страницы четвертого уровня –250250 шт.(Группы 2)

III Действия

1) Берем домен1 (без внешних ссылок) – PR=5

2) Делаем на нем 254870 страниц

3) Ждем индексации 250 К страниц в Гугле (без внешних ссылок !!!).

4) расставляем внутренние ссылки

- URL ссылки (по-видимому - нетекстовые) с морды домена1 на страницы 2ур. – 70 шт.

- URL ссылки (по-видимому- нетекстовые) со страниц 2ур.на страницы 3ур. – от 31 до 100 на каждой

- URL ссылки (по-видимому- нетекстовые) со страниц 3ур.на страницы 4ур. – от 11 до 100 на каждой

5) Ждем индексации внутренних ссылок в Гугле..

6) Ждем пересчета тулбаровского PR для ВСЕХ страниц.

IV Результат измерения – PR страниц 4ур.(Группы 2)

V Помехи

1) скорость и равномерность индексации страниц Гуглем

2) скорость и равномерность индексации ссылок Гуглем

3) периодичность пересчета тулбаровского PR (4-5 месяцев)

4) самое главное – округленность значения тулбаровского PR (для домена1 – от 5,0 до 5,9)

Когда до конца расписал, понял - я такой эксперимент, для такой цели проводить бы не взялся. По прикидкам - минимум 1 год.

C
На сайте с 17.08.2002
Offline
82
#38
Теркин:
Тут я не спрашиваю, так ли на самом деле, я спрашиваю возможность такой ситуации.

Я считаю, что такая ситуация возможна: слагаемое (1-d) больше, чем d*sum(...).

Но ничего конкретного о них (слагаемых) я сказать не могу. Вообще-то как раз Ваш эксперимент должен был бы пролить свет на этот вопрос...

Теркин:
Теперь непонятно если начальный маленький, а по ссылке передается его основная часть. То почему нельзя пренебречь маленьким значением?

Ну Вы договаривайте :)

...основная часть, поделенная на количество ссылок, которых на странице обычно довольно много. Тут совершенно не очевидно, какое слагаемое больше.

Тем более, не будем забывать, что расчет PR - процесс итерационный. Поэтому любые расчеты для одной страницы или для одного шага пересчета не очень корректны.

Теркин:
Мы сложили весь ПР получили 1.
Теперь все эти страницы поставили по одной ссылке на другие страницы. Соответственно ПР на других страницах вырос. Количество страниц не изменилось. Сумма ПР тоже выросла и уже больше 1.
По-моему нельзя предугадать сумму ПР. Можно определить самое большое значение суммы ПР и нормировать. С этим я не спорю, но сумма будет меньше либо равна 1.

Это уже обсуждалось в этой теме. PR пересчитывается сразу для всех. Расчет представляет собой решение системы уравнений. Решили. Пронормировали. Сумма равна одному.

2 alut

Вроде все верно. Я бы еще добавил, что

- диапазон ссылок "от 31 до 100 на каждой" лично для меня не очевиден;

- "округленность от 5,0 до 5,9" вполне может до 5 округляться по-другому, например, от 4,5 до 5,49.

A
На сайте с 25.10.2005
Offline
219
#39

Cage,

В принципе, какое округление - все равно (порядок погрешности - 20%).

Правда из высказываний на форуме людей, плотно занимающихся гуглем - вынес, что ПР округляется отбрасыванием дробной части (что еще больше осложняет использование его в качестве измерительной линейки).

P.S. на этапе III-3 все и заглохнет. ИМХО.

Т
На сайте с 16.01.2005
Offline
53
#40

alut,

I. Цель.

Не совсем так, коэффициент передачи PR со страницы на страницу внутри домена мы хотим рассчитать из результатов эксперимента. Цель первого эксперимента узнать сколько нужно ссылок (L) со страницы, чтобы получить ПР на единичку меньше. В последующем (их) эксперименте мы проверяем сохраняется ли количество ссылок L для других значений ПР. Если да, то ПР на две единички ниже, должен получаться из L*L. Если это не так, то тут и встает вопрос действительно ли начальный ПР был "маленьким". Далее можно построить обратный эксперимент (ы) чтобы выяснить сколько нужно страниц, чтобы собрать ПР на единичку (на две) больше на одной странице.

III Действия

1) Берем домен1 (без внешних ссылок) – PR=5. Внешние ссылки на домен будут (одна -две).

пунк 3 нужно поменять местами с пунктом 4. Иначе гугл не проиндексирует все страницы.

Исходя из структуры ссылок Пр должен дойти до каждой страницы, соответственно проблем с индексацией не должно быть.

V Помехи

Я так понимаю помехи - не влияют на чистоту эксперимента.

Так как эти пункты влияют только на время проведения эксперимента.

Я не думаю, что минимум год. Нужно дождаться индексации всех страниц. После чего Дождаться пересчета пр на тулбаре. Думаю максимум год.

Cage:
Я считаю, что такая ситуация возможна: слагаемое (1-d) больше, чем d*sum(...).
Но ничего конкретного о них (слагаемых) я сказать не могу. Вообще-то как раз Ваш эксперимент должен был бы пролить свет на этот вопрос...

Рад что вы это заметили сами. С остальным вполне согласен..

1 234

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий