Cage

Рейтинг
82
Регистрация
17.08.2002
Интересы
Музыка, электрогитара
pupkin:
Мне интересно, почему если с морды было 70 равноценных исходящих на внутренние, до до адресата они добрались либо как 3 либо как 4 , а не одинаково.

Наверное, речь идет о том, что будет либо 3, либо 4 на всех страницах одинаково.

alut:
> Берем сайт с PR=5 никаких внешних ссылок
- это как ?

Скорее всего имеется в виду, что страница сайта не ссылается на другие сайты (т.е. содержит только внутренние ссылки).

alut:
1-е правило - эксперименты можно проводить только с новыми сайтами, иначе фактор помехи будет равен экспериментальным факторам.

Это, с позволения сказать "правило" :), для кого-то правило, а для кого-то и нет. Я, например, с ним не согласен, как и с рядом других правил здесь.

По сути эксперимента, он представляется мне интересным (с точки зрения основной идеи), но я пока не понимаю, как можно интерпретировать результаты.

K. Ermakov:
Cage, я считаю, что смысла в некоем Граале - формуле релевантности - нет
...
информацию, которую даёт Яндекс, можно с пользой применять, не занимаясь выведением какой-то секретной формулы.

Так то оно так, вот только просто глядя на выдачу Яндекса, имхо, невозможно получить ответы даже на самые простые вопросы. Например, оптимальный процент ключевых слов на странице. Вы можете посмотреть, как обстоят дела с этой характеристикой на других сайтах в топе, но (!) ... никогда нельзя поручиться, что их места не являются следствием действия других факторов. Может первая позиция "перекачана" ссылками или еще чем-нибудь.

Зная формулу, Вы могли бы действовать оптимально еще и в том смысле, что Вы бы достигали по всем характеристикам сайта _достаточные_ показатели, не тратя лишние силы, деньги и время.

Также, я постоянно призываю обратить внимание на задачу удержания позиций. Чтобы занять первое место в топе, достаточно ориентироваться на показатели сайта на первом месте. Что делать, если твой сайт уже первый? На сколько сильно он оторвался? Насколько много с ним нужно продолжать работать?

Зря Вы не почитали, сообщения, ссылки на которые я давал выше. Там даже Миха Кузьмин признался, что ждет подобную систему "с нетерпением" (речь о 4seo.ru) :)

K. Ermakov:
Говоря совсем коротко: Вам сейчас чего-то не хватает для успешного выведения сайтов в топы?

Наверное, мне не хватает того, чтобы я был оптимизатором :).

alut:
Cage,
Почему Вы упорно говорите о формуле ?
Есть алгоритм, есть несколько баз Яндекса. Есть выдача (причем динамическая - и позиции меняются, и апдейты идут с измененными коэф-тами ???)

"позиции меняются, и апдейты идут" вследствие изменения алгоритмов или характеристик сайтов. Речь идет о построении модели на данный момент. Причем хорошо восстановленная модель будет хорошо работать, пока не будет изменен алгоритм, т.е. смена позиций (так же, как и смена характеристик сайтов) должна быть отражена в модели. Это, на мой взгляд, очевидно ;)

alut:
Теперь представьте, какая стоит задача и можно ли ее решить целиком. Поэтому все и говорят, что можно отследить только некоторые закономерности (причем на настоящий момент, потому что через месяц они могут перестать работать)

То есть Ваша позиция: это сделать невозможно (потому что сложно, потому что не понятно как это сделать), но это было бы полезно. Я правильно понял? :)

K. Ermakov:
Одна из причин - постоянные изменения алгоритма.

И еще по поводу изменений алгоритма...

Если формула получена через угрозы Сегаловичу (для тех, кто не читал интервью, это Сегалович так пошутил :)), то тогда да, изменение алгоритма - это серьезная проблема.

Но если формула получена с применением каких либо математических методов, нет никаких преград в получении ее снова и снова (хоть каждый день), для разных запросов, для разных поисковых систем...

Я просто призываю задуматься, что Яндекс предоставляет нам море информации. Ее нельзя будет использовать только в том случае, если он перестанет ее предоставлять (закроется, например :)).

oiL-k:
ps/ Я думаю, сами работники Яндекса ее не знают. Каждый отвечает за "свой коэффициент". Может один-два в руководстве.:)

У меня несколько иное мнение: хороший результат можно получить только при комплексной "настройке" формулы.

K. Ermakov:
Где-то даже был комментарий одного господина (если не ошибаюсь, речь идёт об интервью И.Сегаловича "Вебпланете") из руководства, что формулу эту узнавать никому не нужно. Одна из причин - постоянные изменения алгоритма.

Я тоже читал это интервью Сегаловича. Правда, вывод из нее я сделал другой. Насколько я понял, по его мнению, эта формула не нужна по двум причинам:

1. формула сама по себе ничего не даст, нужно еще и поработать. Если формула "говорит": "Давай еще 1000 внешних ссылок", - то сами они не появятся, и получить их будет довольно сложно.

2. в формуле существуют факторы, которые являются характеристиками не сайта, а всей системы (Яндекса, например), на которые все равно (хоть знай формулу, хоть нет) повлиять практически невозможно.

Если подумать, то подобные причины ненужности должны бы отпугнуть _только_ начинающего оптимизатора. Кто уже в топе, у того несколько иные заботы (в том числе удержание позиций сайта).

K. Ermakov:
Ну, получим мы формулу релевантности. И что с ней делать?

А что, мои доводы (мой ответ Лохтеру) не убедительны?

А доводы людей в темах, ссылки на которые я давал выше?

Вы лично считаете, что Вам эта формула не нужна?

Вы откажетесь от возможности ее узнать, если бы она была?

Вы не нашли бы ей применения?

K. Ermakov:
Могу сказать, что большое число людей, не знающих её и входящих в неё коэффициентов, тем не менее успешно занимаются продвижением сайтов и занимают топы.

Не спорю.

Как крайний случай, можно вообще увешать весь интернет платными ссылками и не задумываться, что вообще есть какие-то другие факторы.

alut:
Так зачем дело стало - возьмите и посчитайте. Выведете формулу, может быть поделитесь, или продавать будете. Все в Ваших руках.

Так и думал, что рано или поздно мне это кто-нибудь предложит :)

The WishMaster:
Формулу написать элементарно. Намного сложнее выяснить значения множества коэффициентов, которые будут в ней.

Вообще-то именно в этом и заключается задача восстановления зависимости. Вопрос из первого сообщения: почему же этого до сих пор никто не сделал? :)

oiL-k:
Можно не просто прикинуть, но и посчитать с большой точностью

У меня появилось несколько вопросов по методике. Уже ознакомился с документами

Поисковые машины как ранжирующие системы Введение метрики и измерения

Относительная конкурентность запросов / фсем фтыкать!

Наверное, правильнее было бы адресовать свои вопросы Минычу, но все же адресую их всем.

Откуда взялись цифры в поле "Вес тестового запроса"? Почему, если взять произвольные цифры (100, 70, 30, 20, 10, 9, 8, 7, 6, 5), посчитать для них КОРЕНЬ(LN(X)), нормировать по единице, то примерно получится "искомый" результат (невязка 0,000653184)? Это нормально? Тестировалась ли методика для других запросов?

Откуда вообще взялась формула КОРЕНЬ(LN(X))? Я проверил, куда лучше использовать формулу КОРЕНЬ(КОРЕНЬ(X)) (невязка всего 0,000314848)! Можно также воспользоваться формулой LN(LN(X)), но этот вариант несколько хуже, т.к. LN(LN(X)) вычисляется не всегда даже для положительных X. Не универсальная формула получается...

И самое главное. Я правильно понимаю, что "расстояние" (термин Миныча) не измеряется для исходного запроса (например, "недвижимость"), поскольку оно получилось бы одинаковым (равным одному) между всеми сайтами выдачи? А это противоречило бы здравому смыслу, который подсказывает нам, что релевантность сайтов в первой, скажем, пятерке может быть такой: 100, 99, 20, 2, 1. Это показывает, что "расстояния" между сайтами в числовой количественной шкале были бы _не_ одинаковыми. Хочется узнать, на каком основании в другой выдаче, где сайты чисто визуально находятся дальше друг от друга (места в выдаче у них сильнее различаются :)), "расстояние" вычисляется как разность рангов? Не сеошных рангов, а самых что ни на есть математических, которые измерены в порядковой качественной шкале, и которые нельзя складывать и умножать на числа, не теряя при этом содержательного смысла.

Я, конечно, извиняюсь за свою несмышленость. Кто-нибудь может мне объяснить, в чем тут загвоздка? :)

Miha Kuzmin (KMY):
Cage, это ничего не даст. Ибо внешние ссылки с сайтов не зарегистрированных в каталоге много дают.

Так пускай дают. Они не выбрасываются из модели и ими никто не пренебрегает.

Вы считаете тИЦ, например, суммированием тИЦов ссылающихся сайтов с весовыми коэффициентами тематической близости рубрик каталога. Так прибавьте к этому еще тИЦы всех ссылающихся сайтов, которых нет в каталоге, с другими коэффициентами. Будет аналог того, что все сайты, которых нет в каталоге Яндекса, находятся в отдельной рубрике, с которой у каждой настоящей рубрики каталога свой коэффициент тематической близости.

Вот и все ;)

The WishMaster:
Если взять науку, например. Ну, химию. Вроде как в ней все известно - законы, закономерности, формулы, уравнения и т. п.

Вот видите, в химии это все есть, а в SEO нет. Непорядок :)

Не знаю как в химии, но, надеюсь, Вы не будете отрицать, что многие формулы в науке (в разных науках) можно не подвергать сомнению и обойтись без "сложных экспериментов"?

Вы, конечно, можете подбрасывать монетку 4040 раз (как Бюффон), чтобы узнать сколько примерно раз выпадет орел, а сколько решка. Или 12000 раз (как Пирсон), или 24000 раз (как опять же Пирсон, вот человеку нечем было заняться :)). А можете воспользоваться формулой. Она давно выведена и доказана.

Этим я хотел сказать, что необходимость проведения экспериментов в некоторых случаях не отрицает возможность и целесообразность использования ранее выведенных формул.

The WishMaster:
Так и с поисковиками. Как учтешь, например, действия модераторов? Искусственное понижение веса, непот и т. п.?

Их можно просто не учитывать. Это не значит, что они не оказывают влияние. Это означает, что бОльшая часть сайтов не испытывает на себе действия модераторов. Восстановите зависимость для таких сайтов и сможете определять позицию своего сайта среди _них_. А те, кого пессимизировали ... какое нам до них дело :)

Miha Kuzmin (KMY):
Вы не поняли. Граф ссылок между доменами имеет такое же отношение к каталогу яндекса, как балерина к пиву :)

Нее, по-моему, граф имеет несколько большее отношение к каталогу Яндекса :)

Вообще, насчет формулы тИЦ, это не только моя идея. Вон местный Professor писал (в этой теме):

используя методы регрессионного анализа можно анализировать тИЦ уже включенных в каталог сайтов, т.е. свои сайты не нужны ... но нужно продумать фукнкции составляющих формулу ...
...
достачно выкачать базу ссылок примерно по 1000 сайтов.

Вероятно, это примерно:
1000 (сайтов) * 500 (в среднем по палате) / 50 (результатов на странице) = 10 000 запросов к Яндексу

По большому счету, достаточно знать, сколько сайтов и из каких рубрик каталога ссылаются на сайт. Если собрать такую информацию по многим сайтам, то можно восстанавливать зависимость. Весь граф ссылок просто не нужен...

Всего: 220