Формула релевантности

OL
На сайте с 17.04.2006
Offline
63
#31
Miha Kuzmin (KMY):
Надо просто слушать уметь. А не считать, что он напускает тумана для "личинок".

Полностью Вас поддерживаю, Миха. Вы как всегда вовремя и в теме:)

C
На сайте с 17.08.2002
Offline
82
#32
alut:
Так зачем дело стало - возьмите и посчитайте. Выведете формулу, может быть поделитесь, или продавать будете. Все в Ваших руках.

Так и думал, что рано или поздно мне это кто-нибудь предложит :)

The WishMaster:
Формулу написать элементарно. Намного сложнее выяснить значения множества коэффициентов, которые будут в ней.

Вообще-то именно в этом и заключается задача восстановления зависимости. Вопрос из первого сообщения: почему же этого до сих пор никто не сделал? :)

oiL-k:
Можно не просто прикинуть, но и посчитать с большой точностью

У меня появилось несколько вопросов по методике. Уже ознакомился с документами

Поисковые машины как ранжирующие системы Введение метрики и измерения

Относительная конкурентность запросов / фсем фтыкать!

Наверное, правильнее было бы адресовать свои вопросы Минычу, но все же адресую их всем.

Откуда взялись цифры в поле "Вес тестового запроса"? Почему, если взять произвольные цифры (100, 70, 30, 20, 10, 9, 8, 7, 6, 5), посчитать для них КОРЕНЬ(LN(X)), нормировать по единице, то примерно получится "искомый" результат (невязка 0,000653184)? Это нормально? Тестировалась ли методика для других запросов?

Откуда вообще взялась формула КОРЕНЬ(LN(X))? Я проверил, куда лучше использовать формулу КОРЕНЬ(КОРЕНЬ(X)) (невязка всего 0,000314848)! Можно также воспользоваться формулой LN(LN(X)), но этот вариант несколько хуже, т.к. LN(LN(X)) вычисляется не всегда даже для положительных X. Не универсальная формула получается...

И самое главное. Я правильно понимаю, что "расстояние" (термин Миныча) не измеряется для исходного запроса (например, "недвижимость"), поскольку оно получилось бы одинаковым (равным одному) между всеми сайтами выдачи? А это противоречило бы здравому смыслу, который подсказывает нам, что релевантность сайтов в первой, скажем, пятерке может быть такой: 100, 99, 20, 2, 1. Это показывает, что "расстояния" между сайтами в числовой количественной шкале были бы _не_ одинаковыми. Хочется узнать, на каком основании в другой выдаче, где сайты чисто визуально находятся дальше друг от друга (места в выдаче у них сильнее различаются :)), "расстояние" вычисляется как разность рангов? Не сеошных рангов, а самых что ни на есть математических, которые измерены в порядковой качественной шкале, и которые нельзя складывать и умножать на числа, не теряя при этом содержательного смысла.

Я, конечно, извиняюсь за свою несмышленость. Кто-нибудь может мне объяснить, в чем тут загвоздка? :)

C
На сайте с 17.08.2002
Offline
82
#33
K. Ermakov:
Ну, получим мы формулу релевантности. И что с ней делать?

А что, мои доводы (мой ответ Лохтеру) не убедительны?

А доводы людей в темах, ссылки на которые я давал выше?

Вы лично считаете, что Вам эта формула не нужна?

Вы откажетесь от возможности ее узнать, если бы она была?

Вы не нашли бы ей применения?

K. Ermakov:
Могу сказать, что большое число людей, не знающих её и входящих в неё коэффициентов, тем не менее успешно занимаются продвижением сайтов и занимают топы.

Не спорю.

Как крайний случай, можно вообще увешать весь интернет платными ссылками и не задумываться, что вообще есть какие-то другие факторы.

C
На сайте с 17.08.2002
Offline
82
#34
oiL-k:
ps/ Я думаю, сами работники Яндекса ее не знают. Каждый отвечает за "свой коэффициент". Может один-два в руководстве.:)

У меня несколько иное мнение: хороший результат можно получить только при комплексной "настройке" формулы.

K. Ermakov:
Где-то даже был комментарий одного господина (если не ошибаюсь, речь идёт об интервью И.Сегаловича "Вебпланете") из руководства, что формулу эту узнавать никому не нужно. Одна из причин - постоянные изменения алгоритма.

Я тоже читал это интервью Сегаловича. Правда, вывод из нее я сделал другой. Насколько я понял, по его мнению, эта формула не нужна по двум причинам:

1. формула сама по себе ничего не даст, нужно еще и поработать. Если формула "говорит": "Давай еще 1000 внешних ссылок", - то сами они не появятся, и получить их будет довольно сложно.

2. в формуле существуют факторы, которые являются характеристиками не сайта, а всей системы (Яндекса, например), на которые все равно (хоть знай формулу, хоть нет) повлиять практически невозможно.

Если подумать, то подобные причины ненужности должны бы отпугнуть _только_ начинающего оптимизатора. Кто уже в топе, у того несколько иные заботы (в том числе удержание позиций сайта).

C
На сайте с 17.08.2002
Offline
82
#35
K. Ermakov:
Одна из причин - постоянные изменения алгоритма.

И еще по поводу изменений алгоритма...

Если формула получена через угрозы Сегаловичу (для тех, кто не читал интервью, это Сегалович так пошутил :)), то тогда да, изменение алгоритма - это серьезная проблема.

Но если формула получена с применением каких либо математических методов, нет никаких преград в получении ее снова и снова (хоть каждый день), для разных запросов, для разных поисковых систем...

Я просто призываю задуматься, что Яндекс предоставляет нам море информации. Ее нельзя будет использовать только в том случае, если он перестанет ее предоставлять (закроется, например :)).

A
На сайте с 25.10.2005
Offline
219
#36

Cage,

Почему Вы упорно говорите о формуле ?

Есть алгоритм, есть несколько баз Яндекса - какие не известно. Несколько уже отслежены (по обвалам) - например, анкор база, база морд и др.

Есть выдача (причем динамическая - и позиции меняются, и апдейты идут с измененными коэф-тами ???), которая строится по существующим базам (необъятным для простого человека) и неизвестному алгоритму. Теперь представьте, какая стоит задача и можно ли ее решить целиком. Поэтому все и говорят, что можно отследить только некоторые закономерности (причем на настоящий момент, потому что через месяц они могут перестать работать)

K. Ermakov
На сайте с 10.12.2004
Offline
328
#37

Cage, я считаю, что смысла в некоем Граале - формуле релевантности - нет. А если смотреть на те моменты, о которых Вы говорите здесь

Cage:
если формула получена с применением каких либо математических методов

и здесь

Cage:
Яндекс предоставляет нам море информации

то информацию, которую даёт Яндекс, можно с пользой применять, не занимаясь выведением какой-то секретной формулы.

Говоря совсем коротко: Вам сейчас чего-то не хватает для успешного выведения сайтов в топы?

С уважением, Константин Ермаков, absite.ru: онлайн кроссворды (http://absite.ru/); searchsuggest.ru: поисковые подсказки доставляют (http://searchsuggest.ru/).
C
На сайте с 17.08.2002
Offline
82
#38
alut:
Cage,
Почему Вы упорно говорите о формуле ?
Есть алгоритм, есть несколько баз Яндекса. Есть выдача (причем динамическая - и позиции меняются, и апдейты идут с измененными коэф-тами ???)

"позиции меняются, и апдейты идут" вследствие изменения алгоритмов или характеристик сайтов. Речь идет о построении модели на данный момент. Причем хорошо восстановленная модель будет хорошо работать, пока не будет изменен алгоритм, т.е. смена позиций (так же, как и смена характеристик сайтов) должна быть отражена в модели. Это, на мой взгляд, очевидно ;)

alut:
Теперь представьте, какая стоит задача и можно ли ее решить целиком. Поэтому все и говорят, что можно отследить только некоторые закономерности (причем на настоящий момент, потому что через месяц они могут перестать работать)

То есть Ваша позиция: это сделать невозможно (потому что сложно, потому что не понятно как это сделать), но это было бы полезно. Я правильно понял? :)

C
На сайте с 17.08.2002
Offline
82
#39
K. Ermakov:
Cage, я считаю, что смысла в некоем Граале - формуле релевантности - нет
...
информацию, которую даёт Яндекс, можно с пользой применять, не занимаясь выведением какой-то секретной формулы.

Так то оно так, вот только просто глядя на выдачу Яндекса, имхо, невозможно получить ответы даже на самые простые вопросы. Например, оптимальный процент ключевых слов на странице. Вы можете посмотреть, как обстоят дела с этой характеристикой на других сайтах в топе, но (!) ... никогда нельзя поручиться, что их места не являются следствием действия других факторов. Может первая позиция "перекачана" ссылками или еще чем-нибудь.

Зная формулу, Вы могли бы действовать оптимально еще и в том смысле, что Вы бы достигали по всем характеристикам сайта _достаточные_ показатели, не тратя лишние силы, деньги и время.

Также, я постоянно призываю обратить внимание на задачу удержания позиций. Чтобы занять первое место в топе, достаточно ориентироваться на показатели сайта на первом месте. Что делать, если твой сайт уже первый? На сколько сильно он оторвался? Насколько много с ним нужно продолжать работать?

Зря Вы не почитали, сообщения, ссылки на которые я давал выше. Там даже Миха Кузьмин признался, что ждет подобную систему "с нетерпением" (речь о 4seo.ru) :)

K. Ermakov:
Говоря совсем коротко: Вам сейчас чего-то не хватает для успешного выведения сайтов в топы?

Наверное, мне не хватает того, чтобы я был оптимизатором :).

The WishMaster
На сайте с 29.09.2005
Offline
2543
#40

Ну вот я - химик. Но я не могу и никогда не мог написать ФОРМУЛУ даже самого простого ТЕХНОЛОГИЧЕСКОГО процесса. Технологические процессы (а таковым является процесс ранжирования сайтов в поисковой системе) состояит из большого числа стадий, и для составления модели требуется очень много форумул, уравнений. Для химических процессов это как химические реакции, так и физические процессы, и материаловедение и т. п. Тут тоже есть слишком много факторов. Модель будет слишком сложной, проще экспериментировать в реальных условиях.

Пешу текста дешыго! Тематики - туризм, СЕО, творчество, кулинария, шизотерика :)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий