john2007

john2007
Рейтинг
173
Регистрация
26.03.2007
MASe:

а такой алгоритм - прямой путь к массовому саттелитчеству...

Учет ПС ссылок итак прямой путь к массовой накрутке ссылками :)

А сателлиты учиться хорошо вычислять. ИМХО это проще, чем бороться со всеми сайтами, продающими ссылки.

Вобщем, исходный вопрос был, на сколько реально, что Яндекс сейчас пользуется этой методикой, т.е. дает бонус ссылкам с доноров, релевантных запросу, с учетом степени этой релевантности? И если да, то какие факторы в оценке релевантности доноров он использует, все, контент, внешние ссылки на доноров?

MiRaj:
john2007, мм... а тот ньюанс, что львиная часть доноров не будет находиться по запросу вас не смущает?

Вот с них-то вес мы учтем по минимуму :)

Roman Pinkovskiy:
Не понял... это как? Т.е получается, что если microsoft ссылается на нас не по outlook а напроимер по excel, то мы все равно поднимемся в топ по outlook? Не верю, имхо так неправильно и такого не должно быть!☝

Почему нет?

Сайт, сильно релевантный по "outlook", "windows", "microsoft" и т.д. на нас ссылается, например анкором www.site.ru, почему нашему www.site.ru не добавить релевантности по запросам "outlook", "windows", "microsoft" и т.д.?

Ну пусть 100% добавки нам полагается по "outlook", если в анкоре есть "outlook", а если нет, то 10% нам можно добавить :)

И потом, в вИЦ же учитывается сила сайта microsoft, какой бы с него анкор на нас не стоял. Я просто говорю о передаче с него силы только по тем запросам, по которым он сам силен (релевантен) и анкор на нас с microsoft тут не причем, так же как сейчас он не причем при передаче нам вИЦ по ссылке.

di_max:
Пожалуйста!
Вопрос не только и не столько в релевантности самому запросу.
1. Так, как релевантность пассажей пересчитавать динамически(!) - удовольствие накладное, с точки зрения машинных ресурсов.
Следовательно - используется более простая и эффективная, по затратам, схема.

Релевантность пассажей итак динамически считается. "Динамически", надеюсь = "в зависимости от запроса" Вы имеете ввиду.

MiRaj:
john2007, ну давайте посчитаем - пусть у нас 10000 найденных сайтов и примерно 500 беков у каждого.
Во сколько раз увеличится количество выполненных запросов?

Пример:

отранжировали сайты (первая итерация) по запросу "запрос", сайты заняли такие места:

1) www.site1.ru

2) www.site2.ru

3) www.site3.ru

4) www.site4.ru

5) www.site5.ru

6) www.site6.ru

7) www.site7.ru

8) www.site8.ru

9) www.site9.ru

10) www.site10.ru

Дальше "видим", что на сайт www.site7.ru ссылается www.site1.ru (больше связей нет) даем ему (исходя из формулы) +. Получаем, например:

1) www.site1.ru

2) www.site2.ru

3) www.site7.ru

4) www.site3.ru

5) www.site4.ru

6) www.site5.ru

7) www.site6.ru

8) www.site8.ru

9) www.site9.ru

10) www.site10.ru

Вопрос и заключался, собственно говоря, реально ли это Яндексу по его вычислительным мощностям на данный момент?

Roman Pinkovskiy:
john2007, так и я не о релевантности донор>реципиент. Ладно, повторюсь.

Я ж тоже пытаюсь выяснить, что лучше: релевантный запросу донор или нерелевантный но с накачанным виц. А если виц условно равен между 2-мя донорами. Будет ли более релевантный запросу донор давать больший эффект?

ИМХО, лучше БЫЛО БЫ релевантный запросу, но менее накаченный донор. Потому что если авторитетный донор ссылается на нас, то неплохо было бы учесть в чем он авторитетный, по данному запросу или по другим запросам, на момент ранжирования не особо нас интересующим.

Собственно говоря ссылочный (анкорный) фактор и призван как-то это учитывать. Но ИМХО приведенный мной метод дает ПС большую уверенность в релевантности сайтов.

MiRaj:
john2007, поясните, ибо то что написано - неосуществимо.

Почему неосуществимо. Не одно ранжирование, а несколько итераций ранжирования по запросу.

Проранжировали первый раз все сайты по запросу в момент запроса. Далее в выдаче сайты друг для друга являются донорами и акцепторами. Повторно вычисляем релевантность акцепторов запросу исходя из релевантности запросу (позиции в предыдущей расчитанной выдаче) их доноров. Потом еще одна итерация и т.д. на сколько вычислительных мощностей хватит. Думаю, что 3 итерации уже не плохо.

Грубо - если есть microsoft и на него много ссылок с анкорами "outlook" и с microsoft ссылка на нас (даже не особо важно с каким анкором, но можно и это еще дополнительно учитывать), то по "outlook" мы в топе.

MiRaj:
john2007, по умолчанию считаем реципиента релевантным запросу ;)
Тогда достаточно проверить релевантность донора реципиенту вместо того, чтобы вводить релевантность через ссылку.

Идею вашу я понял, но зачем считать релевантность запросу (при каждом запросе) если достаточно проверить 1 раз связку донор-реципиент.

Считаем релевантным. Задача ранжирования, определить степень релевантности. Я о том, что бы в расчете релевантности акцептора учитывать релевантность запросу его доноров.

Как один раз проверить? Нужно же для всех возможных запросов, а значит в момент запроса.

По одному запросу донор релевантен, по другому - нет.

di_max, Вы извините, но Ваш пост годится, пожалуй, к любому топику :)

Не могли бы вы конкретизировать свою мысль.

Roman Pinkovskiy, MiRaj, я не про релевантность донора реципиенту. Я про релевантность донора запросу.

Всего: 2535