юни

юни
Рейтинг
933
Регистрация
01.11.2005
Lupus:
Разве в России (да и не только) между ними есть дистанция? Что ни миллиардер, то либо депутат, либо губернатор. Или. Что ни губернатор, то либо миллионер, либо муж миллионерши.

Пожалуй, всё же есть. Множество миллионеров всё-таки не полностью пересекается с множеством политиков.

Lupus:
И это тоже. Я же написал "еще одно обстоятельство".

Я этого не отрицал. Но дело в том, что обстоятельств много, а силу из них имеет - лишь малая часть. Вот ядрёна бомба и много денех - в эту часть входят. А компромат (мнимый ;) или действительный) и ниже - можно сказать, нет: те, на кого можно завести компромат, на эту возможность не обращают внимания, а те, на кого завели - ничего из себя не представляют.

Хотя, конечно, это во мне зомбированность, быть может, пошаливает. :)

Разработчик:
Я правильно понял...

Да, именно так.

Megamozg:
юни, вы просто предлагаете внести еще один фактор при подсчете релевантности...

Точнее, я предлагаю предположить возможность существования такого фактора. :)

Более того, уверен, что это реализовано. Чисто субъективно. :)

Разработчик:
Это правильный шаг к полной оценке ресурсов
Вот именно.

Попробую проиллюстрировать (к модераторам - поможите перевести ссылки в смотрибельный вид, что-то не нашёл я, как с этими аттачментами разбираться):

У нас есть два документа (цвет фона - тематика документа, цвет "строки" - тематика текста, цвет маленького прямоугольника - тематика ссылки и, соответственно, запроса):

Тематический во всех отношениях документ:

и документ не столь идеальный:

Итак, есть тематический запрос. Понятно, что несмотря на одинаковую тематику самих документов, более релевантным запросу окажется первый из них, из-за "подпорченной" ссылки второго.

Однако, что делать, если выбирать нужно между одинаковыми (на первый (или сегодняшний) взгляд) разновидностями второго документа? Здесь вступает в дело анализ околоссылочного текста, который показывает, что третий документ нашего анализа:

более соответствует запросу, чем четвёртый:

Не смотря на их кажущуюся, на первый взгляд, идентичность. Стоит, кстати, отметить, что и пятый документ в нашем примере, хоть и немного, но всё-так ниже первого будет стоять в воображаемой выдаче по изначальному запросу:

gif rel.gif
gif rel1.gif
gif rel2.gif
gif rel2-1.gif
gif rel3.gif

psu, я больше теоретизирую, чем применяю эти мысли к каким-либо конкретным способам продвижения. :) Мы же тут только догадки строим, да идеи подкидываем кое кому. ;)

T.R.O.N:
Увеличение обрабатываемого текста приведет к "размыванию" результата.
T.R.O.N:
Чем длинее обрабатываемый текст, тем сложнее его индентифицировать.

Смотря какую роль мы отводим такой обработе. ;)

Если определяющую - то да, появляются сложности с тематикой и пр. Если же уточняющую, к уже достигнутым (на ранних стадиях ранжирования) результатом - то, напротив, это будет дополнительный фактор к пресловутому улучшению выдачи.

При должной реализации, разумеется.

Не, не.... товарищи бояре. :) Имеется в виду, разумеется, только один из многих факторов, влияющий на выбор результата, наиболее релевантного запросу.

Фраза была адресована в основном Сергею, ещё вчера выразившему мнение о неизбежных технических затруднениях, при учёте околоссылочного текста.

Примером же своим, я хотел показать, что для выбора документа на запрос "купить кондиционер слону" необязательно только лишь жестко учитывать ссылки со словом "кондиционер", "слон" и "купить" (и их сочетания), а также остальные факторы (тематичность, авторитетность и пр.).

Можно, в качестве дополнительного параметра, включить анализ околоссылочного текста (производимый при том же анализе всего документа), который позволит к такому подходу:

1. Ищем документы с внешними ссылками, со словом (словами) из запроса - и присваиваем им коэфициент.

2. Производим "на лету" анализ соответствия тематики (авторитетности и пр.) документа нашему запросу - и присваиваем этому анализу коэфициент.

3. Из массива найденых документов выбираем "покоэфициенистей" :) - и выдаем его пользователю.

к этому вот подходу прибавить ещё одну стадию:

N. Среди найденных на первой стадии документов ищем те, которые содержат слова из запроса "рядом" со ссылкой (которая уже содержит слова из запроса) - и присваиваем им коэфициент (влияние которого уменьшается, при превращении "рядом" в "очень далеко" :)).

Т.е. всё, что нужно, это учёт не анкоров, а анкоров + текст "рядом". Все остальные алгоритмы ранжирования остаются неизменными. Чего в этом есть технически невозможного?

Megamozg:
какому запросу будут релевантны все документы ссылающиеся на сайт-донор, если по вашим словам релевантность посчитана заранее?

Релевантны просчитанной заранее релевантности. :) То бишь, запросу "купить кондиционер" будут релевантны документы, на которые ссылаются следующим образом (в порядке убывания):

1. Хотите <a>купить кондиционер</a> Вашему любимому слону?

2. Хотите купить <a>кондиционер</a> Вашему любимому слону?

4. С ума сошли? Зачем <a>кондиционер</a> Вашему любимому слону?

Я так и не увидел технических препятствий, для такого подхода к ранжированию околоссылочного текста (т.е. для учёта на одно/два слова/предложения больше, а не для учёта слов/предложений внутри тега <a>).

MiRaj, Вы согласны с этой мыслью? Что-то не могу понять суть Вашего поста. :)

Lupus, для этого есть более весомые причины, вроде состояния ВПК и (не)возможности длительного финансирования какой-либо конфронтации. Да и, нувориши с лакеями у нас скорее в экономике, чем в политике.

Lupus:
У штатовских спецслужб и их европейских коллег есть достаточно компромата на теперешнее российское руководство.

Достаточно - для чего?

Ну шо, с юбилейчегом, дядя. :) Расти большой. :)

Больше денег, больше счастья. Ну, леголайзу можно (тока в меру ;)). Остепенись уже, мальца. Таки - дети, и всё такое. :)

И найди уже бухгалтера. :)

Подкорректирую:

wolf:
1. Релевантность документа запросу определяется "на лету".

2. Вы думаете, Яндекс может себе позволить при этом определить "на лету" релевантность этому же запросу также всех документов, ссылающихся на данный документ?

Здесь логическая ошибка - почему вдруг, если п. 1 создается "на лету", то и п. 2 обязательно должен создаваться "на лету"? ;) Такой подход конечно затронет немалые вычислительные мощности.

Но речь-то не об этом была изначально. А о том, что для определения релевантности в п. 1 используется уже просчитаные, заранее, данные из п. 2.

Вот для их просчёта, правда, требуются дополнительные ресурсы (поскольку там есть "новый", по нашим предположениям, компонент "ссылочное окружение"), но они нужны только на стадии подготовки, к определению релевантности документа запросу. А не на стадии самой проверки, этой релевантности.

(Я так думаю, в Яндексе немало идей почерпнули из подобных теоретизирований на тему, за шость-то лет. :))

jED R., прям, "из огня - да в полымя". :)

Всего: 34981