юни

юни
Рейтинг
939
Регистрация
01.11.2005
Lupus:
И ты, Брут!

Нибожемой! :) Так, для запасу сказал. :) К тому ж - грешен, смотрю федеральные каналы. :)

Костя Джипег, нет, там другая проблема - через инклюд код выводится корректно, а обработанный скриптом результат работы кода (о как :)) - меняет кодировку.

Уже решаем. :)

MiRaj, это пример для дополнительного анализа, при прочих равных показателях. Или Вас термин "тематичный" смущает? Ну, пусть "релевантный" будет, давайте заменим, вправду сказать. :)

Lupus:
Разве в России (да и не только) между ними есть дистанция? Что ни миллиардер, то либо депутат, либо губернатор. Или. Что ни губернатор, то либо миллионер, либо муж миллионерши.

Пожалуй, всё же есть. Множество миллионеров всё-таки не полностью пересекается с множеством политиков.

Lupus:
И это тоже. Я же написал "еще одно обстоятельство".

Я этого не отрицал. Но дело в том, что обстоятельств много, а силу из них имеет - лишь малая часть. Вот ядрёна бомба и много денех - в эту часть входят. А компромат (мнимый ;) или действительный) и ниже - можно сказать, нет: те, на кого можно завести компромат, на эту возможность не обращают внимания, а те, на кого завели - ничего из себя не представляют.

Хотя, конечно, это во мне зомбированность, быть может, пошаливает. :)

Разработчик:
Я правильно понял...

Да, именно так.

Megamozg:
юни, вы просто предлагаете внести еще один фактор при подсчете релевантности...

Точнее, я предлагаю предположить возможность существования такого фактора. :)

Более того, уверен, что это реализовано. Чисто субъективно. :)

Разработчик:
Это правильный шаг к полной оценке ресурсов
Вот именно.

Попробую проиллюстрировать (к модераторам - поможите перевести ссылки в смотрибельный вид, что-то не нашёл я, как с этими аттачментами разбираться):

У нас есть два документа (цвет фона - тематика документа, цвет "строки" - тематика текста, цвет маленького прямоугольника - тематика ссылки и, соответственно, запроса):

Тематический во всех отношениях документ:

и документ не столь идеальный:

Итак, есть тематический запрос. Понятно, что несмотря на одинаковую тематику самих документов, более релевантным запросу окажется первый из них, из-за "подпорченной" ссылки второго.

Однако, что делать, если выбирать нужно между одинаковыми (на первый (или сегодняшний) взгляд) разновидностями второго документа? Здесь вступает в дело анализ околоссылочного текста, который показывает, что третий документ нашего анализа:

более соответствует запросу, чем четвёртый:

Не смотря на их кажущуюся, на первый взгляд, идентичность. Стоит, кстати, отметить, что и пятый документ в нашем примере, хоть и немного, но всё-так ниже первого будет стоять в воображаемой выдаче по изначальному запросу:

gif rel.gif
gif rel1.gif
gif rel2.gif
gif rel2-1.gif
gif rel3.gif

psu, я больше теоретизирую, чем применяю эти мысли к каким-либо конкретным способам продвижения. :) Мы же тут только догадки строим, да идеи подкидываем кое кому. ;)

T.R.O.N:
Увеличение обрабатываемого текста приведет к "размыванию" результата.
T.R.O.N:
Чем длинее обрабатываемый текст, тем сложнее его индентифицировать.

Смотря какую роль мы отводим такой обработе. ;)

Если определяющую - то да, появляются сложности с тематикой и пр. Если же уточняющую, к уже достигнутым (на ранних стадиях ранжирования) результатом - то, напротив, это будет дополнительный фактор к пресловутому улучшению выдачи.

При должной реализации, разумеется.

Не, не.... товарищи бояре. :) Имеется в виду, разумеется, только один из многих факторов, влияющий на выбор результата, наиболее релевантного запросу.

Фраза была адресована в основном Сергею, ещё вчера выразившему мнение о неизбежных технических затруднениях, при учёте околоссылочного текста.

Примером же своим, я хотел показать, что для выбора документа на запрос "купить кондиционер слону" необязательно только лишь жестко учитывать ссылки со словом "кондиционер", "слон" и "купить" (и их сочетания), а также остальные факторы (тематичность, авторитетность и пр.).

Можно, в качестве дополнительного параметра, включить анализ околоссылочного текста (производимый при том же анализе всего документа), который позволит к такому подходу:

1. Ищем документы с внешними ссылками, со словом (словами) из запроса - и присваиваем им коэфициент.

2. Производим "на лету" анализ соответствия тематики (авторитетности и пр.) документа нашему запросу - и присваиваем этому анализу коэфициент.

3. Из массива найденых документов выбираем "покоэфициенистей" :) - и выдаем его пользователю.

к этому вот подходу прибавить ещё одну стадию:

N. Среди найденных на первой стадии документов ищем те, которые содержат слова из запроса "рядом" со ссылкой (которая уже содержит слова из запроса) - и присваиваем им коэфициент (влияние которого уменьшается, при превращении "рядом" в "очень далеко" :)).

Т.е. всё, что нужно, это учёт не анкоров, а анкоров + текст "рядом". Все остальные алгоритмы ранжирования остаются неизменными. Чего в этом есть технически невозможного?

Megamozg:
какому запросу будут релевантны все документы ссылающиеся на сайт-донор, если по вашим словам релевантность посчитана заранее?

Релевантны просчитанной заранее релевантности. :) То бишь, запросу "купить кондиционер" будут релевантны документы, на которые ссылаются следующим образом (в порядке убывания):

1. Хотите <a>купить кондиционер</a> Вашему любимому слону?

2. Хотите купить <a>кондиционер</a> Вашему любимому слону?

4. С ума сошли? Зачем <a>кондиционер</a> Вашему любимому слону?

Я так и не увидел технических препятствий, для такого подхода к ранжированию околоссылочного текста (т.е. для учёта на одно/два слова/предложения больше, а не для учёта слов/предложений внутри тега <a>).

MiRaj, Вы согласны с этой мыслью? Что-то не могу понять суть Вашего поста. :)

Lupus, для этого есть более весомые причины, вроде состояния ВПК и (не)возможности длительного финансирования какой-либо конфронтации. Да и, нувориши с лакеями у нас скорее в экономике, чем в политике.

Lupus:
У штатовских спецслужб и их европейских коллег есть достаточно компромата на теперешнее российское руководство.

Достаточно - для чего?

Всего: 35054