ХренРедькиНеСлаще

ХренРедькиНеСлаще
Рейтинг
57
Регистрация
27.07.2006
Должность
Безработный, если кто даст подработать подкинет, милости прошу к своему шалашу... Девушкам особое почтение! :)
Интересы
Вино и бабы :) Короче, Любовь!
Любитель редьки и огурца
Kostya:
вы переносите суждения о контенте на суждения о ссылках, мне кажется все таки там разная логика присутствует

Привычка - вторая натура. это не обо мне а о создателях Яндекса. Трудно отойти от своего детища совсем и далеко. Любовь! Тем более удержать под контролем огромную расползающуюся сеть, стремящуюся тебя надуть , взгреть и проспамить, и все это в нескольких руках!

Программисты любят использовать старые библиотеки подпрограмм, многократно испытанные и отлаженные. Есть и экспериментальные соображения. Параметры подправить и то что нужно ссылочному с успехом найдется в контенте.

Ведь говоря о ссылочном, разве мы не говорим о контенте (текстАх ссылок)?

psu:
прошу прощения, не совсем понял, как определить для фразы тематику понятно ("зайти в Я.Директ - Дать объявление - ..."), но если речь идет о странице (сайте), то как быть с ним? дергать пословно на соответствия тематики,а потом по какой-то схеме интрепретировать?

Вот тут можно почитать у Бойцова Леонида:

http://itman.narod.ru/

Благо, товарищ, вроде в Яндексе работал до ноября 2005 года и как раз по этой проблеме..

Kostya:
Цитата:
Сообщение от ХренРедькиНеСлаще
тошнота взялась вначале из контента, поэтому будем различать так
тошнота контента донора, и это не есть ссылочная тошнота донора и не есть ссылочная тошнота больного.

вы уверены что она может влиять?

Все, что может влиять, может влиять, это как бутерброд всегда падает маслом вниз.

А вот влияет ли сегодня? Это вопрос опыта.

amonasro:
как потом от полученных значений перейти к графикам?
Что за значения по осям x и y?

На большинстве там логарифмы от весов острого края ступеньки миныча (образно говоря высота итой ступени и отступ итой ступени по горизонтали от начала лестницы)

Одна диаграммка для того чтобы показать, корень из логарифма не будет линейной функцией, если мы хотим учесть несколько (сумму вкладов).

Хочу подчеркнуть, что графики в файле не есть функция релевантности отвеса! Это функция, которая показывает, при каком значении весов функции релевантности для наших двух страниц и наших двух подзапросов (разделенных оператором ИЛИ) РАВНЫ.

Но из этих графиков можно получить и функцию релевантности, если договориться об единицах измерения.

Kostya:
но вы скажите что есть тошнота в данном случае, тошнота чего?
тошнота взялась вначале из контента, поэтому будем различать так

тошнота контента донора, и это не есть ссылочная тошнота донора и не есть ссылочная тошнота больного.

Kostya:
Сообщение от ХренРедькиНеСлаще
тошнота донора, тошнота больного

тошнота чего? Мы же говорим именно о силе, а не о каком-то запросе. Это же статический показатель

А в формуле они и идут как константы (не зависят от запроса). Хотя для нового алгоритма независимость тошноты от запроса надо уточнить. Ранее зависимости не было, кто его знает сейчас? Проверим скоро.

Мои слова надо понимать так: сила ссылки зависит от числа ссылок на доноре, от,... и тд. Вот вопрос на засыпку (для старого то мы знали ответ) зависит ли сила ссылки от тошноты донора? Опять же скоро прооверим, не все сразу :)

amonasro:
1. Вы фиксируете вес слова 203 - это f
2. Меняя параметр d для слова 202 при фиксированном f вы получаете то пороговое значение, при котором получается смена выдачи. Это понятно.

Уже хорошо :)

amonasro:
Непонятно, откуда появляется параметр "b"

"b" это как раз то значение ступеньки, которое получаем, делая около 32 замеров (тестовых запросов), вес в яндексе это 32 битное число. Если увеличить этот граничный вес на 1 (столбец D), то будет изменение в выдаче.

amonasro:
А вслед за ним тянутся столбцы J, K, L...

J,K,L, это уже расчетные данные из полученных экспериментальных:

логарифм, корень из логарифма, прирост логарифма при переходе к следующей ступеньке, прирост корня, номер ступеньки, если ступеньки идут по логарифму, номер ступеньки, если прирост идет по корню из логарифма...

wolf:
Цитата:
Сообщение от ХренРедькиНеСлаще
(Сила ссылки)*Сумма((константа переколдовки i-го ключевика)*ln(вес i-го ключевика))

Это и без таких экспериментов понятно вообще-то. За исключением логарифма, но вид самой фукции суть не важен, главное, что она монотонно возрастающая.
На точном вхождении должны получить максимум константы перколдовки.
Вся фишка - в силе ссылки. Считать умеете для произвольно взятой ссылки?

- Это не тривиально.

- И без таких экспериментов этого не установишь.

-Для сравнения вкладов ссылочного и контента в старом алгоритме это было нетривиально в квадрате, сейчас скорее всего это упростили (в следующем файлике будет ссылочное и контент в "одном флаконе").

До силы ссылки тоже дело дойдет :)

Собственно говоря, раз мы ее уже давно меряем для оценки разумности платы (на ссылках с ценами в районе 20-60 баксиков).

pro-maker:
"Сила ссылки" - это вИЦ? "константа переколдовки i-го ключевика", если не вес, то что? Повторение ключевика в анкоре работает?

Это все вместе взятое (ВИЦ донора, ВИЦ больного, число ссылок на доноре, тошнота донора, тошнота больного). Какова зависимость силы ссылки поконкретнее дальше будет видно, по мере выкладывания результатов.

Константа переколдовки это коэффициент усиления влияния слова за счет усиления наличия точной формы слова. Ранее этот коэф-т почти для всех слов равнялся 1. Только изредко менялся (для часы, домофоны,..) Зависит от наличия спец оператора процента в переколдовке.

Атавизм показа такой переколдовки еще остался. Вот например, впервые обнаруженная Минычем переколдовка:

что такое стеклопакет перколдовывается как:

reqtext=%(!+что::204 &/(1 1) !+такое::4876) &/(1 1) стеклопакет::141684 &/(1 1) !%это::370 &/(-2 4) %означает::23971 &/(-2 4) %аббревиатура::465115 &/(-2 4) %расшифровывается::253049

Если в такой переколдовке встречается нулевое расстояние /(0 0) там и появляется спецпереколдовка.

Собственно изменение падежей и нестандартная переколдовка следует из таких запросов в файлике, как tom<-->toms, 2003<-->02003, meth<-->meths

По tom когда сделал опыт, сразу подумал, что выдача по tom и toms (обычная. однословный запрос) будут сильно отличаться, проверил и как в воду глядел. Аналогично подтвердилось потом и в meth<-->meths.

🚬

Итак, продолжим.

Не захотел опираться на те эксперименты, которые делались до недавно объявленных корректировках алгоритма. Поэтому выкладываю немного того, что сделал совсем недавно. Результаты в аттаче (файлик Ексель). Пояснения к файлику -- смотрите в первом посте темы и в файлик-аттаче там же.

Специально проверил зависимость от "падежей" и перемены слов в запросе "ИЛИ".

Некоторые из выводов, которые можно сделать из выложенного:

-необычно частая нестандартная переколдовка слов (зависимость от падежей и чисел множ./един.), ранее такой частой не наблюдалось, нестандартную переколдовку надо было днем с огнем искать. А здесь фактически каждое слово в ссылке. Это следует также из разнообразия размеров ступенек Миныча (при константе тошноты ссылочной это указывает на нестандартную переколдовку).

-чистая линейность между логарифмами задаваемых весов (если не учитывать или сгладить ступеньки Миныча), что позволяет сделать вывод, что формула релевантности ссылочная пропорциональна функции:

(Сила ссылки)*Сумма((константа переколдовки i-го ключевика)*ln(вес i-го ключевика))

В данном Ексель дано только для двух ключевиков (для большего само собой ожидаем ограничения) :)

-Полная предсказуемость измерений на основе проделанных заранее тестов.

Соотношения между ссылочным и контентом дам позже денька через два-три :)

zip 2815.zip
Всего: 982