baltic13

Рейтинг
44
Регистрация
04.07.2006
Интересы
преф
Елистратов:
baltic13, не забудь еще, что существуют связи между анкорным и текстовым DSC;)

две недели назад, когда ты еще был с нами, ты мне напрямую об этом всё сказал и не только мне.

сначала связь даже какая-то просматривалась и алгоритм работы была даже мысль откорректировать. хорошо, что все-таки решили серьезнее проверить гипотезу..в процессе выяснилось, что это не более чем совпадение.

Елистратов:
но зная в каком направление "роит" baltic13 я сдлал ему подсказочку:)

сомневаюсь, что ты знаешь:) Жень, хоть практический вывод был из этой "связи" сделан правильный, но .. о "связи" вышел сказал.

Елистратов:

Кстати мы не совсем правильно обозначили dsc..Будет правильнее не максимального tf по всем терминам документа, а просто tf термина в данном документе.
Потому что если брать за основу dsc как максимальный tf по всем терминам документа, то во всех моих словах получится полный бред...

о связях говорит не буду, потому как ты это придумал и тебе решать говорить об этом в открытуб или нет. возможно, конечно, что-то уже изменилось в твоих мыслях.

НО все-таки скажи, что ты подразумеваешь под tf (не нормированной)? только напрямую :)

Фриман:
Насколько я помню логарифм для анкорной он только предполагал, и потом сам же себя опроверг.

в англоязычных статьях описывались эксперименты по выбору нормировки при анкорном ранжировании. логорифмическая функция бесспорно была наиболее релевантна☝

разговор уже отклонился от темы.

думаю, что стоит ознакомиться с векторной моделью, в котрой есть кое-что о многословных запросах(QL>1), в том числе и о распределении весов. только пока сам не сильно понял модель.

wolf, по сабжу мыслей не подкинете?

Фриман:
baltic13 мы уже начинаем мерять свои ВИЦы, вам не кажется?:)
Я придерживаюсь другой гипотезы.
Вобщем не буду спорить, эксперимент этот у меня уже на стадии съедения Яндексом, посмотрим что выйдет.

я сказал вам своё мнение по поводу этого эксперимента. дальше уж смотрите сами.

Фриман:

Я придерживаюсь другой гипотезы.

не поделитесь гипотезой?:)

Фриман:
есть такой термин в математике - порядковая величина. Яндекс нам выдает релевантность как раз в виде порядковой величины. Я не спец, но в курсе что и там есть свои подходы.

что это меняет? :)

Фриман:

перейдем к функции ссылочной релевантности:)
R = f(aTF, IDF, aIDF)

wolf действительно утверждает, что помимо TFa и IDFa присутсвует еще IDF, НО он же сделал оговорку, что

wolf:

IDF в этом случае рассчитывается немного по другой формуле, чем при текстовом ранжировании.

вы знаете как нормируется? чтобы менять эту величину.

Фриман:

IDF - как хотим;

каким образом?

Фриман:
Можно проследить характер функции по порядковым значениям релевантности?

характер - непрерывно возрастающий:) вид функции подобным образом не определить, погрешность большая.

p.s. через любые 3 точки можно провести линию..определенной толщины:)

CatRegist:
А почему бы не подойти с точки зрения логики и средней школы?
кондиционер Panasonic
/кондиционер Какой? Panasonic

купить кондиционер
/купить Что? кондиционер

в первом случае вес будет для слово кондиционер меньший, чем во втором, т.к. речь речь во втором идёт о кондиционере, а в первом случае о кондиционере Panasonic

Просто мне непонятно почему во всех подобных принято обсуждать слова, как отдельные составляющие. По вашей логике "сайт кондиционер" правильный анкор?

вышеизложенное скорее относится к определению вида запроса, но никак не к распределению веса😒

Фриман:
Мы линейно изменяем один из параметров (aTF), если документопозиции также будут меняться линейно, значит зависимость - линейная, если как-то иначе ... Вобщем характер читается.

если мы изменяем tfa, то и зависимость от нее определяем

Фриман:

если документопозиции также будут меняться линейно, значит зависимость - линейная

далеко не значит. И вот почему:

1. позиции в ПС выстроены по релевантности, а релевантность 1ой позиции от 2ой может отличаться на 1, а 2ой и 3её на 10. Вот вам и линейность :(

к сведению линейно - это значит f(x)= a+ b*x , а при вашем подходе позиции могут быть одинаковыми при любых видах функции, если она возрастающая и непрерывная.

Фриман:
С точностью до идеи:
1. Фиксируем интервал на данную пару слов.
2. Создаем и индексируем через addurl N одинаковых документов с одним вхождением каждого из слов.
3. Дождавшись индексации, убеждаемся в эквивалентности значений релевантности.
4. Ставим ссылки с одной и той же страницы на все документы, длина ссылок = 64 слова, коннцентрации распределены согласно доверительному интервалу.

и что в итоге получим? позиции сайтов. как вы собираетесь анализировать эти данные?

в лучшем случае из этого эксперимента получите, что передача веса зависит от IDF, что и так понятно. А линейна или нет - не получиться выяснить.

Borya:
Есть мысли, как определить зависимость?!

пока не знаю в чем мерить эффект. В позициях неправильно(он выше на 20 значит линейно или что-то подобное), другого не нашёл еще. Но должно что-то быть☝

garry_chem:
По миражу (текстовый вес)
Согласен, что для кондиционеров обе ссылки будут схожи по передаваемому весу, если исходить из текстовых весов. А вот из анкорных...?

я исходил из анкорных весов, хоть и приближенных. методика определения не идеальна, но порядки сказать можно.

garry_chem:

Еще интересен вопрос о количестве слов в ссылке и передаваемого веса для первого, второго, ..., n-го (при условии схожих весов слов из анкора).

сильной зависимости не может быть от позиции слова в анкоре, поэтому это можно отложить до лучших времен:)

_mihey:
Когда домен регистрировался и когда выведенный проект был проиндексирован?двигался мордами или внутряком ?

проектов несколько, месяца регистрации(в индекс почти сразу +2 недели к регистрации) - март, октябрь, конец августа. Двигались внутряком. С ними все впорядке, в топе.

Есть и другие. Регистрация + индексация: март, август. Двигались внутряком. После 20-ого выпали из топа.

Borya:
веса анкорные должны быть более близкими друг к другу. Что интересно, это подтвердили на форуме :) Остается научиться определять вес анкорный...

в том-то и интерес, что веса нормируются таким образом, что разброс не большой и редкие слова не могут сильно влиять на вес остальных слов в анкоре.

Borya:

1. Вес делится между словами ссылки в соответствии с весом каждого из слов.
2. Чем больше "вес слова", тем больше веса будет передано этому слову. И, стало быть, другие слова получат меньший вес.

меньше, больше так понятно. на ваш взгляд линейно распределяется или хитрее?

bondarev.pp.ru:
То есть, по-вашему, для продвижения по слову "кондиционеры" анкор "кондиционеры Panasonic" предпочтительнее, чем "купить кондиционеры"?

поспешил с мнением.. все как раз наоборот :) чем больше idf у слова в тексте ссылки, тем больше ему должно передаваться.

у слова "кондиционеры" вес сущесвенно выше, чем у слов "купить" и "Panasonic", поэтому эти два варианта не сильно будут отличаться.

Елистратов:
Борь, совершенно не верно;)

ага, понял уже. ну, это очевидно, что такое утверждение не верно и не логично.

Только вопрос-то все равно открытый на суммарный вес нормируется или как-то по-другому.

например, запрос из двух слов состоит. У одного вес1= 1, у другого вес2=3 - кому сколько достанется?

Всего: 253