Количество страниц с ключевиком

123
zambezi
На сайте с 13.07.2006
Offline
28
#11
FlyAway:
zambezi, естественно не имеет.

Почему естественно? Нередко встречается высказывание, что "Яндекс любит большие сайты"...

FlyAway
На сайте с 01.06.2005
Offline
439
#12

zambezi, где? :)

Сердюченко Андрей (http://www.serdyuchenko.ru/) Масонская ложа — SЕ-Team.ru (http://goo.gl/YIjV6h) :)
zambezi
На сайте с 13.07.2006
Offline
28
#13
FlyAway:
zambezi, где? :)

будете смеяться, на этом форуме :)

и на других смежных ресурсах

как в следующий раз услышу - Вам скину

FlyAway
На сайте с 01.06.2005
Offline
439
#14

zambezi, нет мне кидать не надо, а если все снимут трусы и выйдут на улицу, вы тоже с ними пойдете? :)

MaulNet
На сайте с 07.08.2005
Offline
348
#15

zambezi, я лично сам попробывал с каждой странице сослаться по 3-ем ключевикам на главную - посмотрю есть ли эффект как только проиндексятся внутренние и будет ап. Не исключаю, что будет.

ХренРедькиНеСлаще
На сайте с 27.07.2006
Offline
57
#16

В теории и практике поиска документов в коллекции, например в каталогах (Яндекса), новостях, маркете, сайте есть такой параметр как idf (inverse document frequency). И он считается не менее важным чем tf (term frequency)/

А классическая теория так и называется tf-idf

см например ссылки в :

http://www.yandex.ru/yandsearch?text=tfidf+%EF%EE%EB%ED%EE%F2%E5%EA%F1%F2%EE%E2%FB%E9+%D1%E5%E3%E0%EB%EE%E2%E8%F7+%CC%E0%F1%EB%EE%E2&stype=www

http://company.yandex.ru/articles/romip2004.xml

Чем меньше в процентах найдено документов в коллекции (сайте, например) тем более значима найденная страница (совсем обратное тому, что кто-то любит большие сайты). От Яндекса скорее можно ожидать, что он любит малый процент найденных на сайте страниц.

И то, что яндекс ее имеет в алгоритме, очень и очень вероятно. Вопрос скорее в том, какую нормировку он делает для idf сайта. 🚬

Дайте мне рюмку опоры и мир засветится всеми цветами радуги.
zambezi
На сайте с 13.07.2006
Offline
28
#17
ХренРедькиНеСлаще:

Чем меньше в процентах найдено документов в коллекции (сайте, например) тем более значима найденная страница (совсем обратное тому, что кто-то любит большие сайты). От Яндекса скорее можно ожидать, что он любит малый процент найденных на сайте страниц.

Из данных ссылок следует, что IDF пропорционален соотношению кол-во страниц на сайте/кол-во релевантных запросу страниц на сайте.

В топике речь как раз о том, чтобы увеличивать количество релевантных страниц.

И вообще, чисто по-человечески - ведь должно влиять количество!

Почему сайт с сотней страниц, из которых одна про рыбу, должен считаться более релевантным запросу "рыба", где сайт, на котором сто страниц и все про рыбу?!

ХренРедькиНеСлаще
На сайте с 27.07.2006
Offline
57
#18
zambezi:
Из данных ссылок следует, что IDF пропорционален соотношению кол-во страниц на сайте/кол-во релевантных запросу страниц на сайте.
В топике речь как раз о том, чтобы увеличивать количество релевантных страниц.

Вполне вероятно, что так делать бессмыссленно, если нужны топовые позиции в выдаче. А вот УМЕНЬШИТЬ число таких страниц - это вариант.

Но с другой строны надо собирать низкочастотники, поэтому число страниц на сайте вообще-то надо делать большим и меню не сквозное, а в виде дерева. Хотя и здесь не все так гладко. Говорил же Сегалович, что релевантность размазывется по многим признакам. Так что нос вытащишь, хвост увязнет. Заточишь сайт под одно, зато другое упустишь. Да и влияние idf там логарифмическое а не линейное, да еще смотришь с каким-нить "корешком" с показателем между 1/2 и 1/3 (см. статью Сегаловича на ромипе).

чисто по-человечески - ведь должно влиять количество!

мне по человечески иногда хочется качества :)

Это как? Лучше одна девушка, добрая и любящая тебя, или 10 злых стерв?

Почему сайт с сотней страниц, из которых одна про рыбу, должен считаться более релевантным запросу "рыба", где сайт, на котором сто страниц и все про рыбу?!

Это учет того, что на этом сайте вес слова "рыба" обесценивается для наиболее релевантной страницы (становится малоинформативным), но не до нуля! КОНТРАСТНОСТЬ слова рыба становится маленькой.

Вообще, не замечали, что иногда в топе появляются доки с каталогов? С какой стати? Или с форумов? Опять таки, почему?

zambezi
На сайте с 13.07.2006
Offline
28
#19
ХренРедькиНеСлаще:
Вполне вероятно, что так делать бессмыссленно, если нужны топовые позиции в выдаче. А вот УМЕНЬШИТЬ число таких страниц - это вариант.

Поверить не могу... где смысл? где логика?

ХренРедькиНеСлаще:
Да и влияние idf там логарифмическое а не линейное, да еще смотришь с каким-нить "корешком" с показателем между 1/2 и 1/3 (см. статью Сегаловича на ромипе).

Логарифмическое, да, но при наращивании числа релевантных страниц idf уменьшается, это точно. А вот как это влияет на выдачу, уже туго 😕

ХренРедькиНеСлаще:
Это как? Лучше одна девушка, добрая и любящая тебя, или 10 злых стерв?

Лучше 10 добрых!!! Я же говорю - релевантные страницы! 😂

ХренРедькиНеСлаще:
Это учет того, что на этом сайте вес слова "рыба" обесценивается для наиболее релевантной страницы (становится малоинформативным), но не до нуля! КОНТРАСТНОСТЬ слова рыба становится маленькой.
Вообще, не замечали, что иногда в топе появляются доки с каталогов? С какой стати? Или с форумов? Опять таки, почему?

Да замечала, конечно, но мне не понять, почему заботящийся о пользователе Яндекс выдает человеку, ищущему рыбу, доску объявлений с объявлением о продаже рыбы вместо большого портала про рыбу! Нонсенс.

ХренРедькиНеСлаще
На сайте с 27.07.2006
Offline
57
#20
zambezi:
Цитата:
Сообщение от ХренРедькиНеСлаще
Вполне вероятно, что так делать бессмыссленно, если нужны топовые позиции в выдаче. А вот УМЕНЬШИТЬ число таких страниц - это вариант.
Поверить не могу... где смысл? где логика?

А верить и не надо. А просто подумал вслух :) А на самом деле надо опыт поставить и проверить. А вот ЛОГИКА есть, особенно если хитрых дорвейщиков расплодится немеряно. Можно и к первооткрывателям tfidf за логикой обратиться, а то их умные люди цитируют, в том числе создатели алгоритма яндекса, а мы все на уровне почесать за ухом себя ведем.

zambezi:
Логарифмическое, да, но при наращивании числа релевантных страниц idf уменьшается, это точно. А вот как это влияет на выдачу, уже туго

Так ориентировочно насколько влияет можно из ИРбиса взять, а потом проверить :)

(логарифм двоичный от доков на сайте - логарифм двоичный от найденных)/(логарифм двоичный от доков на сайте)

Это коэффициент уменьшения tf.

zambezi:
Да замечала, конечно, но мне не понять, почему заботящийся о пользователе Яндекс выдает человеку, ищущему рыбу, доску объявлений с объявлением о продаже рыбы вместо большого портала про рыбу! Нонсенс.

Почему нонсенс? Представьте на сайте 1000 доков с одним словом "рыба" на каждой странице. А на другом 1000 доков без слова рыба и один док со 100 словами рыба. Кто более истории ценен?

123

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий