Еще раз о весе в колдунщике

123 4
Г0
На сайте с 19.08.2004
Offline
129
10203

Итак, перечитав практически всего Миныча и ХРНС, конечно поздновато, но заинтересовался переколдовкой и весами слов. Если с попытками измерить накачанность одного сайта через слово, которое на нем не встречается все более менее понятно, то вот разная выдача при изменении веса одного и того же слова ставит меня в тупик. Пример:

http://www.yandex.ru/yandsearch?text=%28%CF%C2%D5%3A%3A50000%29

- имеем копию нормального топа

Меняем вес слова до очень низкого значения

http://www.yandex.ru/yandsearch?text=%28%CF%C2%D5%3A%3A5%29

- имеем какой-то топ ссылок

Может кто подскажет, что это за топ ссылок?

Вижу сусликов, которых нет. Покупаю заброшенные сайты, ссылки с pr17-18, пью водку. В личку. Интим не предлагать.
MiRaj
На сайте с 03.07.2006
Offline
509
#1

Геннадий0, даю подсказку - выставляя вес термину 5 вы по сути ставите приоритет на текстовое ранжирование, игнорируя ссылочное.

Т.е. топ формируется из документов с определенным количеством пассажей и определенной "тошнотой". Далее - сами.

Муркетолог. 100 пресс-релизов с прямыми ссылками за 150 баксов? Легко! (http://b2blogger.com) Статейный маркетинг - лучшее лекарство от Минусинска! (http://miralinks.ru)
Nikitoz
На сайте с 11.09.2006
Offline
21
#2
MiRaj:
Геннадий0, даю подсказку - выставляя вес термину 5 вы по сути ставите приоритет на текстовое ранжирование, игнорируя ссылочное.
Т.е. топ формируется из документов с определенным количеством пассажей и определенной "тошнотой". Далее - сами.

Типа пассажи в анкор-листе не пройдут кворум для ссылочного, если низкий вес словам задать?

Г0
На сайте с 19.08.2004
Offline
129
#3

MiRaj, спасибо! Теоретически да, но .... посмотрите выдачу по второй ссылке, на первом месте сайт, где ключевик упоминается в тексте всего 1 раз и то в исходящей ссылке. Ну как текстовая релевантность этой страницы сайта запросу может быть самой большой из всех проиндексированных страниц? Вторая страница в выдаче - то же самое.

Меня именно это очень сильно смущает.

Nikitoz
На сайте с 11.09.2006
Offline
21
#4
MiRaj:
Геннадий0, даю подсказку - выставляя вес термину 5 вы по сути ставите приоритет на текстовое ранжирование, игнорируя ссылочное.
Т.е. топ формируется из документов с определенным количеством пассажей и определенной "тошнотой". Далее - сами.

Хм, странно. Положим, что ссылочное мы отключаем и серп формируется с приоритетом на текстовую составляющую. Тогда все равно страницы хорошо прокачанные внутренними факторами (где много раз в тексте встречается слово "ПВХ") должны быть релевантнее страниц, где это слово встречается единственный раз и то в тексте ссылки.

Сравните, например, сохраненные копии первых трех сайтов по запросу ПВХ::5000

http://hghltd.yandex.com/yandbtm?url=http%3A%2F%2Fwww.oknadil.ru%2F&text=(%CF%C2%D5%3A%3A50000)&reqtext=%CF%C2%D5%3A%3A50000&dsn=0&d=3763711&sh=2&sg=57&isu=1

http://hghltd.yandex.com/yandbtm?url=http%3A%2F%2Fwww.okna-new.ru%2F&text=(%CF%C2%D5%3A%3A50000)&reqtext=%CF%C2%D5%3A%3A50000&dsn=0&d=4920117&sh=4&sg=65&isu=1

http://hghltd.yandex.com/yandbtm?url=http%3A%2F%2Fwww.hobbit.ru%2F&text=(%CF%C2%D5%3A%3A50000)&reqtext=%CF%C2%D5%3A%3A50000&dsn=0&d=2519054&sh=2&sg=33&isu=1

Сохраненные копии первых трех сайтов по запросу ПВХ::5

http://hghltd.yandex.com/yandbtm?url=http%3A%2F%2Fwww.spbparket.ru%2Fparket_traditional.htm&text=(%CF%C2%D5%3A%3A5)&reqtext=%CF%C2%D5%3A%3A5&dsn=-3&d=1462049&sh=1&sg=-1&isu=1

http://hghltd.yandex.com/yandbtm?url=http%3A%2F%2Fwww.rsw.ru%2Fb.php&text=(%CF%C2%D5%3A%3A5)&reqtext=%CF%C2%D5%3A%3A5&dsn=-3&d=1437776&sh=1&sg=-1&isu=1

http://hghltd.yandex.com/yandbtm?url=http%3A%2F%2Fwww.megaopt.com.ua%2Fprice%2Fc552&text=(%CF%C2%D5%3A%3A5)&reqtext=%CF%C2%D5%3A%3A5&dsn=-3&d=1464898&sh=1&sg=-1&isu=1

Самый простой вывод, который приходит на ум: В зоне ссылок слова имеют другой вес, который вы не можете изменить - вес слов для зоны ссылок. При этом, когда вы занижаете вес слов в текстовой составляющей, начинают рулить слова в текстах ссылок, в которых вес слов становится выше, чем вес слов в тексте.

То есть слова, находящиеся в текстах ссылок, обрабатываются по другому!

З.Ы. Насчет отключения ссылочного MiRaj конечно прав :), если бы оно не отключалось, сайты из первого варианта серпа рулили бы и во втором серпе, потому как они естественно больше прокачаны ссылочным. Вот вам и ответ: 1. отключение ссылочного. 2. Другая обработка запроса для слов, которые входят в текст ссылок.

Однако пока остается не понятным, механизм отключения ссылочного... И небольшое противоречие: отключаем ссылочное занижением веса слова и в то же время в текстах ссылок вес слов остается выше, чем вес того же слова в обычном тексте.

john2007
На сайте с 26.03.2007
Offline
173
#5

По идее, занижая вес запроса-однословника мы должны получать выдачу, в ранжировании которой превалируют статические (не зависящие от запроса) факторы. А именно - стат вес (вИЦ), нормирующее значение контента страницы ("тошнота"), нормирующее значение ссылочного (анкорного) для страницы и т.д.

Чего я не очень наблюдаю.

Примечательно, что на стр. 2, 3 - 40% страниц быстророботные. На на стр. 4, 5 - 30% страниц быстророботные. А на 1-ой и начиная с 6-ой по 10-ю (дальше смотреть не стал) быстророботных нет.

Совершая ошибки, мы не только учимся их не повторять, но и учимся прощать такие же ошибки другим... (с)
Nikitoz
На сайте с 11.09.2006
Offline
21
#6
john2007:
По идее, занижая вес запроса-однословника мы должны получать выдачу, в ранжировании которой превалируют статические (не зависящие от запроса) факторы. А именно - стат вес (вИЦ), нормирующее значение контента страницы ("тошнота"), нормирующее значение ссылочного (анкорного) для страницы и т.д.

Чего я не очень наблюдаю.

Ага, тошнота у страниц в первом и во втором серпе не очень разница. Думаю не в ней дело.

john2007
На сайте с 26.03.2007
Offline
173
#7

Еще примечательно, что такая картина только по однословникам (в смысле, что по заниженному весу вылазит внутряк), по двух-, трех-, четырех- словникам позиции сайтов меняются немного, но в топе главные страницы (т.е. ссылочно накаченные).

Nikitoz
На сайте с 11.09.2006
Offline
21
#8
john2007:
Еще примечательно, что такая картина только по однословникам (в смысле, что по заниженному весу вылазит внутряк), по двух-, трех-, четырех- словникам позиции сайтов меняются немного, но в топе главные страницы (т.е. ссылочно накаченные).

Да там не то что внутренние страницы. Там 90% серпа (с выдачей в 50 позиций) - это страницы, у которых слово запроса встречается именно в тексте ссылки на странице и больше нигде.

john2007
На сайте с 26.03.2007
Offline
173
#9
Nikitoz:
Да там не то что внутренние страницы. Там 90% серпа (с выдачей в 50 позиций) - это страницы, у которых слово запроса встречается именно в тексте ссылки на странице и больше нигде.

Не сказал бы так. Смотрю запрос "аудиторские::5", в страницах топ 10 только пару страниц имеют это слово в ссылке, остальные просто в тексте. Вижу, что в моем случае 90% имеют однократное вхождение этого слова в текст.

MiRaj
На сайте с 03.07.2006
Offline
509
#10

UPD: ключевик не везде один, и то что он в тексте ссылки скорее следствие того что вы проверяет конкурентные запросы (т.е. заведомо те запросы, которых на странице будет либо много либо один-два в текстах ссылок).

Кстати, я не совсем был прав.

Задавая очень маленький вес слову вы практически говорите яндексу "игнорируй это слово", потому и получаете выдачу сформированную факторами:

1) минимальной текстовой релевантностью (как правило 1 пассаж)

2) тошнотой

3) стат. весом

4) отсутствием влияния ссылок (сл. из пункта 1.)

123 4

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий