ХренРедькиНеСлаще

ХренРедькиНеСлаще
Рейтинг
57
Регистрация
27.07.2006
Должность
Безработный, если кто даст подработать подкинет, милости прошу к своему шалашу... Девушкам особое почтение! :)
Интересы
Вино и бабы :) Короче, Любовь!
Любитель редьки и огурца
AiK:
Есть. Вот в топике был поднят вопрос, ответ на который не прозвучал.
Есть сайт. Вполне конкретный: http://okna-magnit.ru/. Запрос окна - 2-е место, запрос пластиковые - тоже второе, запрос ПВХ - 1-е. Запрос окна ПВХ - 4-е, запрос пластиковые окна - только 19-е. Бяда, бяда, огорчение. Для оптимизатора. Предлагаю разобрать почему.

А почему именно мне разобрать? А не тому, кому надо и кто за эти функции деньги получает? И какой новый результат в выяснении алгоритма Яндекса это принесет?.

Почему я должен изучать алгоритм Яндекса не на тех страницах, где его черты выявляются наиболее очевидным образом (на наших специально подобранных тестовых), а на тех где одновременно все факторы размазаны и человек безграмотно вбухал все что мог в тысячи каталогов и обмен ссылками? И я должен разбираться какая ссылка с каким текстом стоит на какой странице с каким ВИцем? И все это для тысяч ссылок? Мне что, делать нечего?

По теме топика и выставленным страницам есть вопросы или опровержения?

Если есть желание проверить наши выводы на других страницах, так берите их и делайте. Почему я это должен делать за Вас? Могу только обещать, что если Вы сами такого рода опыты сделаете, то я постараюсь в них разобраться и в случае расхождений прокомментирую РЕЗУЛЬТАТЫ, или признаю наши ошибки, или найду Ваши ошибки, или найду что-то новое для нас обоих,....

Cage, спасибо, Вы действительно указали на мою описку в файле.

На листе 1 в файле Эксель я перепутал обозначения

Надо переставить местами заголовки столбцов с id 73 и id 74

Сути поста это не меняет. Так как пост написан именно для правильного именования столбиков.

Подправил файлик и выкладываю его заново:

zip 2922.zip
Cage:
Рассмотрим данные из Вашего файла для страниц 74 и 352.
Правильно ли я понимаю (далее следуют названия ячеек в Excel), что значение (L61/L49)^2 сравнивается с (идем на Лист1) 33/14.

Вы нам пытаетесь показать, что они равны, но они ведь не равны
2.2 != 2.36

Вы перепутали число 14 с 15, проверьте еще раз.

Кроме того, советую данные ступенек брать там, где они замерены с большей точностью. Те. вместо ячейки L49 возьмите ячейку L7 .

Где вольтметр с ценой деления 1 волт меряет точнее напряжение (в процентах точности) там где напряжение 1-3 вольта или там, где напряжение 200-300 вольт?

AiK, у Вас есть какое-то предложение?

Готов с Вами пообсуждать. Если Вы что-то реальное предлагаете, давайте.

Только чтобы я был уверен, что Вы не в роли погонщика верблюдов выступаете, а как человек, ищущий истину, сделайте хотя бы с десяток измерений по методе Миныча, выложите их здесь, чтобы я мог оценить, правильно ли Вы метод понимаете, а потом мы вместе дальше пойдем.

mexboy:
Все как-то бросились обсуждать контент с предлогами, союзами и междометиями, а вот по этому пункту

Цитата:
Сообщение от ХренРедькиНеСлаще
Яндекс изменил коэффициенты пропорциональности между ссылочным фактором и фактором контента в сторону контента.

можете привести какие-нибудь числовые данные для примера?

Да, все можно привести было бы, но мы мониторили СВОИ тестовые страницы, а их выкладывать на обозрение Яндексу это все равно, что свой годовой труд псу под хвост...

Для подбора тех страниц, что мы выкладываем (а они как видите не наши и взяты из жизни) и так очень много времени требуется, чтобы они хорошо иллюстрировали обсуждаемый эффект и можно было бы разобраться.

AiK:
Ай, как нехорошо с теорией информации-то получилось.
Даже если не анализировать тексты входящих ссылок, то получаем по каждой входящей ссылке:
3 бита на PR (PR < 8)
13 бит на тИЦ (PR <8192)
1 бит признака морда/внутренняя
8 бит на количество исходящих ссылок (<256)
Итого минимум 25 бит на ссылку. А ссылок таких в средней паршивости тематиках будет штучек по 100 на конкурента. Итого, около 3Кбайт на топ10 по одному запросу. К слову - полторы странички машинописного текста.
А если добавить хотя бы 32 байта на текст кажой ссылки?
Да, конечно, если медитировать только над средними или суммарными значениями всех вхдящих ссылок или только морд, то ничего путного не выйдет. Да и инфы поболе, чем 4 бита на конкурента всё равно будет :) К слову, при полном игнорировании внутридокументных параметров...

АИК, при таком раскладе Вы еще забыли Директ добавить, тексты объяв там крутящиеся, статистику запросов.

Вот ведь и ПР добавили, на всякий случай, вдруг ВИЦ яндекс по Гуглю считает? :)

Бессмысленный набор фраз тоже может за информацию сойти.

Мой подсчет основан на числе документов в индексе Яндекса и номерах документов, выдаваемых в топе. Если топ Вам сразу беки выдает и ПР (не вижу беков почемуто в выдаче топа и ПРа также), тогда надо точнее выражаться, примерно так:

Анализ ТОПА плюс

Анализ беков плюс

Анализ ПР плюс

Анализ ТИЦа плюс

Анализ текстов ссылок, плюс

Анализ урлов ссылок, плюс

.............

При таком раскладе я еще могу с Вами согласиться, что информации будет больше чем 400 бит.

wolf:
Да, в том смысле, что там нет смеси контентной составляющей и ссылочной. Я так понимаю, в расчетах будут участвовать первые три документа только со ссылочной составляющей.

Неправильно думаете. Уже выложил в соседней теме эти страницы, причем начал как раз с контента. Интегрированные результаты вместе со ссылочными факторами и контентными будут уже в теме про ссылочное ранжирование.

Кстати, разве Вы не заметили, что опыты, которые я уже здесь на форуме выложил, содержали одновременно и ссылочную и контентную компоненту и вывод, например, о СУММИРОВАНИИ вкладов ссылочного и контента был сделан именно на основе опытов, которые я УЖЕ выложил. И их ЛЮБОЙ человек мог и может сейчас проверить не отходя от кассы?

Nikolai Popkov:
цитата из работы
Алгоритм текстового ранжирования Яндекса на РОМИП-2006 Андрей Гулин, Михаил Маслов, Илья Сегалович (не факт, что используется в реальном веб-поиске)

TF – число вхождений леммы в документ ...
Использование в качестве меры длины документа максимальной
TF среди всех лемм документа ухудшает результат.

Еще бы не ухудшал при поиске по чистенькой коллекции с народа и нормативных документах.

Но при взгляде на заспамленный и загаженный интернет, сразу зреет мысль по мордасам побить тех, кто тысячу раз на странице ключевик напишет. А для этого первоначальный вариант нормировки tf на длину документа миссис Харман очень даже неплохо смотрится, правда Яндекс его видоизменил, введением корня квадратного для тошноты.

FishB1:
ХРНС, а для подсчета "тошноты" берет ли Яндекс только текст? Слова из анкоров ссылок на странице учитываются? Ну и хотелось бы конечно узнать учитываются ли как-то теги H1, strong и прочие. Может для них кокая-нить своя "тошнота" подсчитывается? =)

Текст плюс метаслова (link="). Слова анкоров учитываются. Н1, стронг,... влияния не замечено, но давно не проверялось.

amonasro:
Сообщение от ХренРедькиНеСлаще
Замечено практически для всех конкурентных запросов, какие смотрели, спецпереколдовка однословных запросов, причем не для контента, а для ссылок.


ХРНС, а можно ли немного подробнее о спецпереколдовке запроса для ссылок?
Я например обратил внимание на такую вещь. Если мы задаем поисковый запрос типа

anchor#link="www.site.ru"[поисковый запрос], то колдуется он как

anchor#link="www.site.ru"::111111111[поисковый::222222222 & запрос::33333333]

так вот число 11111111 иногда меняет свой вес для разных сайтов. Раньше такое наблюдалось или нет?

Конечно наблюдалось. Это не что иное как вес (обратная частота числа ссылок на данный ресурс в интернете). Так как подавляющее число таких линков встречается гораздо реже. чем большинство слов, то вес этот очень велик. Но все веса, выше определенного, обрезается Яндексом на некотором большом значении (сейчас это 1819103916, что было раньше смотрите на странице у Миныча "Алгоритм Яндекса"). Но некоторые ссылки типа на Яндекс, Рамблер, авто.ру были более часты и там до обрезания дело не доходило.

Например, линк: link="www.ya.ru" имеет вес 2011627, линк Гугля link="www.google.com" имеет вес 72567, линк на ВЕСЬ Гугль linl="www.google.com*" имеет вес 54531.

Всего: 982