Вот еще для примера
Здесь 70 страничек сравнивались с какой то одной из них
Фактически размер страницы был взят пропорционально номеру (ось х). Точнее 50*N+2 слов.
Вот и скачки из-за того, что ранг абсолютно одинаков и ранжирование учитывает имя файла по алфавиту.
По оси y - вес, при котором выдаваемые страницы меняются местами.
Прошу извинить, надолго вынужден покинуть форум.
Анжелика, извините, не успеваю отвечать. Все-таки я тугодум и не спринтер :)
Пояснения к ступенькам:
Типовой эксперимент состоит в том, что сравниваются две страницы в запросах типа:
(Слово1|Слово2|Слово3|Слово4........)
и фиксируется порядок выдачи Яндексом страниц
Как правило, при изменении веса (т.е выборе другого СловаN с другим весом с той же страницы) выдача не меняется, но прослеживается граница, всегда при изменении веса на 1, когда происходит смена позиций в выдаче. Значения весов всех слов при которых это происходит, отслеживаются и заносятся в табличку.
Эксперименты проходили с разными страницами, с разным размером, с разным средним весом, с ссылками и без них....
Везде возникают эти "ступеньки", только разной высоты и кое-каким сдвигом. Рэндома - нет! Повторяемость 100% (между апдейтами так называемыми).
Мне естественней "складывать", для складывания оказалось удобнее использовать величину, в (простейшем варианте) для словопозиции:
sqrt(log(вес_слова)/размер_документа_в_словах)
Надо еще учесть, что Яндекс для самых коротких документов считает размер документа некоторой константой.
А дальше следуют комбинации умножения на некоторые коэффициенты и сложения....
To Wolf
Так вот именно : в измерениях эти коэффициенты и измеряются :)
И без измерений никак. И задача эта не тривиальная. Если Вы считаете, что тут нечего изобретать, то можно ведь Вам предложить "измерить" две странички, а потом спросить: можете предсказать выдачу по другим запросам к этим же страницам (остальные страницы в расчет брать не будем)?
To pro-maker
Пока все дозированно. Бесплатного скрипта не будет :( Вроде в файликах я скрипты либо убрал, либо подпортил. Пока думаю, стоит ли вообще паруса ставить? Но вообще, ищу спонсора для изучения и измерения Гугля.
По контенту результаты выложу, когда причешу их для публикации. На это ведь время требуется, которого всегда нет. По ссылкам - хочется получить некую компенсацию за труды свои :)
Для тех, кто не в курсе о каких ступеньках речь:
http://www.minich.ru/business/seo/
Смотрите внизу страницы
Можете и здесь покопаться:
http://www.minich.ru/business/seo/yandex-investigation-17.xls
http://www.minich.ru/business/seo/realty-rating.xls
http://www.minich.ru/business/seo/kvorum1.xls
Знаете, для меня один из великих людей - Птолемей, который дал инструмент абсолютно неправильный, как мы сейчас знаем, но удивительным образом предсказывавший затмения Солнца, Луны, движения планет на небе. И этот инструмент работал десятки веков.
Можно сказать, что я сознательно абстрагируюсь от того, что внутри (итерационные алгоритмы?, точные вычисления? рэндом?) черного ящика. Как бы заменяю его понятной мне моделью. Сделал раз опыт, предположил, проверил.
Вот как было когда обнаружил ступеньки в выдаче.
Повторил для тех же страниц запросы в разной комбинации в числе 5000 раз и ни одного(!) непредвиденного результата!
Потом предположил, что каждая ступенька -это скачок веса в определенное число раз. На первых страницах - ни одного неожиданного результата(!). Но на новых старницах - неувязочка!!! Величина скачка слабо но меняется от ступеньки к ступеньке. Предположил, что скачок пропорционален квадрату номера ступеньки и все совпало с точностью до 9 знака....
Проверял зависимость от размера документа. Никак не мог понять откуда там был скачок, все должно было плавно меняться с логарифмом веса и номером ступеньки, но при некотором значении, коэффициент пропорциональности скачком менялся.
Потом допек. Точность такая, что при некоторых сравнениях Яндекс получает равный(!) ранжирующий фактор (целое число), что тогда он выводит первым? В моем случае страницы в алфавитном порядке по именам файлов.Так вот, так как в этой серии одна страница сравнивалась с серией страниц с разным размером, то оказалось, что до некоторого значения сравниваемые страницы стояли ДО измерительной линейки, а потом ПОСЛЕ.
Пояснение:
имена файлов: 0001.htm, 0002.htm, ,,,,,,,01000.htm
имя файла измерительной линейки: 0400.htm
До 400 файла один коэффициент, после 400 другой :)
1. Я не знаю, что такое ВИЦ, так как многие понимают ее как нечто "среднее по больнице". А на практике надо ответить на вопрос: в каком порядке будут выданы конкретные страницы, в чем "среднее по больнице" мало может помочь для точного ответа.
2. Этот фактор я не оцениваю, а измеряю. А вот уже в оценки (вычисления) уже могут вноситься ошибки разного рода.
3. Я как раз и хочу подчеркнуть, что точные утверждения я могу дать только для той (тех) страниц, над которыми поэкспериментировал. Для других страниц - надо сформулировать вопрос, на который необходимо ответить. На часть этих вопросов можно дать очень точный ответ, на часть этих вопросов - нельзя без дополнительных измерений.
4. Текст ссылки на странице не влияет на Яндекс_ПР и предсказать как изменится влияние ссылки при изменении текста ссылки вполне возможно. Есть одно "НО": текст ссылки должен быть уникальным. Если он не уникален, то не всегда можно отделить влияние экспериментально и придется это делать в некоторой степени путем не измерений на самом объекте, а измерений на других ссылках с этой же страницы, либо исходя из теории (которая не может полностью соответствовать действительности) :)
5. В любом случае возможна проверка правильности измерений, так как ссылок на странице обычно много и их влияние можно сравнить.
Определения спросить не у кого :) Придется дать свое.
Яндекс_ПР - это для меня те параметры, которые необходимы для вычисления релевантности страницы любому запросу.
Как это не смешно, но, например, и длина документа в словах. И константа, к которой "плюсуются" расчеты по словопозициям по конкретному запросу, и коэффициенты пропорциональности для вкладов ссылок внутренних и ссылок внешних.
"Плюсуются" взял в кавычки, потому что есть бесконечное множество эквивалентных отображений ранжирующего фактора.
Например, можно ранжировать по величине N, а можно и по N*N или по logN, результаты выдачи будут одними и теми же (при N>1).
И еще, надо отличать разговор об измерениях, от разговоров о вычислениях, и тем более от разговоров об алгоритме. Измерения всегда правильны и безошибочны, вычисления - это аппроксимация результатов измерений на те запросы, по которым эксперименты не проводились, но с высокой вероятностью можно предположить, что результат будет предсказуем.
А алгоритм - о нем можно только строить гипотезы и проверять их на практике. Если итожить мой опыт, то некоторые частности алгоритма ясны, по другим даже намека нет на понимание.
Если это вопрос ко мне, то могу сказать только про себя - я научился измерять "важность" ссылок с любой проиндексированной страницы с пугающей оптимизаторов точностью.
Под "важностью" понимаю ее влияние на Яндекс_ПР, и ее влияние на ранжирующий фактор ("вес") для определенного запроса.
Для измерения влияния на Яндекс_ПР требуется возможность изменять ссылки на странице и необходимо дожидаться "апдейта" Яндекса (пересчета Яндекс_ПР).
Найдите эти слова здесь:
И прочтите, что там написано.
Любую фразу длиннее 63 слов Яндекс режет на предложения.
Если Вы не это имели в виду, уточните вопрос, надеюсь, поможем :)
С уважением, Миныч.
Yet Another SEO
Ссылки условно можно разделить на две категории:
1. Ссылки для увеличения аналога ПР Гугля для Яндекса, которые Яндекс просчитывает для каждой страницы в индексе. Просчеты эти оптимизаторы не совсем удачно окрестили "апдейтами", к апдейтам как таковым пересчет Яндекс_ПР отношения не имеет. Более удачно было бы считать апдейтом изменение ключевых параметров алгоритма Яндекса или самого алгоритма. Тексты в ссылках при таких "апдейтах" (пересчет Яндекс_ПР) значения не имеют.
2. Ссылки, размещаемые для текста. В тексте ссылок Яндекс "находит" релевантные запросы и учитывает при расчетах веса страниц для конкретного запроса. С каких страниц идет "текстовая ссылка" (по предварительным наблюдениям) особого значения не имеет. С "морды" ли или c простенькой странички простенького сайта.
Повышение Яндекс_ПР влияет на вес любого запроса. Т.е. найденные в "текстовых" ссылках запросы учитываются с большим весом, если Яндекс_ПР больше. Поэтому оптимизаторы стремятся размещать ссылки на "важных" страницах, которые могут "передать" больше "веса" тем страницам, на которые ведут ссылки. До недавнего времени определение "важности" страницы было вопросом опыта и результатов метода "тыка". Ориентиром служил также ПР Гугля, исходя из предположения, что по порядку величины эти ПР для Гугля и Яндекса сопоставимы. Правда и ПР Гугля по тулбару - величина, прямо сказать, измеренная "километровым" сантиметром.
Так как "попадание в точку" (распределение ссылок в зависимости от их назначения, в том числе и линковка самого сайта) на данный момент вопрос удачи, то иногда появляется шанс и у простых сайтов с не очень большим количеством ссылок и отсутствием морд пробиться "в люди".
А так как сайтов много, то по закону больших чисел обязательно встретятся примеры, которые кажутся парадоксальными для профессиональных оптимизаторов.
Однако, вероятность таких удач для запросов, которые Вас интересуют - минимальна. Особенно, если посмотреть насколько загажена территория интернет такого рода текстами под Ваши запросы.
Прикиньте: у сотни сайтов по сотне ссылок (ссылки с одного сайта считаем за одну), итого 10000 сайтов. И всю эту гадость Яндексу приходится кушать :)
Издержки производства.
Проще всего такие вещи решить измерением:
http://www.seochase.com/viewtopic.php?t=4173
А так - ну кто-то ответит Вам +-километр, Чужой сайт не жалко. Вы ведь все равно сомневаться будете...