eolin

Рейтинг
10
Регистрация
31.01.2007

Прогнан сайт, все нормально. Очень быстро - меньше суток и заказ выполнен. Топикстартер молодец. На почту свалилось более 1000 писем.

Пользуюсь услугами топикстартера во второй раз (первый - покупал базу и смайл). Сейчас купил оллсаб - приятно работать. Оперативно и удобно. Спасибо.

Купил у Samplik лицензию Smile SEO Tools. Все честно и оперативно. Цена более чем приемлемая. Спасибо.

Может кому интересно, появился небольшой апдейт:

Исходные данные снимались по состоянию на конец марта. Ряд ранжирования см. выше.

Затем проверял данные в марте, ранжирование страниц следующим образом:

5

10

25

15

20

30

35

1

То есть, с апреля по май Яндекс поменял текстовую релевантность (формулу). Подкрутили коэффициенты или что-то еще учитывают.

Далее по ходу было сделано изменение такого плана - была выставлена ссылка со странички 3го уровня вложенности, PR0/тИЦ 40, с одним словом - по которому идет исследование. Результат снимался на днях:

1

5

10

20

25

15

35

30

То есть результат вполне предсказуемый - одна ссылка перебила любые частоты употребления термина в тексте (ссылочное рулит, да). Примечательно другое - порядок опять поменялся. f=20 поднялась вверх на 2 позиции, f=30 - опустилась.

Страничка со ссылкой тоже отранжировалась - она последняя в выдаче.

Теперь немного информации по Google:

35

30

25

20

15

10

5

(с одной ссылкой)

Все абсолютно очевидно - чем больше термина, тем лучше. С единичным употреблением не со ссылкой вообще отсекается (видимо, фильтр на слишком низкую частоту/одиночную встречаемость). А вот страница со ссылкой отранжировалась. Да, PR=0 для нее, но PR PR-у рознь, возможно это повлияло. Возможно - просто фильтр работает на обычный текст, и обходит анкоры. Есть у кого достоверная информация на сей счет?

Вывод 1: "тошнота" есть только в Яндексе, для Google это неверно.

Вывод 2: Яндекс постоянно подкручивает текстовую релевантность - на анализаторах "тошноты" можно поставить крест. Общая тенденция - 5-10 употреблений термина сейчас золотая середина. Свыше - хуже ранжирование, очень редко (1-2 видимо) - тоже плохо.

Было высказано предположение, что мол Яндекс борется с "зюзиками" - как-то это незаметно. Замечательно находятся даже уникальные "зюзики", которые в одном экземпляре встречаются, не говоря уж о довольно-таки высокочастотных "сейшелах".

PS С весны Яндекс видимо перекрутил ранжирование по контенту. Хотя кого это волнует :)

Вот большой словарик - http://www.trishin.ru/slovar.html. Оболочка написана на фоксе, а сами базы (что удобно) - открытый dbf.

Можно я добавлю? По моим наблюдениям (/ru/forum/131447),

Миныч и ХРНС, мягко говоря, ошибаются с формулой "тошноты".

PS Страх "запалить темы" перед конкурентами очень силен, практических исследований, выложенных в открытую - раз-два и обчелся, но оно и понятно - на этом люди деньги делают.

alut:
1)

Тогда в 1-й цитате % ?
2)Если уж проверяли "классическую" ( :) ) тошноту, надо было взять ряд (число вхождений) типа этого - 1,3,5,7,10,15,20,30

Не совсем точно выразился, количество вхождений слова в 1м случае. Не проценты, да. Размеры тоже в словах указаны.

Насчет классической "тошноты" - цели специально ее проверить не было. Но любые данные должны укладываться, если гипотеза верная. Если не укладывается - неверная.

Классическая математика - достаточно одного контрпримера, чтобы показать ложность гипотезы.

Да, там есть одна интересная и потенциально полезная деталь - что для низких количеств вхождений используется максимум из (7, кол-во вхождений). Насчет "волшебных" чисел тут много тоже говорили, почему 7, а не например 8 или 9. Но у Яндекса вообще много такого добра - одна степень 0.38 в голосовании по кворуму чего стоит. Или максимальный вес слова при переколдовке (см. здесь ранее).

Сейчас буду потихоньку уточнять табличку, сделаю еще с 3,6,7,8 вхождениями. Чтобы по максимуму в функции штрафа проверить.

Частота в документе (в моем случае) - отношение количества вхождений слова к общему количеству слов. Еще называют TF. Чтение - TF-IDF.

fuster:
Раз уж этот пост в разделе для новичков:

Как это считается и что даёт?

Общее количество вхождения термина по всем документам.

fuster:
Дайте плз. ссылочку на эту функцию.

Ссылочки нет, т.к. это мое предположение (гипотеза по функции ранжирования).

123 4
Всего: 33