devzev

devzev
Рейтинг
246
Регистрация
13.08.2008
C4ACTbE:
В принципе, до этого многими был использован именно такой подход :)

Сейчас сложнее, ибо стали наказывать за погрешность в чутье.

ZiLo'k:
Найти "идеальную плотность" на "идеальной длине документа".

Плотность есть характеристика напрямую зависящая от длины документа. Это линейно-зависимая переменная.

Базисными тут являются: кол-во вхождений, длина документа и константы (если предположить, что формула схожа с этой http://mexboy.ru/wp-includes/images/tf_romip.gif).

Искать нужно не идеальную плотность и даже не идеальный TF, а идеальное произведение TF*IDF, что на порядок осложняет нашу задачу.

Да лан, чё-нибудь придумаем. :)

ZiLo'k:
Вы говорите о фиксированном IDF и вариации TF в случае упрощения (условного фиксирования) коэффициентов в знаменателе и сохранения соотношения ni и DocLenght? Типа этого[ATTACH]53098[/ATTACH]?

Типо того.

Просто мне лень сейчас рисовать графики и подробно объяснять.

Но если на пальцах: ранее при увеличении плотности увеличивалась релевантность (при фиксированных коэффициентах и IDF). Сначала релевантность хорошо росла, а потом всё меньше и меньше. В итоге, при большом значении увеличение плотности не влияло ни в лучшую ни в худшую сторону.

Теперь при достижении "точки кипения" релевантность начинает падать. И чем больше её значение тем больше падение.

А если учесть, что IDF для разных запросов различен, то это объясняет тот факт, что суперпопулярные тематики не так уж и сильно перетрясло.

devzev добавил 27.01.2010 в 19:15

VSS:
а по деревенски можно сказать че с текстами то делать?

Ну в идеале нужно сделать плотность минимальной. Потом плавно увеличивать и смотреть на результат. Как только сайт стал уходить вниз - снова её уменьшать на одно-два значения. Т.е. нужно попробовать нащупать эту "точку кипения".

Но учитывая, что на позиции влияют ещё и внешние факторы, да и IDF меняется, да и действия конкурентов.... придётся работать вслепую. Чисто на профессиональное чутьё. :)

St.One:
Довольных всегда будет только 10 :) больше не дано

Ну судя по отзывам в топике многие и 30-ми местами довольны )

ZiLo'k:
Если devzev прав (на счет тфидф ), то надо иметь в виду, что к одинаковым (близким по направлению) результатам может привести как воздействие, например, на ni, так и, например, на DocLenght, среди прочих равных.

Могу предположить, что ранее функция TF*IDF (при фиксированном IDF и вариации TF) имела график гиперболического типа. Нынче, стало смахивать на перевёрнутую параболу (y=-x^2).

Грубо, но похоже на это )

Писать подробнее лень. Кому надо, тот поймёт о чём я. :)

Евгений_В:
К словам не придираюсь :) Просто не факт что все поняли. Из моей лички: "Вы просто убирали ключевые слова или переписывали те предложения в которых Вы их убирали"

Что же это за текст такой где можно тупо выкинуть все ключевики без потери смысловой нагрузки? 😂

devzev добавил 27.01.2010 в 15:50

medea:
Типа, анкор-лист...

100 раз уже говорили, что это тут вообще не при чём.

mhz:

А если это не явный минус к релевантности, а какой-нибудь новый параметр документа типа seoText?

Склоняюсь больше к тому, что рыть нужно вот эту сторону. Тут тоже тяжело пока сказать точно.

Но то, что это не константа - очевидно.

medea:
да без разница, константа или переменная. главное, чтобы обновлялась в каждый апдейт, а не раз в месяц, к примеру :)

По ходу, "оно" обновляется при каждой новой индексации. Пока точно сказать тяжело конечно (мало апов прошло), но все предпосылки к этому есть. Думаю, ещё 5-6 апов и всё ясно. :)

Drazah:
слежу, изменения незначительные на протяжении всех трех апов (последний считаю корректировкой)

А кто там попал 20-го под "фильтр" не в курсе?

devzev добавил 27.01.2010 в 15:41

nikola32:
ну и откуда же данные, пропалите темку, раз уж начали... :)

Данные из анализа на основе выпавших сайтов. Это не константа.

nikola32:
Эта бяка дает минус к реливантности(вероятно константный) конкретной странички в общую формулу.

Уже есть более точные данные: минус - не есть константа ;)

Всего: 2682