wolf

wolf
Рейтинг
1183
Регистрация
13.03.2001
Должность
интернет-маркетинг, SEO
kvkvkvkv:
Если есть возможность, поделитесь материалами о влиянии различных факторов на IDFa и непосредственно по ее образовании (коллекции) в поисковой системе.

А какие там могут быть факторы влияния? Там берется количество упоминаний термина в корпусе анкор-файлов и по некоей формуле вычисляется его IDFa. Так что, если наставите много ссылок с упоминанием термина в анкорах - можете понизить его IDFa. Вот и всё влияние. А саму формулу - сорри, не скажу... Пусть это будет моим маленьким секретом... :)

Gotovsky:
Допустим я тоже знаю много подобных сайтов, но из тех, что я знаю, подавляющее большинство - старые сайты, собиравшие устойчивую аудиторию годами, хорошо известные в определенных кругах. А теперь, допустим, я создам новый сайт, найму команду авторов для создания качественного контента и добавлю сайт в топ.мэйл, рамблер и ливинтернет. Сомневаюсь, что на него придет много народу и сайт займет хорошие позиции без СЕО.

Чтобы стать женой генерала, надо выйти замуж за лейтенанта ;)

baltic13:
Такая нормировка объясняет "разжижение" и "перенасыщение" анкор файла.

TFнорм=tfi/(tfi+k1+k2*N)
где tfi - tf i-ого термина; k1,k2 - коэффициенты, N - длина или количество лемм в анкор файле
Если воспользоваться тем, что (k1+k2*N) >> tfi, то получим

TFнорм=x-x*x
где x=tfi/(k1+k2*N). График зависимости TFнорм от N :
http://content.foto.mail.ru/mail/andava/SEO/i-5.jpg

А с чего Вы решили, что именно эта нормировка используется при анкорном ранжировании в Яндексе? Тут, кстати, модно больше за "тошноту" говорить по аналогии с текстовым ранжированием (а "тошнотой" с легкой руки Миныча здесь принято называть как раз таки максимум TF по всем терминам) :)

baltic13:
TF (term frequency — частота слова) — отношение числа вхождения некоторого слова к общему количеству слов документа. Таким образом оценивается важность слова ti в пределах отдельного документа.

Неверно. Это всего лишь одна из возможных нормировок TF. А само TF - не что иное, как количество упоминаний термина в тексте. Но как правило, в алгоритмах ранжирования используется не сама эта величина, а ее нормированное значение. Так вот, повторюсь, одной их простейших нормировок является нормировка по длине текста в словах. Но в поисковых алгоритмах используются, как правило, гораздо более сложные нормировки. Например, BM25. В Яндексе в нормировке TF для текстовой релевантности вообще не используется понятия длины документа, там нормирование происходит по другому параметру - максимальной TF. И Ваше "отношение числа вхождения некоторого слова к общему количеству слов документа" в этом случае вообще теряет смысл. Какая же нормировка используется Яндексом при ранжировании по анкор-файлу - это есть вопрос для оптимизаторского сообщества пока открытый ;)

cymax:
1. Вес второго термина !%мебель не влияет на результат. Более того, отвечая на вопрос wolf об увеличении кол-ва терминов, могу сказать, что второй термин из-за оператора % не увеличивает QL (число слов запроса в кворуме) - мы по-прежнему работаем с QL=2.

Ок, спасибо. Значит, похоже, дело в мягкости.

Mauser:
Наверное UPS все же Что бы не рекомендовать как получатель USPS тебе надо в штатах жить

Неужели USPS (The United States Postal Service) не отправляет за пределы США? ;) Тогда почему здесь: http://ircalc.usps.gov/ - в "International Postage Rates" указана куча стран? И даже Russia...

baltic13:
я же написал TF=0.05, а проценты к слову.

Тогда давайте определимся, что лично Вы подразумеваете под TF? Количество вхождений искомого термина, деленное на общее количество терминов в тексте?

cymax:
Проверил мою беглую гипотезу. Очень похоже, что она верна - "особые" термины колдуются с оператором %, как в старые добрые времена

недвижимость::вес &/(0 0) !%недвижимость::вес_особый

При эмуляция такой переколдовки на обычном термине без указания весов

мебель &/(0 0) !%мебель

получаем вес 149 - точно как было в варианте "мебель" с НПС.

Ну, да, в этом случае получается, что один термин после переколдовки трансформируется в два (хоть они и одинаковые, но каждый учитывается отдельно). Поэтому методика восстановления веса по формуле прохождения кворума врёт - она не учитывает появление нового термина ;)

P.S. Кстати, в варианте с НПС Вы, похоже, тоже не учитываете дублирования термина. Поэтому на нем методика тоже врёт ;)

P.P.S. Не факт, что переколдовка Вами восстановлена верно. Можно однозначно говорить лишь о том, что после переколдовки вместо одного термина появляются два, а какие именно операторы при этом используются - сие есть тайна, покрытая мраком... :)

_S_:
Насколько я помню, там где-то был еще и ::вес::0 был

Был ::вес:0. Так нейтрализуются неранжирующие термины

IrokezV:
Сергей, то есть по твоим словам можно сделать вывод, что я НЕ специалист?

Ты имеешь в виду - не "SEO-специалист"? ;)

Всего: 24501