kvkvkvkv

Рейтинг
29
Регистрация
17.07.2007
Deco90:


... всего 70 закладок. Для прогона необходимо составить проект.

Проект составляете в виде:

1) URL
2) Названия(примерно 50 символов)
3) Описание(около 200 символов)
4) Ключевые слова(через запятую, около 3-4 ключевых слов)

Для наибольшего эффект составляйте описания и названия в формате {вариант 1|вариант 2|вариант 3}, чем больше вариантов, тем лучше для вас.

Заказ выполняю в течении 6 часов(если в сети, то в течении 15-20 минут).

Извиняюсь, может не внимательно прочитал топ.

А URL указывать один только, или можно в виде: внутренняя страница1-тайтл1-описание1-ключи1;

внутренняя страница2-тайтл2-описание2-ключи2 и т.д.?

baltic13:

TF я не нормирую по длине, она такая по определению (по крайней мере я так считал, когда писал. сйечас пока еще так же считаю).



Нормировка по длине (предположительно) является лишь некой суммарной составляющей той самой некой константы
wolf:
Какие слова? Какого ключа? Корректно выражаться религия не позволяет, что ли? Да, и вообще выражение "слова в леммах" ускользает за пределы моего понимания...

Слова, которые не являются ключевыми в запросе и попали в релевантный пассаж на этапе вычисления веса пассажа

wolf:
Вы уж, будьте любезны, хоть как-то расшифровывайте свои сентенции. Что, к примеру, есть "низкий вес ключа в анкор-файле"?

енто когда слова в леммах будут встречаться по анкор-базе на порядок реже относительно ключа

Если мы говорим о четких цифрах, давайте в дальнейшем четко указывать TF, TFа, IDF, IDFа

wolf:
Предположить можно, конечно, всё, что угодно... Только надо как-то всё-таки гипотезы проверять...
Кстати, в анкорном ранжировании есть некоторые факторы, влияющие на ранжирование, которых нет в текстовом. Это может вносить искажения во всякие эксперименты, если о них не знать и не учитывать их влияние. Так что, калькировать модель текстового ранжирование на анкорное - не совсем корректно.

Я понимаю, я хочу сконцентрировать внимание именно на анкор-колекции, и возможной "игры весами" без участия самого запроса в анкоре. Помните "зюзики"? Так и здесь выработать уникальное тематичное словосочетание (ключевик в окружении), скормить поиску по смыслу, и придать ссылкам вид "без ключевика". Возможно ли математически подтвердить, или опровергнуть данную гипотезу, понятно, что на практике без учета знания совокупности статических и динамических анкор-факторов проведение эксперимента нереально.

wolf:
А какие там могут быть факторы влияния? Там берется количество упоминаний термина в корпусе анкор-файлов и по некоей формуле вычисляется его IDFa. Так что, если наставите много ссылок с упоминанием термина в анкорах - можете понизить его IDFa. Вот и всё влияние. А саму формулу - сорри, не скажу... Пусть это будет моим маленьким секретом... :)

Извиняюсь, SEO- не моя специализация, а математика подавно, поэтому не ругайтесь громко.

1.Предположим, что норматвность TFa, как и TF есть максимально допустимая константа. Тогда вес документа по отношению термину обратнопропорционален весу самого термина.

2.Поиск «по смыслу»

"Способность находить и ранжировать документы, не содержащие слов из запроса, часто считают признаком искусственного интеллекта или поиска по смыслу и относят априори к преимуществам модели. Вопроса, о том, так ли это или нет мы оставим за рамками данной статьи.

Для примера опишу лишь одну, пожалуй, самую популярную модель, работающую по смыслу. В теории информационного поиска данную модель принято называть латентно-семантическим индексированием (иными словами, выявлением скрытых смыслов). Эта алгебраическая модель основана на сингулярном разложении прямоугольной матрицы, ассоциирующей слова с документами. Элементом матрицы является частотная характеристика, отражающая степень связи слова и документа, например, TF*IDF. Вместо исходной миллионно-размерной матрицы авторы метода [furnas], [deerwester] предложили использовать 50-150 «скрытых смыслов» [3] , соответствующих первым главным компонентам ее сингулярного разложения.

Сингулярным разложением действительной матрицы A размеров m*n называется всякое ее разложение вида A = USV, где U - ортогональная матрица размеров m*m, V - ортогональная матрица размеров n*n, S - диагональная матрица размеров m*n, элементы которой sij= 0, если i не равно j, и sii = si >= 0. Величины si называются сингулярными числами матрицы и равны арифметическим значениям квадратных корней из соответствующих собственных значений матрицы AAT. В англоязычной литературе сингулярное разложение принято называть SVD-разложением." (И.Сигалович)

Так вот, если я оптимизирую внутренние статические факторы под запрос сл.1+Кл.cл.+сл.2+сл.3 (данный запрос ориентирован на будущие леммы) , затем

авторассыльщиком на доски вывожу объявления в данном сочетании (загвоздка здесь: ссылочный вес не передается, а сама коллекция анкор-файлов пополняется данным сочетанием?)

если "ДА", то получается при разбавлении своей ссылочной массы анкором вида сл.1+сл.2+сл.3

будет достигаться наибольшая контрастность (слова 1,2,3 имеют минимальный вес, а сам запрос лишь подразумевается).

wolf:
А какие там могут быть факторы влияния? Там берется количество упоминаний термина в корпусе анкор-файлов и по некоей формуле вычисляется его IDFa. Так что, если наставите много ссылок с упоминанием термина в анкорах - можете понизить его IDFa. Вот и всё влияние. А саму формулу - сорри, не скажу... Пусть это будет моим маленьким секретом... :)

ОК. Сйчас багаж знаний пополню, переформулирую вопрос касательно анкор-редкости.

wolf:
А с чего Вы решили, что именно эта нормировка используется при анкорном ранжировании в Яндексе? Тут, кстати, модно больше за "тошноту" говорить по аналогии с текстовым ранжированием (а "тошнотой" с легкой руки Миныча здесь принято называть как раз таки максимум TF по всем терминам) :)

Если есть возможность, поделитесь материалами о влиянии различных факторов на IDFa и непосредственно по ее образовании (коллекции) в поисковой системе.

baltic13:
_S_,
TFнорм=tfi/(tfi+k1+k2*N)
где tfi - tf i-ого термина; k1,k2 - коэффициенты, N - длина или количество лемм в анкор файле
Если воспользоваться тем, что (k1+k2*N) >> tfi, то получим

TFнорм=x-x*x
где x=tfi/(k1+k2*N).

не понятно, можете ссылочкой поделиться на исходник

1 234 5
Всего: 48