Я.Бар - обновление ИЦ?

1 23
ER
На сайте с 19.11.2002
Offline
107
#21
На тот момент два и было

Круто же ситуация поменялась за несколько дней :)

Чуть позже предоставили цифры еще по двум

Кто предоставил? Куда можно обратиться, если что? :)

Мне так кажется, что у Wolf`a гараздо больше материалов для анализа

Да, немало ;) Это понимать как то, что он вас убедил?

N
На сайте с 21.11.2001
Offline
152
#22

Не совсем понимаю Вашего сарказма. Если я свои изыски шутя называю "игрой в аналитика", поскольку мне еще многому учиться, и знания мои не соответствуют "Кандидату наук", то Вам я недавал права со мной общаться в таком тоне. И несобираюсь обсуждать с Вами свои методы "работы" (в кавычках понятно почему). А обращаться куда - решайте сами.

Нет, wolf меня не убедил.

ER
На сайте с 19.11.2002
Offline
107
#23

Да ладно вам, какой такой тон? Я там смайлов усердно расставил. Или вы вообще шуток в свой адрес не переносите?

Смысл фразы про "предоставили" мне не понятен, чем злиться вы бы написали что это значит.

wolf
На сайте с 13.03.2001
Offline
1183
#24

Да что вы сцепились! Я просто хочу сказать, что в одних случаях коэффициент корреляции между ВИЦ и тИЦ положительный, в других - отрицательный. Вот такой пример. Допустим вы приобрели десяток ссылок с внутренних богом забытых страниц разных сайтов вашей тематики, каждая из которых имеет мизерный ВИЦ и потеряли одну ссылку с морды сайта совершенно другой тематики, но имеющей огромный ВИЦ. В результате тИЦ явно увеличится, а ВИЦ явно уменьшится.

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
N
На сайте с 21.11.2001
Offline
152
#25
Или вы вообще шуток в свой адрес не переносите?

Ок, проехали, слишком длинный день.

В результате тИЦ явно увеличится, а ВИЦ явно уменьшится.

Ну а если присутствует тематический коэффициент? Он это должен сгладить?

NL
На сайте с 29.01.2003
Offline
212
#26
Я просто хочу сказать, что в одних случаях коэффициент корреляции между ВИЦ и тИЦ положительный, в других - отрицательный.

Лично мне трудно представить отрицательную корреляцию между ВИЦ и тИЦ. Такая (отрицательная) корреляция (чем больше А, тем меньше В) когда-нибудь может привести и к отрицательным значениям тИЦ. А таких значений пока никто не наблюдал (идея обнуления отрицательного тИЦ, как мне кажется, не в стиле Яндекса).

В этом форуме очень часто обсуждался предполагаемый алгоритм расчета тИЦ. Хочу предложить еще одну версию расчета тИЦ. Просьба серьезно не относиться и ногами не пинать. Исходные предположения:

- ВИЦ это PageRank

- для определения тематической близости 2х ресурсов используется

механизм, похожий на тот, который используется при нахождении страниц, «похожих на данную».

Этот механизм тоже уже обсуждался, вот цитата из обсуждения: «Существует два подхода определения близости двух документов - на основе статистической модели (мера косинуса - LSA/LSI/PLSA и т.д.) и технологии, основанные на знаниях». Запомним упоминание об этих 2х подходах. В этом же топике Вячеслав Тихонов дает ссылку на шикарный обзор этих самых статистических моделей. В этом обзоре утверждается, что для 2х документов, относящихся к разным кластерам в пространстве терминов можно построить матрицу Близость документов (similarity). Мне кажется, что пока, с целью упрощения изложения, можно утверждать, что из матрицы Близость документов (similarity) всегда можно получить скаляр (назовем его пока Simple Similarity), имеющий тот же «физический смысл» - близость документов в пространстве терминов или тематическое расстояние между документами.

- опять же таки можно пока предположить, что SimpleSimilarity ввиду высоких издержек на его расчет считается не для отдельных документов, а для сайтов в целом.

- ну и последнее предположение (чес. слово!) – для упрощения пока можно считать, что в качестве ВИЦ сайта можно брать ВИЦ его главной страницы.

Ну и теперь сама гипотеза. По аналогии с расчетом PR можно предложить следующий костяк формулы расчета тИЦ:

тИЦ (нашего сайта) = ВИЦ(S1)/SS(S1) + … + ВИЦ(Sn)/SS(Sn)

где:

S1…Sn – сайты, ссылающиеся на наш,

ВИЦ(Si) – собственно ВИЦ сайта (с допущением)

SSi – тематическое расстояние (SimpleSimilarity) между нашим сайтом и Si

Если попытаться попинать эту формулу, то вот что на первый взгляд можно заметить:

– с одной стороны она ужасно боится зеркал – расстояние между зеркалами равняется нулю, но с другой стороны к моменту расчета ВИЦ зеркала уже вроде бы слиты

- она объясняет случаи дикого разнобоя между ВИЦ и тИЦ

- эта формула\механизм\подход абсолютно не объясняет космический тИЦ самого Яндекса (19000) и тех, кто в первой семерке.

Я согласен, что сама попытка использовать Близость документов (similarity) из статистических моделей для расчета тИЦ очень спорна:

- в пространстве терминов может не учитываться что-нибудь очень узкоспециализированное и тогда сайт, злоупотребляющий такими профессиональными жаргонизмами может оказаться в полном пролете – его нельзя будет идентифицировать в таком пространстве, а значит и померить расстояния от него до ссылающихся на него сайтов.

- другая крайность состоит в идентификации сайтов, на которых практически нет терминов (не в том смысле, что там одни междометия и предлоги, а из-за чрезмерного обилия общеупотребимой лексики – «сайты ни о чем»)

Из преимуществ использования автоматизированных статистических моделей для расчета тИЦ можно выделить только одно (и то не понятно для кого) – относительно простой способ отлова спамеров – такие сайты наверное ну уж очень четко будут идентифицироваться в пространстве терминов.

Еще гипотеза о том, что для расчета тИЦ используется статистическая модель с пространством\базой терминов объясняет недавние свистопляски тИЦ`а – как и всякую базу, базу терминов нужно пополнять\обновлять, а при увеличении\изменении замкнутого пространство терминов, какая бы там метрика ни использовалась, скорее всего поползут и тематические расстояния между сайтами. Можно вспомнить о Яндекс.Каталоге и спросить – а какова его роль в определении тИЦ`а? А кто его знает! Тут как с яйцом и курицей, что первично - не всегда определишь. Может Каталог использовался для юстировки этой модели, а может наоборот – размер кластеров из модели говорил о том, что было бы не плохо перетасовать подрубрики каталога.

Если в Яндексе действительно научились автоматом формировать пространство\базу\зоопарк терминов с последующим ее использованием, то это наверное и есть тот следующий прорыв в СЕ после PR, о котором тут часто говорили «большевики».

ER
На сайте с 19.11.2002
Offline
107
#27

Вау! Ничего не понял, но похоже это круто :) А может не стоит делать сложным простое?

Ну а если присутствует тематический коэффициент? Он это должен сгладить?

Всё таки ВИЦ и тИЦ это разные величины, и я не представляю как к ВИЦ/PR можно прикрутить тематический коэффициент.

Smile
На сайте с 23.08.2002
Offline
206
#28

to null:

На сколько я понял, если оно и верно, то что ты предположил, то этот тИЦ имхо это то, о чем обычно говорят как о тВИЦ'е

С уважением, Вячеслав Гайсин aka Smile. http://websitesales.ru (http://websitesales.su)
1 23

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий