Автоматизированный анализ корреляции между позицией и фактором

12
Shlackbaum
На сайте с 18.08.2010
Offline
322
928

Есть - 100 запросов со конкретными позициями в ПС.

Есть - MS Excel 2003 (другой софт тоже можно:))

Есть - Фактор, являющийся, по предположению, "главным определяющим позиции" в конкретном случае этих 100 запросов для конкретного сайта. (чисто как пример - PR страницы или средняя цена клика в директе)


Как проверить правдивость гипотезы используя имеющиеся данные для общего массива запросов?

Например, в конце таблицы:

"ИТОГО: Общая корреляция позиций массива запросов с фактором равна 62%"

P.S. Прошу комментарии типа "Да там совокупность факторов, а не один - научись продвигать, школоло!", "Че ты там будешь смотреть-то?" и "Ну ты ваще обнаглел!" оставить за пределами этой темы.

P.P.S. Правильный ответ, на мой взгляд, найден - корреляционно-регрессионный анализ. Ушел изучать.

Пустота. Какого черта здесь появляется чья-то реклама?
BlueRay
На сайте с 09.03.2011
Offline
38
#1

Поясните: у вас есть 100 запросов для одного и того же сайта, или у вас есть 100 сайтов для экспериментов и набор запросов, по вашему мнению, имеющих одинаковую конкурентную составляющую?

p.s. текст постскриптума могли сделать ещё мельче?

Пишу десктопные и web приложения на C# (ASP.NET MVC) :-) Хотите сказать спасибо или обозвать дураком? Для этого есть репутация, не надо флудить.
Shlackbaum
На сайте с 18.08.2010
Offline
322
#2
BlueRay:
Поясните: у вас есть 100 запросов для одного и того же сайта, или у вас есть 100 сайтов для экспериментов и набор запросов, по вашему мнению, имеющих одинаковую конкурентную составляющую?

Для одного и того же сайта.

Я бы не назвал это "конкурентной составляющей". Я скорее назвал бы это так как назвал - фактором, который, вероятнее всего, является определяющим для выстраивания массива позиций на конкретное место. Т.е. если взять в качестве фактора - PR, то например следующая ситуация дала бы 100% корреляцию:

Запрос #1-----Место в Я-10------PR страницы=1

Запрос #2-----Место в Я-15------PR страницы=2

Запрос #3-----Место в Я-20------PR страницы=3

Запрос #4-----Место в Я-25------PR страницы=4

Запрос #5-----Место в Я-30------PR страницы=5

Запрос #6-----Место в Я-35------PR страницы=6

Запрос #7-----Место в Я-40------PR страницы=7

Запрос #8-----Место в Я-45------PR страницы=8

Запрос #9-----Место в Я-50------PR страницы=9

Запрос #10----Место в Я-55------PR страницы=10

The WishMaster
На сайте с 29.09.2005
Offline
2543
#3

Не может быть никакой корреляции, так как факторы влияют не сами по себе, а совместно. И еще и, наверняка, друг на друга. Так что это будут ошибочные зависимости.

Пешу текста дешыго! Тематики - туризм, СЕО, творчество, кулинария, шизотерика :)
Shlackbaum
На сайте с 18.08.2010
Offline
322
#4
The WishMaster:
Не может быть никакой корреляции, так как факторы влияют не сами по себе, а совместно. И еще и, наверняка, друг на друга. Так что это будут ошибочные зависимости.

Мне известно про совокупность, я сам об этом пишу примерно также, как и Вы сейчас.

У меня есть основания полагать, что относительно явная зависимость в конкретном случае на конкретном массиве запросов имеется - поэтому я и спрашиваю мнения коллег.

Зачем я постскриптум писал...?:(

Shlackbaum:
P.S. Прошу комментарии типа "Да там совокупность факторов, а не один... оставить за пределами этой темы.

P.S. Что-то подобное уже поднималось...

P.P.S. Ушел изучать регрессионный анализ.

BlueRay
На сайте с 09.03.2011
Offline
38
#5
Shlackbaum:

У меня есть основания полагать, что относительно явная зависимость в конкретном случае на конкретном массиве запросов имеется - поэтому я и спрашиваю мнения коллег.

Если даже ваше предположение верно, то его проверить будет крайне сложно, т.к. запросы могут быть с различной конкуренцией и в этом случае, даже если фактор и является таким, каким вы его себе представляете, этого может не хватить, чтобы продвинуть сайт в топ.

Пока я вижу лишь одно решение вашей задачи: отслеживать динамику позиции вашего сайта по тем запросам по мере того, как вы манипулируете искомым фактором. Основываясь на том, будет ли сайт подниматься в выдаче можно говорить о том, влияет ли этот фактор на выдачу или нет. В зависимости от того, насколько сильно вы будете подниматься в выдаче, можно говорить (но со многими оговорками) и о силе этого фактора.

Shlackbaum:

Зачем я постскриптум писал...?:(

Мелкий текст чаще всего игнорируется.

P.P.S. Ушел изучать регрессионный анализ.

Верное решение.

Shlackbaum
На сайте с 18.08.2010
Offline
322
#6
BlueRay:
Если даже ваше предположение верно, то его проверить будет крайне сложно, т.к. запросы могут быть с различной конкуренцией и в этом случае, даже если фактор и является таким, каким вы его себе представляете, этого может не хватить, чтобы продвинуть сайт в топ.

Пока я вижу лишь одно решение вашей задачи: отслеживать динамику позиции вашего сайта по тем запросам по мере того, как вы манипулируете искомым фактором. Основываясь на том, будет ли сайт подниматься в выдаче можно говорить о том, влияет ли этот фактор на выдачу или нет. В зависимости от того, насколько сильно вы будете подниматься в выдаче, можно говорить (но со многими оговорками) и о силе этого фактора.

Это тоже понятно. Просто у меня, насколько я вижу, исключительный случай.

Все равно всем спасибо:)

Видимо Корреляционно-регрессионный анализ - самое то.

The WishMaster
На сайте с 29.09.2005
Offline
2543
#7
Shlackbaum:
У меня есть основания полагать, что относительно явная зависимость в конкретном случае на конкретном массиве запросов имеется - поэтому я и спрашиваю мнения коллег.

Ну так рассказывай! С примерами, графиками и т. п. Только надо избегать ложной корреляции ;)

Shlackbaum
На сайте с 18.08.2010
Offline
322
#8
The WishMaster:
Ну так рассказывай! С примерами, графиками и т. п. Только надо избегать ложной корреляции ;)

Ну как изучу, как пользоваться этим анализом - может и опубликую:)

SmileP
На сайте с 18.02.2010
Offline
386
#9

Shlackbaum, тоже задумывался над этим. Но корреляционно-регрессионный анализ не учитывает логические зависимости, к примеру: "и" "или", он он не выявит.

Кроме того ПС учитывают несколько сотен факторов.

Ну и со спектром как поступить при автоматизированной обработке? Это вопрос для анализа ТОПа по какой-то тематике.

По регрессионке рекомендую найти литературу по предмету "теория эксперимента".

Shlackbaum, пишите если что, мне это тоже интересно, но проблема со временем:(

Антон Белов
На сайте с 28.05.2010
Offline
183
#10
Shlackbaum:
Ну как изучу, как пользоваться этим анализом - может и опубликую

публикуйте, только сдаётся мне, что вы не учитываете изменчивость факторов. Пока вы работаете над одним фактором и пытаетесь наблюдать корреляции, другие факторы изменяются и вносят тем самым невозможность точного определения.

Самый простой пример: вы изучаете влияние ссылок, а в это время у вас показатель отказов скачет плюс минус 20% (а ведь показатель отказов может зависить от многих факторов...от времени года, от общемировой рекламы, от погоды на улице). Поэтому вы не сможете сделать однозначных выводов.

Аудит за 100 рублей (/ru/forum/787849) теперь реальность курс Подводные камни мфа (/ru/forum/comment/11861126) - всего за 100 рублей Твой сервер снова лежит? Пользуюсь Inferno Solutions, таких проблем не знаю. (http://cp.inferno.name/link.php?id=13)
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий