Домыслы на закате эпохи ссылок …

Shustov
На сайте с 17.10.2004
Offline
64
#111

Давайте по порядку.

Как быть с сезонными и событийными запросами???? (ведь просто не будет времени, чтобы определить и отбросить ошибку)

Уверяю, завязать сис-му учета кликов с кол-вом общего всплеска кликов по ключевым словам можно.

Повторюсь с такой вариацией.
Берем перве 10-20-30-40-50 сайтов. Так, чтобы каждая пятерка(например) побывала на первом мете. Конечно-же ориентируясь на дни недели. Набрав базу результатов, можно создать начальные коэффициенты, с учетом остальных факторов.

Про ранжирование всего списка выдачи я не говорю, я говорю о применении в ТОП 10.

И как раз в ТОП 10 ошибку отловить будет реально.

Наверное кто-то думает (он прав) о том что сайты на разных позициях не равны (по вероятности клика) объясняю - логично использовать коэиффеценты.

Вот и все...

А с низкочастотниками - труба вовсе.

Почему?

PS обсуждать это можно долго, да и требует более детального анализа.

Однако можно сказать, что идея, при правильном подходе имеет место быть.

Пока никто не дал обоснованный ответов почему нельзя ранжировать ТОП.

Dm
На сайте с 11.03.2002
Offline
108
Dm
#112
Shustov:

Уверяю, завязать сис-му учета кликов с кол-вом общего всплеска кликов по ключевым словам можно.

Завязать конечно можно. Вопрос в том, насколько это будет полезно.

Shustov:
А с низкочастотниками - труба вовсе.
Shustov:
Почему?

Потому что при одном показе страницы, один пользователь может нажать все 10 ссылок, по очереди. То же может сделать и второй. Третий может вообще ничего не кликнуть. Когда пользователей будет 1000 можно искать закономерности. Лучше 10.000, еще лучше 100000.

Shustov:
Пока никто не дал обоснованный ответов почему нельзя ранжировать ТОП.

А давайте представим, что сайт по одному высокочастотнику получает высокий CTR, а по другому просто попадает в ТОП. По-вашему, он должен и по второму запросу вылазить на первое место? Или Вы предлагаете хранить CTR по каждому уникальному запросу для каждого сайта?

Я за ДСДЛ (/ru/forum/135358)
Shustov
На сайте с 17.10.2004
Offline
64
#113
Потому что при одном показе страницы, один пользователь может нажать все 10 ссылок, по очереди. То же может сделать и второй. Третий может вообще ничего не кликнуть. Когда пользователей будет 1000 можно искать закономерности. Лучше 10.000, еще лучше 100000.

И что следует из того что один кликнул другой нет? Не уловил мысли..

А давайте представим, что сайт по одному высокочастотнику получает высокий CTR, а по другому просто попадает в ТОП. По-вашему, он должен и по второму запросу вылазить на первое место? Или Вы предлагаете хранить CTR по каждому уникальному запросу для каждого сайта?

Это уже интереснее, да это проблема. Но я не думаю что это особо сильно отличается от хранения внешних ссылок на сайт.

Dm
На сайте с 11.03.2002
Offline
108
Dm
#114
Shustov:
И что следует из того что один кликнул другой нет? Не уловил мысли..

CTR в этом случае получается случайным, не отражающим реальной картины. Как в этом случае ранжировать сайты?

Shustov:
Это уже интереснее, да это проблема. Но я не думаю что это особо сильно отличается от хранения внешних ссылок на сайт.

Если ты про вИЦ, то это скорее всего одно число для одного сайта. Здесь же попахивает таблицей в столбце которой _все сайты_, в строке _все запросы_, а в соответствующих ячейках CTR каждого сайта по каждому запросу. По-моему, это немного больше, чем хранить вИЦ :).

Чего вы так привязались к CTR? Если Яндекс отслеживает клики по сайтам, то это не означает, что он использует эту информацию для ранжирования. Просто они измеряют клики по сайтам из выдачи, точнее это предположение. Можно утверждать только то, что они имеют такую возможность.

andrej-ilin
На сайте с 28.03.2005
Offline
42
#115
Если ты про вИЦ, то это скорее всего одно число для одного сайта

Скорее всего это одно число для одного URL. Или я не прав?

andrej-ilin@yandex.ru
Shustov
На сайте с 17.10.2004
Offline
64
#116
CTR в этом случае получается случайным, не отражающим реальной картины. Как в этом случае ранжировать сайты?

Не понял почему CTR не отображает реальной картины... ну ладно..

Если ты про вИЦ, то это скорее всего одно число для одного сайта. Здесь же попахивает таблицей в столбце которой _все сайты_, в строке _все запросы_, а в соответствующих ячейках CTR каждого сайта по каждому запросу. По-моему, это немного больше, чем хранить вИЦ

А как все ссылки хранятся? вИЦ как-то же считается.

Такой таблицы быть в принципе не может (где один столбец сайт - другой множество запросов) обычно делают на каждую строку один запрос и id сайта (ну это в общем, как делают в такиз сис-мах как Яндекс - не знаю)

Чего вы так привязались к CTR? Если Яндекс отслеживает клики по сайтам, то это не означает, что он использует эту информацию для ранжирования. Просто они измеряют клики по сайтам из выдачи, точнее это предположение. Можно утверждать только то, что они имеют такую возможность.

Это совершенно верно

A
На сайте с 20.08.2005
Offline
2
#117

Вот например в театральной тематике по событиям бывает очень резкий скачок, который связан с рекламой на телевидении или на билл бордах.

Запросы такого плана являются среднечастотными в месячном интервале, а в интервале недели могут быть очень даже высокочастотными.

Вот на МАКС 2005, например, по 4500 запросов в день было!

Так что подсчитать CTR для переранжирования таких запросов просто глупо, т.к. к моменту новой выдачи это уже не актуально будет.

Кстати на счёт кликов первой десятки, у меня 5 сайтов по некоторым запросам выходят в серп одновременно, ну так народ не стесняется особо кликать :-) все окучивают за раз, в маркетинге называется (Иллюзия выбора)! :p

Так что, скорее всего, CTR нужен для чистки высокочастотников или просто для общего развития сотрудниковю

И не смогла культура переделать моей животной низменной природы. Всем нам сюда! билеты в театры (http://parter.ru/category.asp?sect=115), билеты на концерты (http://parter.ru/category.asp?sect=67), билеты в цирк (http://parter.ru/category.asp?sect=70)
M
На сайте с 21.11.2004
Offline
230
#118

Прям как хорошо забытый топик про форму оценки полезности сайта, для поисковиков.

А так, имхо, ничего уже глобально меняться не должно, всё онсновное уже разработано и отлично работает.

И вот так, чтобы всё изменить до неузнаваемости, как написано в первом посте данного топика, это нужно быть непонятно каким идиотом, ведь сейчас много людей занято в сфере оптимизациии, написанно много софта под существующие алгоритмы и лишать еды оптимизаторов, вот так категорично, никто не осмелится.

Продвигаю домены руками (http://roke.ru)
T
На сайте с 02.06.2005
Offline
33
#119

Контроль над обратной связь... Речь идет об игрушках - но размышления вполне подходят...

До сих пор мы рассматривали положительные и отрицательные стороны обратной связи. К первым относится предотвращение тупиковых ситуаций и обеспечение справедливой победы. К нежелательным эффектам относится то, что положительная обратная связь может разбалансировать игру и привести ее к финалу слишком быстро. Как же мы можем контролировать обратную связь? Есть несколько способов.

Используйте отрицательную обратную связь

Отрицательная обратная связь - обратная сторона положительной: это эффект, который уменьшает, а не увеличивает мощность на выходе системы. Хороший пример контролирования положительной обратной связи при помощи отрицательного "фидбэка" можно увидеть в системе набора игроков в профессиональную футбольную лигу Америки. В принципе, команда-лидер дивизиона зарабатывает больше денег, чем команда, плетущаяся в конце турнирной таблицы. Победители могут тратить больше денег на найм новых игроков из университетской лиги. Чем больше денег у команды, тем больше лучших игроков они могут перекупить, следовательно, тем больше игр выиграть. Бедные команды могут позволить себе только "дешевых", более слабых новобранцев, и следовательно, они могут только проигрывать. Явный случай с положительной обратной связью.

Чтобы предотвратить эту ситуацию и постараться сбалансировать силы всех команд, Национальная Футбольная Лига взяла на вооружение систему "драфта", при которой игроки просто не могут быть проданы тому, кто предложил бОльшую цену. Вместо этого команды по очереди выбирают себе новых игроков из числа возможных, причем слабейшие команды выбирают первыми. Таким образом, худшие клубы получают лучших игроков, и общая расстановка сил получается более-менее равной. Понятно, что на самом деле все не так просто, так как команды могут продавать свое место в очереди на драфт, а качество игры зависит от судейства и от действий остальных членов команды. Но принцип, думаю, ясен. Драфт предотвращает саму возможность занять доминирующее положение при помощи эффекта положительной обратной связи.

Будьте очень осторожны с отрицательной обратной связью, - если ее эффект силен, то неизбежны патовые ситуации или резкие изменения лидерства. В данном примере лидирующее положение означает крайне невыгодную позицию, в которой поочередно оказываются соперники.

Подобную картину можно часто наблюдать в играх для взрослых на вечеринках, где цель вовсе не в получении награды, а просто в хорошем времяпрепровождении. В принципе, в таких играх неважно, кто лидирует. Каждый может оказаться впереди по ходу игры, а победитель определяется случайно.

Ограничьте преимущества, вызванные положительной обратной связью

В шахматах "съеденные" фигуры убираются с доски, но представьте, во что превратилась бы игра, если бы они оставались на поле и переходили бы во владение противника (другими словами, увеличилась бы положительная обратная связь). Партии стали бы гораздо короче. Кстати, такая картина характерна для японских шахмат "шоги" - игрок может использовать фигуры соперника (с некоторыми ограничениями). Именно поэтому стратегические игры не позволяют захватывать вражеских юнитов в плен и использовать их на своей стороне, а также редко позволяют захватывать и использовать вражеские базы. Если бы вы обращали солдат врага на свою сторону и использовали бы вражеский потенциал в своих целях, длительному геймплею настал бы конец. Дизайнеры в этом случае стараются ограничивать преимущества, которые дает положительная обратная связь.

В дополнение к системе драфта, профессиональный футбол располагает и другими средствами предотвращения доминирования одних команд над другими. Одно из таких средств - ограничение максимальной зарплаты, которую можно платить игрокам. Не важно, сколько денег могут заплатить владельцы команды - они не смогут потратить на жалованье больше, чем продиктовано ограничениями. Еще один способ - лимит на максимальное количество членов команды. Ни один клуб в течение игрового сезона не может быть укомплектован более чем 53 игроками, даже если он может себе это позволить. Эти искусственные ограничения уменьшают эффект положительной обратной связи и обеспечивают претворение в жизнь правила "деньги - не главное".

Polite Moose
На сайте с 22.04.2002
Offline
85
#120

Mr_Promoter, можно я попробую тоже разубедить Вас в Вашей теории, попытавшись сформулировать кратко основной, на мой взгляд, недостаток? :)

Предлагаемый Вами метод оценки, увы, относятся не к сайтам (как задумывалось), а исключительно к их описаниям, то есть к тайтлам и снипетам. Пользователь кликающий на нечто в выдаче, оценивает не сайт (который он еще не видел), а только то, что вебмастер написал в title и то, что Яндекс отобрал в качестве снипета. Даже если представить, что пользователь внимательно вчитывается в тайтл и снипет (что на самом деле, зачастую, совсем не так), то обмануть его (пользователя) совсем не трудно.

Пример: лепим дорвей под некий запрос, причем лепим умным автоматом или ручками - берем куски (абзацы) тематических статей и перемешиваем. Заголовок, ясное дело, тоже "затачиваем". Что в результате? В результате в выдаче а) привлекательный заголовок; б) осмысленный тематический текст в снипете, независимо от того, из какого места текста ПС его выкусит. А в результате для пользователя - бессмысленная каша и редирект.

Так что, увы, но предложенная Вами методика хороша для:

1) Оценки качества подбора снипетов.

2) Выявления, как сказал euhenio, свежепостроеных дорвеев.

3) С некоторой натяжкой, определения случайно попавших в выдачу сайтов (особено для найденых по ссылкам) - если на некий сайт кликают крайне редко, по сравнению с соседями, то можно предположить, что: а) либо сайт совсем не соотв. запросу и ссылка "ошибочна"; б) крайне неудачно выбраны заголовок и снипет (см. п.1), но тут нужна ручная проверка.

---

При этом отмечу, что Ваши размышления о поисках новых факторов мне нравятся. Вслед за контентом и ссылками должны появиться новые сильные факторы ранжирования - это безусловно. Может быть это будет, как тут уже отмечалось, новая реинкарнация текстов, может быть новая политика работы со ссылками... вполне вероятно, что и "работа" с пользователем. Но, увы, не по предложенной Вами схеме... Лично моё мнение на этот счет таково: в той или иной степени произойдет объединение поисковика и систем глобальной статистики. Причем будут рассматриваться не только отдельные сайты (это будет первый этап), а направлния потоков пользователей. А поиск и ранжирование будет осуществляться внутри потока. Например, по общим навигационным запросам, будут выделяться группы (купить Х, продать Х, почитать описание Х, посмотреть изображение Х, и т.д) и серп будет разбиваться на доли в соотв. с массовостью группы или перенаправлять в соотв. поток, может быть даже в зависимости от "истории пользователя" (персонализированный поиск) и его местоположения (не даром все ПС картами занялись).

Удачи, доброго пива (http://www.fifth-ocean.ru/) и настроения! Релевантность определяется не тИЦ, не ВИЦ, не количеством ссылок, не частотой ключевого слова, а соответствием запросу!

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий