Попробуйте завязать сис-му учета кликов с кол-вом общего всплеска кликов по ключевым словам - Яндекс

Домыслы на закате эпохи ссылок

Mr_Promoter · 2005-09-06T07:12:09.0000000Z

Домыслы на закате эпохи ссылок Что-то последнее время стал плохо спать тревожно, нутром чую грядут перемены Mr_Promoter А как все невинно начиналось! Каталог сайтов и поиск по нему Сейчас уже трудно представить Яндекс, да и другие лидирующие поисковые системы в таком виде. Сейчас это настоящие поисковые монстры с огромными базами данных и сложнейшими алгоритмами ранжирования и что самое главное большими оборотами килобаксов. Эволюция поисковых систем. Поисковые системы в процессе своей эволюции пережили несколько этапов, которые можно выделить таким образом Эпоха зарождения Эпоха контента Эпоха ссылок Эпоха зарождения Посягательств на влияние позиций в выдаче не было, пожалуй, лишь во времена зарождения, когда относительно немногочисленные пользователи Интернета не знали что такое реклама в сети. Хорошие были времена! НО появились баннеры, и понеслось - реферат, секс, порно чего только не писали в столь значимом тогда метатеге keywords лишь бы завлечь на свои сайты любых посетителей. Как ответ поисковые системы стали анализировать текст сайта, этот переломный момент можно назвать переход в эпоху контента. Эпоха контента Интерес к Интернету рос все больше и больше, стало появляться больше сайтов, толчком тому стали бесплатные хостинги, любезно предоставившие свои услуги за показы сокровенных баннеров двигателя эпохи контента. На баннерах было помешано все вся сеть жила откруткой показов и поисковые системы это тоже не обошли стороной. В сети стало больше денег, а, следовательно, конкуренции. Появились первые профессиональные оптимизаторы, полностью зарабатывающие деньги на трафике, а не занимающиеся этим по совместительству с основной работой. Сначала это были просто оптимизаторы, это уже к концу эпохи контента с появлением массы дорвеев они стали окрашиваться в черных, серых и белых. Вот и прозвучало это грозное слово дорвеи причина краха эпохи контента. Вычислив формулу идеального сайта в сети стали огромными темпами разрастаться бессмысленные и бесполезные релевантные запросам сайты все более и более вытесняющие все остальные. Идея решения этой проблемы была позаимствована у уже к тому времени мирового лидера среди поисковых систем Google. Началась эпоха ссылок. Эпоха ссылок Впервые возникла идея спросить у народа, а что, по вашему мнению, хорошо, вернее какие сайты хорошие? Этим народом оказались вебмастеры. Ставя ссылки со своих сайтов на хорошие, увиденные и оцененные своими собственными глазами сайты сети они поднимали их вверх в выдаче. Идея была хороша, но в сети стало крутиться слишком много денег Первую трещину эта система стала давать когда начался бум обмена ссылками. Особенно страшно это смотрелось когда менялись десятками баннеров с главной страницы, позже появились отдельные страницы куда весь этот мусор перенесли и многократно преумножили. Так или иначе народ уже протоптал «тропинки успеха» и успешно прогоняя по ним проект за проектом стал выводить их в свет. Дорвейная технология лишь в начале эпохи немного пострадала, но вскоре освоила новые методы воздействия на системы и начала развиваться, с еще большим размахом. Пришло время новой эпохи. Технологии будущего - эпоха CTR Что же еще можно сделать такого чего еще не сделали? Хочу изложить здесь оду идею, которая крутится у меня в голове. И так давайте посмотрим на Интернет глазами поисковой системы. Что надо поисковым системам? Как это ни странно, но то же самое что и нам всем посетителей. Будет большой поток посетителей будут больше продаваться рекламные площадки , будет больше прибыли от поисковика. А когда посетитель пойдет в ту или иную поисковую систему? Когда она будет находить то что ему нужно, а не всякий мусор. Так вот и мы подошли к главной части вопроса что нужно посетителю? Поисковые системы пытаются это угадать уже долгие годы, анализируя контент, учитывая мнение вебмастеров (считай тех же разработчиков сети), а может все проще? Может об этом стоить спросить самих посетителей? Третий кит Сейчас практически все поисковые системы подсчитают кто когда и где кликнул на их сайтах. И что-то мне очень сильно кажется, что это не спроста. Представьте себе такую вещь, что поисковые системы наряду с коэффициентами соответствия контента и веса ссылочного ранжирования, так же при расчете веса сайта (вИЦ) будут учитывать и его CTR в поисковых системах. Будут просто подсчитывать сколько раз, был показан сайт, и на каких позициях, и сколько раз на него было совершено переходов (кликов). С точки зрения конкуренции это здоровая вещь, так как пользователю будет предложено 10 сайтов и естественно он выберет наилучший для себя путем клика на него. Собрав такую статистику и подкорректировав данные (у сайта на первой позиции больше шансы, что на него кликнут, следовательно, его CTR следует немного занизить исходя из коэффициентов кликабельности по позициям) можно получить «третьего кита», на котором будет держаться поиск. Что же будет давать этот кит? Этот кит будет давать коэффициент популярности сайта у пользователей. В результате чего пользователи будут сами корректировать выдачу сайты которые им нравятся поднимутся вверх, а сайты которые им не нравятся упадут. Получится выдача, которая нравится пользователю не это ли залог успеха поисковой системы? Накрутим? Естественно первые мысли так это же легко накрутить! А нет не так уж и легко. Можно сделать не всеобщий опрос всех пользователей, а в случайное время по случайным запросам в случайный промежуток времени и с условием один ip адрес голосует только один раз, скажем в неделю, месяц и т.д. То есть рандомом выбралось время и в этот промежуток времени происходит так сказать соцопрос Вы за кого? Данной информации будет достаточно для вычисления средней статистики. И так периодически через определенное время. Вероятность накрутки ничтожно мала. Самые активные ip адреса можно поместить в черный список и больше их мнение не спрашивать. В общем предотвратить накрутку здесь вполне можно. А как же мы? А как это повлияет на оптимизаторов? На мой взгляд, будет еще большое расслоение между былыми методами оптимизации и черными. Те кто оптимизирует по белому делает сайт правильным с точки зрения поисковой системы и удобным и привлекательным для пользователя только выиграет так как такие сайты нравятся пользователю и на них будут активно кликать, а вот черные или неоптимизированные сайты, без красивых заголовков и снипптов явно пострадают. Дорвеям тоже придется не сладко красивый заголовок то можно придумать, а вот как из бредятины сделать красивый сниппет? Исходя из логики все работает значит скоро будет, грядут перемены, смена эпохи близка ...

64

Shustov

7 сентября 2005, 12:58

#111

Давайте по порядку.

Как быть с сезонными и событийными запросами???? (ведь просто не будет времени, чтобы определить и отбросить ошибку)

Уверяю, завязать сис-му учета кликов с кол-вом общего всплеска кликов по ключевым словам можно.

Повторюсь с такой вариацией.
Берем перве 10-20-30-40-50 сайтов. Так, чтобы каждая пятерка(например) побывала на первом мете. Конечно-же ориентируясь на дни недели. Набрав базу результатов, можно создать начальные коэффициенты, с учетом остальных факторов.

Про ранжирование всего списка выдачи я не говорю, я говорю о применении в ТОП 10.

И как раз в ТОП 10 ошибку отловить будет реально.

Наверное кто-то думает (он прав) о том что сайты на разных позициях не равны (по вероятности клика) объясняю - логично использовать коэиффеценты.

Вот и все...

А с низкочастотниками - труба вовсе.

Почему?

PS обсуждать это можно долго, да и требует более детального анализа.

Однако можно сказать, что идея, при правильном подходе имеет место быть.

Пока никто не дал обоснованный ответов почему нельзя ранжировать ТОП.

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

108

Dm

7 сентября 2005, 13:22

#112

Shustov:

Уверяю, завязать сис-му учета кликов с кол-вом общего всплеска кликов по ключевым словам можно.

Завязать конечно можно. Вопрос в том, насколько это будет полезно.

Shustov:
А с низкочастотниками - труба вовсе.

Shustov:
Почему?

Потому что при одном показе страницы, один пользователь может нажать все 10 ссылок, по очереди. То же может сделать и второй. Третий может вообще ничего не кликнуть. Когда пользователей будет 1000 можно искать закономерности. Лучше 10.000, еще лучше 100000.

Shustov:
Пока никто не дал обоснованный ответов почему нельзя ранжировать ТОП.

А давайте представим, что сайт по одному высокочастотнику получает высокий CTR, а по другому просто попадает в ТОП. По-вашему, он должен и по второму запросу вылазить на первое место? Или Вы предлагаете хранить CTR по каждому уникальному запросу для каждого сайта?

Я за ДСДЛ (/ru/forum/135358)

64

Shustov

7 сентября 2005, 13:29

#113

Потому что при одном показе страницы, один пользователь может нажать все 10 ссылок, по очереди. То же может сделать и второй. Третий может вообще ничего не кликнуть. Когда пользователей будет 1000 можно искать закономерности. Лучше 10.000, еще лучше 100000.

И что следует из того что один кликнул другой нет? Не уловил мысли..

А давайте представим, что сайт по одному высокочастотнику получает высокий CTR, а по другому просто попадает в ТОП. По-вашему, он должен и по второму запросу вылазить на первое место? Или Вы предлагаете хранить CTR по каждому уникальному запросу для каждого сайта?

Это уже интереснее, да это проблема. Но я не думаю что это особо сильно отличается от хранения внешних ссылок на сайт.

108

Dm

7 сентября 2005, 14:24

#114

Shustov:
И что следует из того что один кликнул другой нет? Не уловил мысли..

CTR в этом случае получается случайным, не отражающим реальной картины. Как в этом случае ранжировать сайты?

Shustov:
Это уже интереснее, да это проблема. Но я не думаю что это особо сильно отличается от хранения внешних ссылок на сайт.

Если ты про вИЦ, то это скорее всего одно число для одного сайта. Здесь же попахивает таблицей в столбце которой _все сайты_, в строке _все запросы_, а в соответствующих ячейках CTR каждого сайта по каждому запросу. По-моему, это немного больше, чем хранить вИЦ :).

Чего вы так привязались к CTR? Если Яндекс отслеживает клики по сайтам, то это не означает, что он использует эту информацию для ранжирования. Просто они измеряют клики по сайтам из выдачи, точнее это предположение. Можно утверждать только то, что они имеют такую возможность.

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

42

andrej-ilin

7 сентября 2005, 14:53

#115

Если ты про вИЦ, то это скорее всего одно число для одного сайта

Скорее всего это одно число для одного URL. Или я не прав?

andrej-ilin@yandex.ru

64

Shustov

7 сентября 2005, 15:17

#116

CTR в этом случае получается случайным, не отражающим реальной картины. Как в этом случае ранжировать сайты?

Не понял почему CTR не отображает реальной картины... ну ладно..

Если ты про вИЦ, то это скорее всего одно число для одного сайта. Здесь же попахивает таблицей в столбце которой _все сайты_, в строке _все запросы_, а в соответствующих ячейках CTR каждого сайта по каждому запросу. По-моему, это немного больше, чем хранить вИЦ

А как все ссылки хранятся? вИЦ как-то же считается.

Такой таблицы быть в принципе не может (где один столбец сайт - другой множество запросов) обычно делают на каждую строку один запрос и id сайта (ну это в общем, как делают в такиз сис-мах как Яндекс - не знаю)

Чего вы так привязались к CTR? Если Яндекс отслеживает клики по сайтам, то это не означает, что он использует эту информацию для ранжирования. Просто они измеряют клики по сайтам из выдачи, точнее это предположение. Можно утверждать только то, что они имеют такую возможность.

Это совершенно верно

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

A

2

Axeron

7 сентября 2005, 15:48

#117

Вот например в театральной тематике по событиям бывает очень резкий скачок, который связан с рекламой на телевидении или на билл бордах.

Запросы такого плана являются среднечастотными в месячном интервале, а в интервале недели могут быть очень даже высокочастотными.

Вот на МАКС 2005, например, по 4500 запросов в день было!

Так что подсчитать CTR для переранжирования таких запросов просто глупо, т.к. к моменту новой выдачи это уже не актуально будет.

Кстати на счёт кликов первой десятки, у меня 5 сайтов по некоторым запросам выходят в серп одновременно, ну так народ не стесняется особо кликать :-) все окучивают за раз, в маркетинге называется (Иллюзия выбора)! :p

Так что, скорее всего, CTR нужен для чистки высокочастотников или просто для общего развития сотрудниковю

И не смогла культура переделать моей животной низменной природы. Всем нам сюда! билеты в театры (http://parter.ru/category.asp?sect=115), билеты на концерты (http://parter.ru/category.asp?sect=67), билеты в цирк (http://parter.ru/category.asp?sect=70)

M

230

maximumx

7 сентября 2005, 16:32

#118

Прям как хорошо забытый топик про форму оценки полезности сайта, для поисковиков.

А так, имхо, ничего уже глобально меняться не должно, всё онсновное уже разработано и отлично работает.

И вот так, чтобы всё изменить до неузнаваемости, как написано в первом посте данного топика, это нужно быть непонятно каким идиотом, ведь сейчас много людей занято в сфере оптимизациии, написанно много софта под существующие алгоритмы и лишать еды оптимизаторов, вот так категорично, никто не осмелится.

Продвигаю домены руками (http://roke.ru)

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

T

33

Trispo

7 сентября 2005, 16:40

#119

Контроль над обратной связь... Речь идет об игрушках - но размышления вполне подходят...

До сих пор мы рассматривали положительные и отрицательные стороны обратной связи. К первым относится предотвращение тупиковых ситуаций и обеспечение справедливой победы. К нежелательным эффектам относится то, что положительная обратная связь может разбалансировать игру и привести ее к финалу слишком быстро. Как же мы можем контролировать обратную связь? Есть несколько способов.

Используйте отрицательную обратную связь

Отрицательная обратная связь - обратная сторона положительной: это эффект, который уменьшает, а не увеличивает мощность на выходе системы. Хороший пример контролирования положительной обратной связи при помощи отрицательного "фидбэка" можно увидеть в системе набора игроков в профессиональную футбольную лигу Америки. В принципе, команда-лидер дивизиона зарабатывает больше денег, чем команда, плетущаяся в конце турнирной таблицы. Победители могут тратить больше денег на найм новых игроков из университетской лиги. Чем больше денег у команды, тем больше лучших игроков они могут перекупить, следовательно, тем больше игр выиграть. Бедные команды могут позволить себе только "дешевых", более слабых новобранцев, и следовательно, они могут только проигрывать. Явный случай с положительной обратной связью.

Чтобы предотвратить эту ситуацию и постараться сбалансировать силы всех команд, Национальная Футбольная Лига взяла на вооружение систему "драфта", при которой игроки просто не могут быть проданы тому, кто предложил бОльшую цену. Вместо этого команды по очереди выбирают себе новых игроков из числа возможных, причем слабейшие команды выбирают первыми. Таким образом, худшие клубы получают лучших игроков, и общая расстановка сил получается более-менее равной. Понятно, что на самом деле все не так просто, так как команды могут продавать свое место в очереди на драфт, а качество игры зависит от судейства и от действий остальных членов команды. Но принцип, думаю, ясен. Драфт предотвращает саму возможность занять доминирующее положение при помощи эффекта положительной обратной связи.

Будьте очень осторожны с отрицательной обратной связью, - если ее эффект силен, то неизбежны патовые ситуации или резкие изменения лидерства. В данном примере лидирующее положение означает крайне невыгодную позицию, в которой поочередно оказываются соперники.

Подобную картину можно часто наблюдать в играх для взрослых на вечеринках, где цель вовсе не в получении награды, а просто в хорошем времяпрепровождении. В принципе, в таких играх неважно, кто лидирует. Каждый может оказаться впереди по ходу игры, а победитель определяется случайно.

Ограничьте преимущества, вызванные положительной обратной связью

В шахматах "съеденные" фигуры убираются с доски, но представьте, во что превратилась бы игра, если бы они оставались на поле и переходили бы во владение противника (другими словами, увеличилась бы положительная обратная связь). Партии стали бы гораздо короче. Кстати, такая картина характерна для японских шахмат "шоги" - игрок может использовать фигуры соперника (с некоторыми ограничениями). Именно поэтому стратегические игры не позволяют захватывать вражеских юнитов в плен и использовать их на своей стороне, а также редко позволяют захватывать и использовать вражеские базы. Если бы вы обращали солдат врага на свою сторону и использовали бы вражеский потенциал в своих целях, длительному геймплею настал бы конец. Дизайнеры в этом случае стараются ограничивать преимущества, которые дает положительная обратная связь.

В дополнение к системе драфта, профессиональный футбол располагает и другими средствами предотвращения доминирования одних команд над другими. Одно из таких средств - ограничение максимальной зарплаты, которую можно платить игрокам. Не важно, сколько денег могут заплатить владельцы команды - они не смогут потратить на жалованье больше, чем продиктовано ограничениями. Еще один способ - лимит на максимальное количество членов команды. Ни один клуб в течение игрового сезона не может быть укомплектован более чем 53 игроками, даже если он может себе это позволить. Эти искусственные ограничения уменьшают эффект положительной обратной связи и обеспечивают претворение в жизнь правила "деньги - не главное".

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

85

Polite Moose

8 сентября 2005, 00:24

#120

Mr_Promoter, можно я попробую тоже разубедить Вас в Вашей теории, попытавшись сформулировать кратко основной, на мой взгляд, недостаток? :)

Предлагаемый Вами метод оценки, увы, относятся не к сайтам (как задумывалось), а исключительно к их описаниям, то есть к тайтлам и снипетам. Пользователь кликающий на нечто в выдаче, оценивает не сайт (который он еще не видел), а только то, что вебмастер написал в title и то, что Яндекс отобрал в качестве снипета. Даже если представить, что пользователь внимательно вчитывается в тайтл и снипет (что на самом деле, зачастую, совсем не так), то обмануть его (пользователя) совсем не трудно.

Пример: лепим дорвей под некий запрос, причем лепим умным автоматом или ручками - берем куски (абзацы) тематических статей и перемешиваем. Заголовок, ясное дело, тоже "затачиваем". Что в результате? В результате в выдаче а) привлекательный заголовок; б) осмысленный тематический текст в снипете, независимо от того, из какого места текста ПС его выкусит. А в результате для пользователя - бессмысленная каша и редирект.

Так что, увы, но предложенная Вами методика хороша для:

1) Оценки качества подбора снипетов.

2) Выявления, как сказал euhenio, свежепостроеных дорвеев.

3) С некоторой натяжкой, определения случайно попавших в выдачу сайтов (особено для найденых по ссылкам) - если на некий сайт кликают крайне редко, по сравнению с соседями, то можно предположить, что: а) либо сайт совсем не соотв. запросу и ссылка "ошибочна"; б) крайне неудачно выбраны заголовок и снипет (см. п.1), но тут нужна ручная проверка.

---

При этом отмечу, что Ваши размышления о поисках новых факторов мне нравятся. Вслед за контентом и ссылками должны появиться новые сильные факторы ранжирования - это безусловно. Может быть это будет, как тут уже отмечалось, новая реинкарнация текстов, может быть новая политика работы со ссылками... вполне вероятно, что и "работа" с пользователем. Но, увы, не по предложенной Вами схеме... Лично моё мнение на этот счет таково: в той или иной степени произойдет объединение поисковика и систем глобальной статистики. Причем будут рассматриваться не только отдельные сайты (это будет первый этап), а направлния потоков пользователей. А поиск и ранжирование будет осуществляться внутри потока. Например, по общим навигационным запросам, будут выделяться группы (купить Х, продать Х, почитать описание Х, посмотреть изображение Х, и т.д) и серп будет разбиваться на доли в соотв. с массовостью группы или перенаправлять в соотв. поток, может быть даже в зависимости от "истории пользователя" (персонализированный поиск) и его местоположения (не даром все ПС картами занялись).

Удачи, доброго пива (http://www.fifth-ocean.ru/) и настроения! Релевантность определяется не тИЦ, не ВИЦ, не количеством ссылок, не частотой ключевого слова, а соответствием запросу!

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

Переиграть и победить: как анализировать конкурентов для продвижения сайта

Open AI тестирует память для ChatGPT

Домыслы на закате эпохи ссылок …