Проблема кластеризации при квотировании выдачи.

1 234
Адепт
На сайте с 15.06.2004
Offline
247
#31
Shlackbaum:
но чтобы холивар не поднимать

И все-таки он поднялся :)

Кстати, если уж говорить, про форд фокус, то он некоммерческий запрос, без добавление цены и важный момент, как я понимаю - автосалоны, которые продают б.у. авто, их почему-то в теме, как и в выдаче, не увидел :)

Кстати, ситуация, вроде как со времен этого поменялась в лучшую сторону: /ru/articles/21066

Эффективное комплексное продвижение для интересных проектов. ( /ru/forum/577451 ) Делюсь опытом.
IBakalov
На сайте с 05.10.2011
Offline
218
#32

Shlackbaum, если так как вы описываете, то вариантов не много:

1) Сначала фильтруете СЯ, оставляя только запросы, в которых в топе есть Х и более сайтов вашего типа, затем кластеризуете просто по всему топу, не думая о группах документов.

2) Оцениваете топ (лушче топ-50), выкидываете все URL, которые не относятся к вашему типу сайта (допустим из 50 остается 12) и уже дальше по ним делаете группировку.

Для оценки URL из топа придется парсить сами документы, частичто вот тут рассказывал http://www.slideshare.net/b7186rft/e-commerce-43996616, хотя думаю как это делать вы и сами знаете.

Shlackbaum
На сайте с 18.08.2010
Offline
322
#33

IBakalov, у меня нет карманного кластеризатора :(

Я бы хотел, чтобы это внедрили рыночные игроки.

---------- Добавлено 19.06.2015 в 17:14 ----------

YaanGle:
Вы почему-то решили, что в данной задаче тип сайтов значимый фактор, отбросив другие.

Ни в коем случае не отбрасываю, конечно они играют свою роль, причем скорее всего гораздо бОльшую, чем подкатегоризация. Я говорю об увеличении точности. Вопрос в том, насколько точность с дополнительным фильтром будет эффективней, чем без оного.

YaanGle:
На мой взгляд, изначально семантику можно кластеризовать, а затем дополнительно присвоить запросам коэффициенты релевантности, на основе групп.

Либо я с вами не согласен, либо я неправильно изложил свою мысль, т.к. такой подход проблему не решит. Разве что коэффициенты смогут быть отрицательными :)

---------- Добавлено 19.06.2015 в 17:18 ----------

pimandr:
Не буду. Это вопрос здравого смысла. Так же как в реале на магазине по продаже молока не делают высеску "аренда автомобилей". Яндекс-то тут при чем?
Гротескность как раз у вас: вы заведомо подбираете запросы, которые не подходят к содержанию вашего сайта. И после этого говорите, что яндекс оказывается не хочет такие сайты ранжировать потому что они, видите ли, не той категории.

И вообще, это уже относится к вопросу подбора запросов под проект. А тут уж ни яндекс, ни категории не при чем.

Вы отчасти правы - в этом и смысл гротескности.

Я взял пограничный гротескный пример, чтобы показать, что для разных подгрупп есть разные запросы, которые могут выйти/не выйти в топ в зависимости именно от их подгруппы. И таким образом эти запросы в кластеризации для подгруппы должны бы отсутствовать.

Например возьмем те же цены. Они могут быть на любительском проекте. Сравнение цен у разных дилеров на конкретном фан-сайте. Это вполне вероятный сценарий.

Но проблема у него будет в том, что если по запросу с ценами в матрикснете заложены конкретные квоты и в эту квоту проекты с подкатегорией Любительские не входят вообще - то проект не сможет именно из-за алгоритма матрикснета выйти в топ, хоть ты тресни, если только он не откорректирует свою семантику и подкатегорию и не станет внезапно агрегатором или дилером с последующим переназначением подкатегории в Яндексе.

Пустота. Какого черта здесь появляется чья-то реклама?
P
На сайте с 25.05.2007
Offline
103
#34
Shlackbaum:
которые могут выйти/не выйти в топ в зависимости именно от их подгруппы

Я с вами абсолютно согласен. Главное подгруппа. Контент вообще не при чем.

Удачи в размышлениях.

coolakov.ru/tools (http://coolakov.ru/tools/): определение конкурентов (http://coolakov.ru/tools/most_promoted/), кластеризация запросов (http://coolakov.ru/tools/razbivka/) и т.д.
Shlackbaum
На сайте с 18.08.2010
Offline
322
#35
pimandr:
Я с вами абсолютно согласен. Главное подгруппа. Контент вообще не при чем.
Удачи в размышлениях.

Почему вы вдруг решили, что я подгруппе даю большую важность в кластеризации, чем контент мне неведомо =)) Нигде я такого не говорил 🍿

YaanGle
На сайте с 06.09.2011
Offline
155
#36
Shlackbaum:

Ни в коем случае не отбрасываю, конечно они играют свою роль, причем скорее всего гораздо бОльшую, чем подкатегоризация. Я говорю об увеличении точности.

Объясните, с чего вдруг точность должна возрасти?

Shlackbaum:

конкретные квоты и в эту квоту проекты с подкатегорией Любительские не входят вообще - то проект не сможет именно из-за алгоритма матрикснета выйти в топ, хоть ты тресни

Вы хотите кластеризовать семантику, или определить релевантность [запрос:категория сайтов]?

Shlackbaum:

Либо я с вами не согласен, либо я неправильно изложил свою мысль, т.к. такой подход проблему не решит.

Надуманную проблему ничто не решит :)

Shlackbaum
На сайте с 18.08.2010
Offline
322
#37
YaanGle:
Объясните, с чего вдруг точность должна возрасти?

За счет исключения непродвигаемых в подкатегории запросов

YaanGle:

Вы хотите кластеризовать семантику, или определить релевантность [запрос:категория сайтов]?

Второе я и сам сделаю. Первое только кластеризаторы могут.

P
На сайте с 25.05.2007
Offline
103
#38
Shlackbaum:
За счет исключения непродвигаемых в подкатегории запросов

То есть вы подобрали дибильные запросы, на которые нет ответов на вашем сайте, а виноват в этом кластеризатор. Прелестно.

Shlackbaum
На сайте с 18.08.2010
Offline
322
#39
pimandr:
То есть вы подобрали дибильные запросы, на которые нет ответов на вашем сайте, а виноват в этом кластеризатор. Прелестно.

Нет, например в текущем примере сайта еще нет или он не взят в продвижение.

Как раз для исключения сложных для продвижения запросов (при прочих равных) по параметру подкатегории - в момент получения данных и решается - рентабельно ли продвигать этот запрос в ПС или нет.

YaanGle
На сайте с 06.09.2011
Offline
155
#40
Shlackbaum:
За счет исключения непродвигаемых в подкатегории запросов

Ну, исключая [запрос 1], мы не влияем на то, в какие группы попадут [запрос 2] и [запрос 3]. Оценка "продвигаемости" запроса для типа сайта уже другая задача. По мне, так лучше не изменять семантику на выходе, уменьшая количество запросов.

И повторюсь, для неконкурентных запросов определение подкатегории сайта не несёт смысла, тк сильная обратная связь от других факторов.

1 234

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий