Проблема кластеризации при квотировании выдачи.

123 4
Shlackbaum
На сайте с 18.08.2010
Offline
322
4110

Сервисы типа группировки семантического ядра на основании кластеризации поисковых систем (кластеризация семантического ядра) предполагают, что на основании выдачи делаются какие-то сложные вычисления, которые определяют то, какие ключи должны продвигаться на одной странице, т.к. потенциал эффективности такого продвижения во взаимодействии выше. Делается это повторюсь на анализе выдачи.

Внимание вопрос:

Даже если предположить, что обходятся спектральные примеси по XML и не учитываются по запросу. Как быть с другим типом квотирования выдачи, который не является выделяемым через XML?

Например когда по запросу выдается 3 сайта любительских, 3 коммерческих, 3 коммерческих агрегатора и еще 1 орк. Из них причем ни один не находится в спектральной приписке по XML.

Исходя из логики - для каждой из этих 3(4) групп, свой тематико-семантический слепок, который касается конкретно узкой тематики не проявляемый по XML параметрам. Как в этом случае можно что-то исследовать и предлагать?

Вопрос не теоретический, а вполне практический.

Думал задать вопрос в топике для одного из кластеризаторов, но думаю пока пусть тут посидит...

Вообще в заголовке думал засунуть еще логические расстояния (привет T), но чтобы холивар не поднимать - обозначусь только тем, что сейчас находится в явном паблике и более-менее успешно работает.

Пустота. Какого черта здесь появляется чья-то реклама?
[Удален]
#1

Shlackbaum, группировать один запрос бесполезно, впрочем как и 100 :)

это работало на больших ся, к сожалению сейчас практически не работает :(

если раньше группировалось более 80% запросов, то сейчас меньше 30%

в выдаче стало очень много мусора, вычистить который практически не возможно.

больше всего напрягает последние тенденции яндекса - попытка распределения трафика между сайтами, сейчас в выдаче есть много тематичных сайтов которые представлены только 1-3 позициями в топ 10, а по остальным запросам их нет в топ100

Антоний Казанский
На сайте с 12.04.2007
Offline
619
#2
burunduk:
Shlackbaumсейчас в выдаче есть много тематичных сайтов которые представлены только 1-3 позициями в топ 10, а по остальным запросам их нет в топ100

Очень любопытны примеры. :) Будьте добры.

√ SEO продвижение https://akazansky.ru - экспертный аудит сайтов ( https://akazansky.ru/audit-sajtov ), внедрение эффективных решений цифрового маркетинга. Обучение автоматизации с помощью Zennoposter https://goo-gl.me/6Zypu
[Удален]
#3
anthony_:
Очень любопытны примеры. Будьте добры.

на следующей неделе, я сейчас дома работаю

P
На сайте с 25.05.2007
Offline
103
#4

Shlackbaum, не считаю это проблемой. У двух похожих запросов и группы будут похожие, пусть по 3-4 сайта в каждой, разве нет?

И потом, смысл кластеризаторов, на мой взгляд, в том, чтобы:

1. Находить неявные фразы-синонимы (раскрутка сайтов - продвижение сайтов)

2. Отделять коммерческие запросы от информационных (с ходу не смог пример подобрать. раньше был хороший пример "смартфон" и "смартфоны", сейчас он не актуален)

Эти вещи через морфологический анализ не вычисляются, через выдачу - достаточно достоверно.

Shlackbaum:
Как в этом случае можно что-то исследовать и предлагать?

Исследование даже с большой погрешностью, имхо, лучше, чем никакого исследования. И, по моим оценкам, погрешности получаются не критичными. После обработки напильником группировки получаются вполне вменяемыми.

В любом случае, кластеризаторы на основе сравнения топов работают лучше, чем кластеризаторы на основе морфологии.

И уж точно, доработать результат работы кластеризатора вручную - быстрее, чем полностью вручную группировать запросы.

burunduk:
это работало на больших ся, к сожалению сейчас практически не работает

А что сейчас стало хуже? Больше несвязанных запросов объединяются в группы? Или наоборот, больше похожих запросов не объединяется?

coolakov.ru/tools (http://coolakov.ru/tools/): определение конкурентов (http://coolakov.ru/tools/most_promoted/), кластеризация запросов (http://coolakov.ru/tools/razbivka/) и т.д.
[Удален]
#5
pimandr:
А что сейчас стало хуже?

мусор в выдаче :(

Shlackbaum
На сайте с 18.08.2010
Offline
322
#6
pimandr:

И уж точно, доработать результат работы кластеризатора вручную - быстрее, чем полностью вручную группировать запросы.

Позвольте, но как же вручную дорабатывать результат работы кластеризатора, если тонкие факторы попадания проекта в ту или иную подкатегорию находятся внутри черного ящика?

Я не про информационный против коммерческого... Это как раз толстый фактор :)

P
На сайте с 25.05.2007
Offline
103
#7

Так бОльшая часть факторов SEO находится в черном ящике. И чего?)

Я думаю так: если нельзя какой-либо "тонкий" фактор посчитать/определить, то проще исходить из того, что этого фактора нет.

Допустим, есть у вас 20 готовых категорий запросов. И остался последний, нераспределенный запрос. И непонятно, к какой из этих категорий его отнести. По одному фактору можно отнести к одной категории. По второму фактору - к трем другим. По третьему фактору - вообще никуда нельзя. А ведь надо учесть еще и Крайне Тонкий, Важный Фактор, который неизвестно, как определить. . Что же делать???

Я б наплевал и запихнул его в любую, от балды. По двум причинам:

1. Не может быть такой ситуации, чтоб это сломало всю группировку и продвигать сайт станет втрое сложнее. В целом она останется нормальной.

2. Как бы вы запросы не сгруппировали, это будет не идеальная группировка. Потому что идеально группировки нет. Яндексоиды такими понятиями вообще не оперируют.

Знаете, как Оппенгеймер в 20-е годы прошлого века вычислял параметры черной дыры? Кучу необходимых факторов кое-как можно было посчитать. Но внутреннее давление нейтронов посчитать было никак нельзя. Тогда не было измерительных приборов, чтобы измерить столь мелкие частицы и столь малое давление.

Так Оппенгеймер взял и решил, что раз это давление нельзя посчитать, давайте считать, будто оно равно нулю. Просто потому, что так проще.

А еще нужно было вращение учитывать. А это тоже сложно, тем более что в двадцатых годах калькуляторов не было. Решили, что вращение тоже нулевое. Исключительно для того, чтоб было проще считать.

И результаты получились достаточно достоверные, даже с сегодняшней точки зрения.

IBakalov
На сайте с 05.10.2011
Offline
218
#8
Вообще в заголовке думал засунуть еще логические расстояния (привет T), но чтобы холивар не поднимать - обозначусь только тем, что сейчас находится в явном паблике и более-менее успешно работает.

Так так так... Об чём речь? :)

Например когда по запросу выдается 3 сайта любительских, 3 коммерческих, 3 коммерческих агрегатора и еще 1 орк. Из них причем ни один не находится в спектральной приписке по XML.

Ну как вариант, дополнительно парсить еще URL из топа, на предмет того, к какой группе они относятся, но имхо это слишком геморрно :)

bossgs
На сайте с 17.03.2008
Offline
121
#9

Исходя из Вашего поста и вопроса, можно предположить, что Вы идеалист и ищите идеальные решения, но все не так просто в этой жизни. Практика и сотни экспериментов показывают, что на текущем этапе развития ПС нельзя сделать идеальную группировку на основании кластеризации поисковых систем во всех тематиках, так как выдача далека от идеальной (особенно где низкая конкуренция). Но можно постараться сделать максимально оптимальный результат и устранить большую часть рутинных работ.

Теперь ближе к делу:

1. Кластеризатор, говорю за наш "Семён Ядрён" ( http://seo-case.com/ ), пытается составить оптимальные группы запросов, которые достаточно просто "садятся" на страницу. Так как мы используем не только пересечение документов для группировки, а еще и ряд параметров (сниппеты, маркерные слова, тип запроса ...) и их комбинации, то это позволяет получить хороший результат и устранить ошибки выдачи.

2. При выгрузке наша система выгружает столбик "рел. урл" - список самых релевантных/видимых документов к полученной группе запросов. Что мешает потратить 1 минуту на просмотр страниц и создать аналогичный контент, который будет отвечать самым видимым конкурентам и желаниям посетителя.

Shlackbaum:
3 сайта любительских, 3 коммерческих, 3 коммерческих агрегатора и еще 1 орк

3. Нужно отталкиваться не от одного запроса, а от группы запросов и искать оптимальный контент для посадочной страницы.

4. Если у нас есть, например, 30 близких запросов и выдача, как Вы сказали, поделена на разные типы документов, то с очень большой долей вероятности, что система их поделит на 2-3 группы по более узким нишам

5. Можно ли представить группу запросов у которых такая выдача:

Shlackbaum:
3 сайта любительских, 3 коммерческих, 3 коммерческих агрегатора и еще 1 орк

чтобы протестировать, как сработает кластеризатор или запрос, с которым у Вас возникли трудности?

Агентство "Семен Ядрен" ( https://semen-yadren.com )
yanus
На сайте с 21.01.2009
Offline
348
#10
bossgs:

чтобы протестировать, как сработает кластеризатор или запрос, с которым у Вас возникли трудности?

Ford Focus для примера

123 4

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий