Чем сделать кластеризацию запросов?

123
[Удален]
#11
Miha Kuzmin (KMY):
Некратко: /ru/articles/24456

самое прикольное, что это ни как не противоречит автоматизации на основе топа ;)

asp1rin76
На сайте с 01.07.2016
Offline
10
#12

Поддерживаю точку зрения про то, что кластеризировать СЯ онлайн - самоубийство.

Не рекомендую онлайн сервисы кластеризации СЯ.

Для проверки конкурентности запросов пользуюсь - Мутаген (http://mutagen.ru/?r=58139)
[Удален]
#13
burunduk:
самое прикольное, что это ни как не противоречит автоматизации на основе топа

Самое прикольное, что это "хвост виляет собакой". То есть следствие - причиной. Уже давно все обсудили, а все виновата твоя параноя про соцсети, мог бы сам участвовать в сраче.

[Удален]
#14
Miha Kuzmin (KMY):
Уже давно все обсудили, а все виновата твоя параноя про соцсети, мог бы сам участвовать в сраче.

да ради бога, мне незачем участвовать в срачах, я знаю как это работает и что именно работает

я тебе больше скажу, когда я это придумывал в каком-то лохматом году, это уже тогда работало не по принципу поиска максимального пересечения запросов на документах, это только самое начало - отправная точка и то с огромным количеством ограничений

[Удален]
#15

Сам себя не похвалишь - никто не похвалит :)

Фома
На сайте с 10.11.2006
Offline
600
#16

Miha Kuzmin (KMY), Мих, я наверное тупейший вопрос сейчас задам и всё же. Стоит ли продвигать запросы:

слоны Африки

зелёные слоны Африки

зелёные слоны Африки с хоботом

зелёные слоны Африки с хоботом и хвостом

на разных страницах? Или пихаем всё на одну и качаем ссылочным?

Аренда апартаментов на Тенерифе (http://las-americas.ru/).
[Удален]
#17

Фома, зависит от ситуевины. Обычно конкретику лучше вынести на подстраницы, и всегда выносить - если они разные бывают (допустим, кроме хобота еще есть подгруппа с пятячком).

Фома
На сайте с 10.11.2006
Offline
600
#18
Miha Kuzmin (KMY):
они разные бывают (допустим, кроме хобота еще есть подгруппа с пятячком).

Не, разговор сейчас только о полном поглощении ключа, т.е. полное совпадение слов.

Ну вощем понял, лучше отдельно. Тем более речь о дорах. 🍿

iLeg0
На сайте с 12.08.2010
Offline
59
#19

А почему бы не использовать алгоритмы кластеризации из машинного обучения, используя в формуле метрики несколько разных параметров: семантическое сходство (doc2vec, к примеру), сходство топа, классы запроса (коммерческость, геозависимость и т.д.)?

По мне так существующие решения онлайн кластеризации хреновы еще и тем, что дробят на группы, но они перемешаны (проблема полностью не решается). Можно еще как минимум выстроить иерархию групп (чтобы похожие кластеры находились рядом).

[Удален]
#20

Miha Kuzmin (KMY), ты же ни когда не обрабатывал 1лям+ запросов?

ну ты конечно можешь сесть и поработать ручками, только пока ты это сделаешь твой результат уже будет неактуальным, а самое интересное он будет содержать очень большое количество ошибок - ты просто не сможешь всё учесть 🤪

P.S. почему-то все забывают о том что изначально кластеризация по топу предназначена не для разбития запросов по страницам, а для автоматической очистки от шлака большого количества данных, полученных из различных источников, без насилования вордстата ;)

123

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий