Группировка запросов. Бесплатное тестирование сервиса.

1 234
G
На сайте с 03.02.2012
Offline
56
#21

Очень интересная проблема, так как самому приходится разбивать огромные кучи запросов. Уверен если ваш скрипт довести до ума то он будет очень популярен. Как стать зарегистрированным пользователем?

Вы морфологию проверяете (синий пиджак, синие пиджаки)? Если нет, то могу вас подкинуть полезной инфы.

P
На сайте с 25.05.2007
Offline
103
#22

Gavich, спасибо.

Морфологию проверять нет нужды, это решается на стороне яндекса.

Зарегистрироваться пока никак. Не потому, что я жадный, а потому, что лимит XML запросов не слишком велик.

И именно по этой же причине скрипт работает лишь с 8 вечера.

coolakov.ru/tools (http://coolakov.ru/tools/): определение конкурентов (http://coolakov.ru/tools/most_promoted/), кластеризация запросов (http://coolakov.ru/tools/razbivka/) и т.д.
G
На сайте с 03.02.2012
Offline
56
#23

А если дать возможность пользователю вводить свои акаунты и прокси, как в кей коллекторе?

Есть ли возможность указать максимальное количество групп, максимальное количество фраз в группе?

[Удален]
#24

IBakalov, а что в этом плохого? :)

IBakalov
На сайте с 05.10.2011
Offline
218
#25

burunduk, да на самом деле ничего плохого нет :) в прошлый раз вы уследили, что по seohide был дан не верный пруф, сейчас вот тут :) У вас мониторинг настроен? ;)

[Удален]
#26

IBakalov, нет, просто читаю, то что может оказаться потенциально интересным :)

G
На сайте с 03.02.2012
Offline
56
#27

Прогнал вчера 200 фраз по "skechers" (бренд обуви) по региону Украина. Разбивка поучилась слабенькой. Скорее всего из-за низкой частотности фраз: половина с частотностью 1, 90% до 10. Не отнесло в одну категорию фразы с транслитом-переводом бренда+слово. Думаю проблема в том что довольно мало страниц соответствую данным запросам и текстов как таковых на посадочных страницах нету. Если ваш алгоритм можно обучать на выборках, то могу вам скинуть ручные разбиения.

K
На сайте с 02.08.2010
Offline
126
#28

pimandr, топ10 - это техническое ограничение или есть какой-то умысел?

Планируется ли софт на продажу?

IBakalov
На сайте с 05.10.2011
Offline
218
#29

Вот кстати у меня вопрос возник, как будет сгруппировано, если:

По [запрос1] в выдаче есть

site1

site2

site3

site4

site5

По [запрос2] в выдаче есть

site3

site4

site5

site6

site7

site8

По [запрос3] в выдаче есть

site6

site7

site8

site9

site10

У 1 и 3 запросов нет пересечений вообще, у 1 и 2 есть три пересечения, у 2 и 3 тоже три, как объединять?

P
На сайте с 25.05.2007
Offline
103
#30
Gavich:
Есть ли возможность указать максимальное количество групп, максимальное количество фраз в группе?

Зачем? Вот вы вводите 10 запросов и хотите чтоб они разбились на 2 группы. А на деле они разбиваются на 4. Как и, главное, зачем они должны биться на 2?

Gavich:
Прогнал вчера 200 фраз по "skechers" (бренд обуви) по региону Украина. Разбивка поучилась слабенькой. Скорее всего из-за низкой частотности фраз: половина с частотностью 1, 90% до 10. Не отнесло в одну категорию фразы с транслитом-переводом бренда+слово. Думаю проблема в том что довольно мало страниц соответствую данным запросам и текстов как таковых на посадочных страницах нету. Если ваш алгоритм можно обучать на выборках, то могу вам скинуть ручные разбиения.

Перепроверил ваши запросы, действительно слабенько. Но дело не в частотности. Суть примерно в том, что когда в одной группе более определенного количества слов, то последующие слова добавляются в группу по слишком жестким критериям. Из-за чего в вашем случае "сапоги скетчерс", "скетчерс купить", "skechers купить" объединились, а вот "сапоги skechers" уже "не влезли" в группу. То есть, дело не в транслите вовсе.

Большое спасибо за пример, он мне очень поможет.

Алгоритм пока не обучаем, пока обучаюсь лишь я:)

IBakalov:
У 1 и 3 запросов нет пересечений вообще, у 1 и 2 есть три пересечения, у 2 и 3 тоже три, как объединять?

Над этим вопросом я тоже очень долго заморачивался:) Не знаю, каким должно быть правильное решение, и есть ли оно вообще. Но у меня они объединяются. Я рассуждал так: раз уж 2 пересекается и с 1 и с 3, то оч мала вероятность того, что 1 и 3 окажутся взаимовытесняющими. Мои личные проверки показали, что это более-менее разумно.

Разумеется, в этой логике есть косяки. Примерно по этой причине сер4ер посчитал скрипт уг

Если вы предложите какой либо альтернативный способ, как поступать в подобных случаях - с удовольствием поэкспериментирую.

Kamysh:
Топ10 - это техническое ограничение или есть какой-то умысел?

Техническое ограничение - топ100. Топ10 - это наиболее приемлемый и достаточный способ объединения. Экспериментировал с топ20 и 50 - преимуществ не увидел, а сложность работы возрастает значительно. Хотя burunduk в этом вопросе со мной наверняка не согласится:)

1 234

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий