st-key

Рейтинг

Регистрация

13.09.2010

Key Collector - автоматизированная система анализа семантического ядра. Часть 2

29 декабря 2010, 00:05

Быстрый фильтр будет доступен в следующем апдейте.

Комментарий по скрину "Быстрого фильтра", - длину поля фильтра можно меньше сделать?

там ведь много символов не будет.

а вот в строке запроса желательно все вводимое видеть..

Key Collector - автоматизированная система анализа семантического ядра. Часть 2

28 декабря 2010, 08:18

Самые нужные кнопки можно закрепить в тулбаре.

о., спасибо.

Key Collector - автоматизированная система анализа семантического ядра. Часть 2

28 декабря 2010, 00:36

Подтверждаю, ред. стоп-слов периодически глючит (проблема при обходе списка стоп-слов).

jorevo поднял про юзабилити, добавлю свои 5к,

сесть и написать тз - этоже_у, не выйдет на пафос объема и, опять же_уже упомянутый в топике хором, дефицит времени. Потому, по старинке:

1) Кнопка -сбор частотностей, засунута в промежность) разноцветного ряда. Думаю, не правильно, потому как эта кнопка главная!1! в программе.

2) Выделяешь ячейку, левой мышкой тащишь выделение вниз - ок, вверх - почти не едет, почему такой дискрим "движения вверх"?

3) Собираешь слова, собираешь частоту, потом какие-то строки выделяешь /удаляешь, счетчик "Найдено результатов" не меняется. Поправите?

4) Можно, окно настроек будет запоминать /открывать то, что настраивали последним?

спасибо за 1024с и секатор

Key Collector - автоматизированная система анализа семантического ядра. Часть 2

27 декабря 2010, 02:43

MIND:
Увеличим до 1024.

спасибо.

MIND:
Изменения вступают в силу после нажатия кнопки "Сохранить" в окне настроек.

каждое изменение, конечно же, сохранялось кнопкой.

MIND:
А вот насчет логики работы что-то я не понял, как там могло работать с тем, что было до Вашего обращения :[. Днем будет апдейт.

Через кнопку "Добавить" закидывал фразы, включающие слэш "/" и точку (которые внес в поле редактора спецсимволов). Пару раз секатор срабатывал, вычищая заданные символы при добавлении фраз в таблицу. Закономерность не увидел.

Key Collector - автоматизированная система анализа семантического ядра. Часть 2

26 декабря 2010, 23:11

Доброго вс,

Пара вопросов /репортов к разработчикам:

1) Настройка (редактор) спецсимволов работает неадекватно. Добавление /исключение каких-либо символов, как и включение /выключение самого секатора по факту может происходить, а может и нет. Закономерности замечены не были. Есть еще репорт подобной баги от др. юзеров?

2) Почему строка (прямого) запроса стала принимать только 128 символов (у меня так) ??

Key Collector — автоматизированная система анализа семантического ядра

5 декабря 2010, 01:47

COKOJI:

Я пытаюсь понять адекватную нагрузку на 1 IP при безостановочном парсинге и чтобы это было недолго

Вот-вот, конкретно для ваших проектов, настройки никто лучше вас же и не подберет. Имхо, оптимум (различные_ объемы /глубина /время /терпение /целесообразность..) понятие крайне субъективное. К тому же, толерантность вордстата - величина отнюдь не статическая. Рекомендовать всем и каждому какие-то определенные цифры пауз, или определенную модель действий, полагаю, неразумно.

Давайте тут на примере....Теперь я хочу посмотреть какой у меня был изначальный свой список, какие слова я удалил/переместил. Как мне это сделать на данном этапе действий?

Вот, не могу постигнуть)), начальный то список зачем вам? Откуда бы вы его не взяли, из прошлого ли проекта, и статистики ли, из головы ли - экспромтом, он там сразу перестает существовать? Далее, если после обработки, вы что-то удалили /переместили, значит это что-то вам не нужно /нужно не здесь, нет? Если удаленные слова вычищены через стоп-слова, так они там и останутся, их список сохраняется (просили-сделали). К слову, в теме звучало еще более интересное предложение добавлять в стоп-слова через правую кнопку в главном окне.

Кроме того, по вашему примеру, --- А если вы захотите посмотреть исходный вид второй порции слов, в вашем примере "слово6 /слово7" ? Имея сохраненный стартовый список, исходный вид второй /третьей /... порции добавленных слов вы никак не увидите. И таких вариантов, чего возможно захочется, но никак не получится, можно придумать довольно много.

Может стоит попросить у разработчиков не просто сохранение начального списка, а возможность пошагового отката в окнах "приема слов"? К слову, такое в программе уже есть, но только в главном окне и только один шаг. Если сделать такое для принимающих окон, кому-то, например, вам, возможно, будет очень удобно/полезно.

Выходом из положения, вот прямо сейчас, в текущей версии 1.3.13, можно посоветовать лишь - перекидывать начальный список, в иную вкладку, "проверка релевантности" или "съем позиций", для последующего сравнения с главным окном после обработки. Все как вы и хотели)). Как то так).

Key Collector — автоматизированная система анализа семантического ядра

4 декабря 2010, 22:35

COKOJI:
Да, действительно можно и так вполне, но тогда во-первых это +1 действие, во вторых я теряю отображение исходного списка слов, который потом подвергся изменениям. Удаленные слова из исходного списка не всегда именно "плохие" слова - это могут слова перешедшие в другой список. Потому исходный список важно сохранять в памяти программы.

Ок, если начальный список вам нужен вместе с удаленными из главного окна (например, после чистки стоп-словами), он у вас сохранен в окне "приема" слов (вопрос ранее поднимался - пользователи попросили, разработчики сделали). Т.е. есть имеем /сохранены 2 списка, до и после обработки (второй легко берется из главного окна через Ctrl + C). Если же, при добавлении новой порции слов, не нужно снова парсить первый блок слов вместе с уже удаленными, просто, перед добавлением новой порции чистим окно приема (Ctrl+A работает, удобно), и новые спарсеные ключи не заменят - а добавятся в главное окно. Т.е., доступны любые варианты. В исходном же моменте, насколько я понял, Str256 предлагал синхронизировать обработанный список с начальным, нет? Мне представляется это лишним, более того, сужающим вариативность действий.

если мое многотысячное ядро состоит из совсем разных кластеров, которые я для удобства разбил на разные проекты (файлы программы) и хочу просматривать одновременно.
Так что это или вкладки или в идеале древовидная структура. Опять же это мои потребности - это может быть не всем нужно.

Если цель вкладок - чисто возможность запускать /исследовать /сравнивать сразу несколько проектов, всегда найдется тот, кому 100 вкладок будет мало, и, вот же бидабида, ну ни как не обойтись без 101. Имхо, основная прелесть вкладок будет в возможности "перекидывать" ключи из одной в другую. Вам ведь именно этого нужно? Комбинировать кластеры и т.д., да? Или упомянутая древ-структура, с возможностью по-словного переноса и общего хранения, Да, супер. Коллектор станет мега-продуктом.

Но при стандартных паузах, что указанны в программе - бан происходит где то после пары сотен слов, при постоянной их проверке по всем 3-м частотам статистики Директа.
В то время как Александр на своем семинаре говорил, что паузы позволяют работать стабильно с программой при сборе и порядков в тысячи запросов.

Подтверждаю. Тысячи запросов. Но очень долго - естественные издержки безостановочного парсинга.

Плюс мне кажется что рекомендации по наиболее удобной работе с программой позволят ее лучше продавать - так что это дело не только сугубо личное.

Тут фикус в том, что профилей поведения в использовании программы - масса. Кей-миллионерам нужны диапазоны пауз от 3000 до 4000,5000, прокси_антигейты. А тем, кому нужно быстро-быстро снять стату по 5 словам, причем в единичном значении, без расширения списка, им почти без пауз можно.. И куча пользователей, в поведенческом диапазоне между. Например, имеющим динамический ip, проще, оптимальней чистить куки, менять ip, чем развлекать себя длинными паузами - долгим парсингом. Что, как будет удобно именно вам, имхо, определять, искать также, именно вам. На месте разработчиков, я бы дал одну-единственную, но универсальную инструкцию - пробуйте по-разному.

Key Collector — автоматизированная система анализа семантического ядра

4 декабря 2010, 19:22

COKOJI:

то при изменении текущего списка удаленные слова из изначального списка опять появятся - и это нарушает последовательный процесс

может, просто очищать окна "Свой список" /"Парсить Яндекс" перед добавлением новой порции слов на обработку? Ведь логичней, нет? Личное мнение, превращать простое окно "подачи" слов, в синхронизируемый модуль, совершенно излишне.

сейчас приходится запускать программу вручную столько раз, сколько создано проектов.

А смысл? Для множества проектов, ручная последовательная обработка не сильно уступает в скорости параллельной (работа, с теми же стоп-словами организована достаточно удобно, + их автоматическое сохранение).

При автоматическом же сборе данных, при множестве, одновременно запущенных проектов, вы лишь увеличите количество запросов с вашего ip. В этом случае, без прокси, вас ни какие паузы не спасут от капчти или бана ip. Опять же, личное мнение, но работа со множеством проектов одновременно, есть вселен.. управленческое зло, приемлемое лишь в сравнительных целях, в крайне редких случаях.

Еще не помешали бы ваши рекомендации относительно настройки пауз.....
И по самим прокси тоже интересно - сколько нужно IP, чтобы ни в чем себе не отказывать при парсинге десятков тысяч запросов в день, без длительных пауз.

Обычно как делают (в том числе и разработчики)? Просто пробуют, и так, и этак, экспериментируют. Может и вам также? А в следующем сообщении рассказать, привести цифры всем интересующимся. Все юзеры данной программы будут вам очень благодарны.

Key Collector — автоматизированная система анализа семантического ядра

27 ноября 2010, 16:44

уже одолжили? или чем больше тем лучше?

Key Collector — автоматизированная система анализа семантического ядра

25 ноября 2010, 21:37

функция, которая позволяет не снимать частотки " " и "!" для слов, у которых базовая частотность ниже установленного значения.

да, но причина предложения именно в (постоянном, долгом) и совершенно НЕнужном первом (!), стартовом (!) сборе ключей с микрочастотностью (и число им тыщщи). Убрать такие ключи, не забивать им "" и "!" можно и руками, это быстро и несложно. Но вот собирать их сначала, т.е. собирать и ждать, ждать и собирать, чтобы потом легким движением руки удалить нафиг... это да, доставляет. Вордстат опять же, напрасно напрягаем, ну и каптча там всякая..

Ваше предложение будет учтено в 2.0

замечательно. ждем).

1 2 3 4 5 6 7 8 9 10 11

Всего: 102

VK приобрела 70% в структуре компании-разработчика red_mad_robot

Что делать, если ваша email-рассылка попала в спам

st-key