Key Collector - автоматизированная система анализа семантического ядра. Часть 4.

MIND
На сайте с 08.03.2007
Offline
238
#1001
Str256:
Я заметил, что парсинге ключей, зачем-то ещё в таблицу добавляется частотность. А зачем? Если надо, я после отсева слов, запущу проверку частотности для оставшихся.

И ещё пишется к примеру:

А никакой фразы в кавычках нет. А этих фраз много.

Если что, у меня не последняя версия...

В актуальных версиях в кавычках есть само слово. А насчет частотностей - они на той же странице, так почему бы их сразу не забрать? Чтобы потом лишнюю нагрузку не создавать.

Key Collector - автоматизированная система анализа семантического ядра (/ru/forum/863504)
S2
На сайте с 07.01.2008
Offline
611
#1002

Ой, сбой наверно какой-то был. Только для этих 2-х слов в кавычках ничего не было, для остальных ключей - ключи в кавычках есть.

Парсингом ключей через коллектор раньше не занимался, использовал готовые списки ключей из других программ. Поэтому такой вопрос. Я сразу не задал список стоп-слов в итоге - 90% мусора получилось, можно его отфильтровать задав стоп-слова? Или уже отпарсенные ключи не фильтруются на стоп-слова?

Не надо приписывать мне свои выводы, я имею ввиду только то, что написал. Лучшая партнёрка по футболкам/толстовкам (http://partnerka.kolorado.ru/?ref=1921540) Опрос: Проверить текст на уник - как? (/ru/forum/495885)
MyOST
На сайте с 22.01.2006
Offline
559
#1003
Str256:
Я сразу не задал список стоп-слов в итоге - 90% мусора получилось, можно его отфильтровать задав стоп-слова? Или уже отпарсенные ключи не фильтруются на стоп-слова?

мона, все мона :)

Блог (http://seom.info/) | Ты уже SEO профессионал? (http://www.key-collector.ru/) Развиваем семантику более 8 лет! ()
SS
На сайте с 15.07.2009
Offline
65
#1004

В последние дни постоянно натыкаюсь на подобные ошибки:

17.08.2011 22:20:36: процесс парсинга поисковых подсказок для запроса "медико-диагностический центр" с Yandex начат
17.08.2011 22:20:36: процесс парсинга поисковых подсказок для запроса "медико-диагностический центр" с Google начат
17.08.2011 22:21:05: ошибка NetworkMethods.LoadPage: Невозможно соединиться с удаленным сервером
17.08.2011 22:21:05: при парсинге подсказок Yandex возникла ошибка. Выполняем повторную (1) попытку загрузить информацию
17.08.2011 22:21:32: ошибка NetworkMethods.LoadPage: Невозможно соединиться с удаленным сервером
17.08.2011 22:21:32: при парсинге подсказок Google возникла ошибка. Выполняем повторную (1) попытку загрузить информацию
17.08.2011 22:21:53: Ошибка парсинга поисковых подсказок Google
17.08.2011 22:23:11: ошибка NetworkMethods.LoadPage: Невозможно соединиться с удаленным сервером
17.08.2011 22:23:11: при парсинге подсказок Yandex возникла ошибка. Выполняем повторную (2) попытку загрузить информацию
17.08.2011 22:23:32: ошибка NetworkMethods.LoadPage: Невозможно соединиться с удаленным сервером
17.08.2011 22:23:32: при парсинге подсказок Yandex возникла ошибка. Выполняем повторную (3) попытку загрузить информацию
17.08.2011 22:24:18: ошибка NetworkMethods.LoadPage: Базовое соединение закрыто: Соединение было неожиданно закрыто.
17.08.2011 22:24:18: при парсинге подсказок Yandex возникла ошибка. Повторные попытки не дали результатов. Проверьте качество соединения и работу сервисов. Процесс прерван
17.08.2011 22:24:18: Ошибка парсинга поисковых подсказок Yandex

Думал дело в прокси, но и без них такая же проблема.

MyOST
На сайте с 22.01.2006
Offline
559
#1005

SeoSub, ответ написан в логе.

Да, периодически системы тоже висят и до них не достучаться.

SS
На сайте с 15.01.2007
Offline
54
SrS
#1006

Не могу спарсить метрику, пробовал два разных аккаунта, в т.ч. свеже-созданный, давал полные права для тест.

Ошибка следующая:

17.08.2011 23:40:00: при загрузке главной страницы панели Yandex.Metrika возникла ошибка. Выполняем повторную (2) попытку загрузить информацию

17.08.2011 23:40:33: ошибка NetworkMethods.LoadPage: The operation has timed out

17.08.2011 23:40:33: при загрузке главной страницы панели Yandex.Metrika возникла ошибка. Повторные попытки не дали результатов. Проверьте качество соединения и работу сервисов. Процесс прерван

17.08.2011 23:40:33: процесс сбора статистики счетчика Yandex.Metrika завершен

Что я делаю не так?

Пару последних страниц топика честно просканил на наличие ошибок по метрике :)

S2
На сайте с 07.01.2008
Offline
611
#1007

А можно, чтобы фильтровались слова с е и ё, если указан в стоп-словах 1-н вариант.

А том многие неправильно запросы пишут и в итоге разными вариантами написания приходится список захламлять...

съёмка

съемка

отчёты

отчеты

приёме

приеме

и т.п.

[Удален]
#1008

не могу сообразить

после того как я напарсил энное количество фраз - как мне сделать например выборку только фраз состоящих из 4 слов, или же из 3 слов и более, или же из фраз в диапазоне от 3 до 5 слов?

есть ли такая функция? если есть то где, не могу осилить =) если нет - надо =)

MyOST
На сайте с 22.01.2006
Offline
559
#1009
SrS:
Что я делаю не так?

попробуйте поставить не выгрузку квартала, не года, т.к. на год долго делает

Str256:
А можно, чтобы фильтровались слова с е и ё, если указан в стоп-словах 1-н вариант.

не думаю что это правильно, ибо разные ключи могут попасть. Хочется с ё удалить, а вылезет и е тоже

Мехалоч:
как мне сделать например выборку только фраз состоящих из 4 слов, или же из 3 слов и более, или же из фраз в диапазоне от 3 до 5 слов?

фильтровать регуляркой или слова содержащие Nпробелов

Fruit
На сайте с 15.07.2008
Offline
166
#1010
MyOST:
фильтровать регуляркой или слова содержащие Nпробелов

N-1 пробелов :)

извините, просто очень захотелось написать

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий