Yandex Wordstat Parser - функциональный парсер wordstat Яндекса

1 234
MyOST
На сайте с 22.01.2006
Offline
559
#21
TyT:
Некоторые кеи с "слово" и "!слово" очень разнятся. К примеру выдает цифры 2298 и 5. На лицо явная ошибка в логике, прокомментируйте пожалуйста. Это конечно редкость но все же. Какой цифре тогда верить ?

верить цифре с ! - это учет морфологии, http://seom.info/2010/07/27/webinar/ в презентации к вебинару есть пример отмеченный красным, который показывает "пустышки" или слова с большой накруткой

TyT:
Для запросов "смотреть клипы", "смотреть мультфильмы онлайн" - сезонные, а так же множество других. Как определяется сезонность в программе ?

wordstat

http://wordstat.yandex.ru/?cmd=months&page=1&ts=1280314289&key=f10e9039479c2a8529f37051e96382d8&text=%D1%81%D0%BC%D0%BE%D1%82%D1%80%D0%B5%D1%82%D1%8C%20%D0%BA%D0%BB%D0%B8%D0%BF%D1%8B

http://wordstat.yandex.ru/?cmd=months&scmd=abs&text=%D1%81%D0%BC%D0%BE%D1%82%D1%80%D0%B5%D1%82%D1%8C+%D0%BC%D1%83%D0%BB%D1%8C%D1%82%D1%84%D0%B8%D0%BB%D1%8C%D0%BC%D1%8B+%D0%BE%D0%BD%D0%BB%D0%B0%D0%B9%D0%BD&geo=&text_geo=

Вот только сезонности я тут не вижу, хотя программа определяет. Здесь планомерный рост :(

Блог (http://seom.info/) | Ты уже SEO профессионал? (http://www.key-collector.ru/) Развиваем семантику более 8 лет! ()
S2
На сайте с 07.01.2008
Offline
611
#22
MyOST:
в презентации к вебинару

А чем надо проосматривать эту презентацию, после распаковки архива там папки в основном с xml документами, а не ppt pdf как обычные презентации.

Не надо приписывать мне свои выводы, я имею ввиду только то, что написал. Лучшая партнёрка по футболкам/толстовкам (http://partnerka.kolorado.ru/?ref=1921540) Опрос: Проверить текст на уник - как? (/ru/forum/495885)
MyOST
На сайте с 22.01.2006
Offline
559
#23
Str256:
А чем надо проосматривать эту презентацию, после распаковки архива там папки в основном с xml документами, а не ppt pdf как обычные презентации.

архив? там pptx - офис 2007

http://seom.info/downloads/rookee-myost.ppt выложил для офиса 2003

когда архив вебинара выложат, видео, тогда будет более понятно, т.к. не только тезисы будут

S2
На сайте с 07.01.2008
Offline
611
#24
MyOST:
архив? там pptx - офис 2007

Нет там: rookee-myost.zip Потому и вопрос возник.

MyOST
На сайте с 22.01.2006
Offline
559
#25
Str256:
Нет там: rookee-myost.zip Потому и вопрос возник.

ясно, косяк переадресации видимо, файл был pptx. изменил в посте на 2003 ссылку

S2
На сайте с 07.01.2008
Offline
611
#26
MyOST:
http://seom.info/downloads/rookee-myost.ppt выложил для офиса 2003

Лучше не стало. Microsoft Office PowerPoint 2007 его не открывает. OpenOffice - пишет ошибку

MyOST
На сайте с 22.01.2006
Offline
559
#27

Str256, мой косяк, залил не в том режиме. Обновил

MyOST:
в презентации к вебинару есть пример отмеченный красным, который показывает "пустышки" или слова с большой накруткой

речь про слайд с

где есть 3 словосочетания для отсева

S2
На сайте с 07.01.2008
Offline
611
#28

MyOST, а как насчёт % 3 колонки от 1-й. Т.е. в данном случае для красной строчки:

3125 | 747 | 81 | 2,6%

И в дальнейшем можно просто отсортировать данные по колонке с %, и убрать слишком низкие значения.

Ещё вопрос как отключить сбор информации по тем колонкам, которые не нужны в настоящее время.

И ещё программа у меня попрежнему не работает. Скачивал с официалшьной страницы сайта. обновление от 27.07 Версия как ни странно попрежнему 1.0.0.0 Пробовал разные ключи.

28.07.2010 16:45:56: программа запущена

28.07.2010 16:46:39: процесс парсинга общей статистики слов начат

28.07.2010 16:46:44: URL (http://wordstat.yandex.ru/?cmd=words&page=1&text=%D0%BC%D0%BE%D0%BB%D0%BE%D0%BA%D0%BE&geo=1%2C213%2C214%2C215%2C10734%2C20728%2C10745%2C10747%2C217%2C10752%2C10754%2C219%2C10765&text_geo=) содержит ошибки. Повторная попытка (1) проанализировать страницу

28.07.2010 16:46:48: URL (http://wordstat.yandex.ru/?cmd=words&page=1&text=%D0%BC%D0%BE%D0%BB%D0%BE%D0%BA%D0%BE&geo=1%2C213%2C214%2C215%2C10734%2C20728%2C10745%2C10747%2C217%2C10752%2C10754%2C219%2C10765&text_geo=) содержит ошибки. Повторная попытка (2) проанализировать страницу

28.07.2010 16:46:51: URL (http://wordstat.yandex.ru/?cmd=words&page=1&text=%D0%BC%D0%BE%D0%BB%D0%BE%D0%BA%D0%BE&geo=1%2C213%2C214%2C215%2C10734%2C20728%2C10745%2C10747%2C217%2C10752%2C10754%2C219%2C10765&text_geo=) содержит ошибки. Повторная попытка (3) проанализировать страницу

28.07.2010 16:46:53: URL (http://wordstat.yandex.ru/?cmd=words&page=1&text=%D0%BC%D0%BE%D0%BB%D0%BE%D0%BA%D0%BE&geo=1%2C213%2C214%2C215%2C10734%2C20728%2C10745%2C10747%2C217%2C10752%2C10754%2C219%2C10765&text_geo=) содержит ошибки. Повторная попытка (4) проанализировать страницу

28.07.2010 16:46:56: URL (http://wordstat.yandex.ru/?cmd=words&page=1&text=%D0%BC%D0%BE%D0%BB%D0%BE%D0%BA%D0%BE&geo=1%2C213%2C214%2C215%2C10734%2C20728%2C10745%2C10747%2C217%2C10752%2C10754%2C219%2C10765&text_geo=) содержит ошибки. Повторная попытка (5) проанализировать страницу

28.07.2010 16:46:59: URL (http://wordstat.yandex.ru/?cmd=words&page=1&text=%D0%BC%D0%BE%D0%BB%D0%BE%D0%BA%D0%BE&geo=1%2C213%2C214%2C215%2C10734%2C20728%2C10745%2C10747%2C217%2C10752%2C10754%2C219%2C10765&text_geo=) содержит ошибки. Повторные попытки не дали результатов

28.07.2010 16:46:59: процесс парсинга общей статистики слов закончен

28.07.2010 16:47:53: процесс парсинга общей статистики слов начат

28.07.2010 16:47:53: URL (http://wordstat.yandex.ru/?cmd=words&page=1&text=%D0%B2%D1%8B%D1%81%D1%82%D0%B0%D0%B2%D0%BA%D0%B8&geo=1%2C213%2C214%2C215%2C10734%2C20728%2C10745%2C10747%2C217%2C10752%2C10754%2C219%2C10765&text_geo=) содержит ошибки. Повторная попытка (1) проанализировать страницу

28.07.2010 16:47:57: URL (http://wordstat.yandex.ru/?cmd=words&page=1&text=%D0%B2%D1%8B%D1%81%D1%82%D0%B0%D0%B2%D0%BA%D0%B8&geo=1%2C213%2C214%2C215%2C10734%2C20728%2C10745%2C10747%2C217%2C10752%2C10754%2C219%2C10765&text_geo=) содержит ошибки. Повторная попытка (2) проанализировать страницу

28.07.2010 16:47:59: URL (http://wordstat.yandex.ru/?cmd=words&page=1&text=%D0%B2%D1%8B%D1%81%D1%82%D0%B0%D0%B2%D0%BA%D0%B8&geo=1%2C213%2C214%2C215%2C10734%2C20728%2C10745%2C10747%2C217%2C10752%2C10754%2C219%2C10765&text_geo=) содержит ошибки. Повторная попытка (3) проанализировать страницу

28.07.2010 16:48:03: URL (http://wordstat.yandex.ru/?cmd=words&page=1&text=%D0%B2%D1%8B%D1%81%D1%82%D0%B0%D0%B2%D0%BA%D0%B8&geo=1%2C213%2C214%2C215%2C10734%2C20728%2C10745%2C10747%2C217%2C10752%2C10754%2C219%2C10765&text_geo=) содержит ошибки. Повторная попытка (4) проанализировать страницу

28.07.2010 16:48:07: URL (http://wordstat.yandex.ru/?cmd=words&page=1&text=%D0%B2%D1%8B%D1%81%D1%82%D0%B0%D0%B2%D0%BA%D0%B8&geo=1%2C213%2C214%2C215%2C10734%2C20728%2C10745%2C10747%2C217%2C10752%2C10754%2C219%2C10765&text_geo=) содержит ошибки. Повторная попытка (5) проанализировать страницу

28.07.2010 16:48:18: URL (http://wordstat.yandex.ru/?cmd=words&page=1&text=%D0%B2%D1%8B%D1%81%D1%82%D0%B0%D0%B2%D0%BA%D0%B8&geo=1%2C213%2C214%2C215%2C10734%2C20728%2C10745%2C10747%2C217%2C10752%2C10754%2C219%2C10765&text_geo=) содержит ошибки. Повторные попытки не дали результатов

28.07.2010 16:48:18: процесс парсинга общей статистики слов закончен

MyOST
На сайте с 22.01.2006
Offline
559
#29
Str256:
Ещё вопрос как отключить сбор информации по тем колонкам, которые не нужны в настоящее время.

изначально он чисто частотку парсит, если свой список - то частотку для всех 3х колонок.

Я думаю предусмотрим остановку и начало парсинга в новой версии.

Str256:
И ещё программа у меня попрежнему не работает.

фреймворк какой? система?

Str256:
MyOST, а как насчёт % 3 колонки от 1-й. Т.е. в данном случае для красной строчки:
3125 | 747 | 81 | 2,6%

поясни про 2,6, а про сортировку и удаление я понял

S2
На сайте с 07.01.2008
Offline
611
#30
MyOST:
фреймворк какой? система?

ХР Хоме лицензионная 2,5. Т.е. 2-й сервис пак и 3-й выборочно. В списке установленных программ 3.5 не значится. Но помню что ставил его года полтора назад, когда надо было запустить одну программу. И сейчас проги требующие 3.5 запускаются кроме вашей. Пока его не было, они вообще не запускались, сразу ошибку писали. А ваша запускается, только не парсит.

1 234

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий