Key Collector - автоматизированная система анализа семантического ядра. Часть 5.

d4k
На сайте с 02.03.2010
Offline
146
d4k
#921

Такое есть, но результат выдет булево значение (да/нет)

И вопрос от меня. Вот я напарсил себе кучу поисковых подсказок, а как из них фильтрануть исключительно 2х-словники ? Мануал в этом не помог... Может какое-то регулярное выражение?

MyOST
На сайте с 22.01.2006
Offline
559
#922

wq21, рассмотрим еще раз

dr_dimaz, промониторим

Relapse:
спецы по софту, подскажите, возможно ли спарсить из liveinternet информацию "по поисковым фразам" из всех сайтов с открытой статистикой из определенной категории?

парсите базу сайтов, затем парсите каждый из них.

Затем примерно на 2-3м большом счетчике лайвинтернет банит ваш ип на 1 час, при повторных попытках банит нахрен навсегда :)

ssh1:
Можно ли как-то с помощью KeyCollector определять правильный порядок слов в запросе?

да, выше показали как

ssh1:
Есть ли это в KeyCollector?
Если нет - то можно ли реализовать?

есть, но учтите - что это вероятностный характер! А не 100% результат.

Отрабатывает нормально более или менее на коммерческих тематиках.

d4k:
И вопрос от меня. Вот я напарсил себе кучу поисковых подсказок, а как из них фильтрануть исключительно 2х-словники ? Мануал в этом не помог... Может какое-то регулярное выражение?

Легко, мы даже регулярки в фильтры зашили :) - специально для удобства

Блог (http://seom.info/) | Ты уже SEO профессионал? (http://www.key-collector.ru/) Развиваем семантику более 8 лет! ()
S1
На сайте с 07.06.2008
Offline
30
#923

Вопрос к создателям программы:

А где можно найти какое-либо описание принципа работы кнопок определения корректности запроса (по подсказкам и по поиску вроде) ?

draft666
На сайте с 09.08.2009
Offline
37
#924

MyOST, Ваш блог периодически лежит... хотелось бы узнать Вы обновили мануал по кей коллектору?

Меня знают многие, но лишь единицы знают, какой я на самом деле...
d4k
На сайте с 02.03.2010
Offline
146
d4k
#925
MyOST:

Легко, мы даже регулярки в фильтры зашили :) - специально для удобства

С регулярками знаком поверхностно. А вот необходима выборка иммено 2-хсловников. В фильтре же опция "как минимум 2.." т.е. выдает и 3 и 4-словные ключи.

MIND
На сайте с 08.03.2007
Offline
238
#926
d4k:
Такое есть, но результат выдет булево значение (да/нет)


Оно не только булево выдает. Если в слове "ошибка" и стоит "нет", то в контекстном меню ячейки можно применить правильный вариант. Т.е. "сопоги" будет исправлено на "сапоги".

Key Collector - автоматизированная система анализа семантического ядра (/ru/forum/863504)
MyOST
На сайте с 22.01.2006
Offline
559
#927
draft666:
Ваш блог периодически лежит...

Эм... не вижу ни по чекерам ни сам...

403? - это бан IP

Если 503- то в логах гляну

ssh1:
А где можно найти какое-либо описание принципа работы кнопок определения корректности запроса (по подсказкам и по поиску вроде) ?

По поисковым подсказкам. Условно - если есть, значит запрос есть. Другого алгоритма правильного пока не придумано, хотя он несколько больше, чем я описал тут

draft666:
хотелось бы узнать Вы обновили мануал по кей коллектору?

нет, не на этой неделе, на следующей

S1
На сайте с 07.06.2008
Offline
30
#928

Можно ли реализовать функционал подбора правильного порядка слов?

То есть , если есть запрос из 3 слов, скармливаем подсказкам все перестановки первых 2 слов, если 3 слово находится - значит запрос правильный.

MIND
На сайте с 08.03.2007
Offline
238
#929
d4k:
С регулярками знаком поверхностно. А вот необходима выборка иммено 2-хсловников. В фильтре же опция "как минимум 2.." т.е. выдает и 3 и 4-словные ключи.

^(\S+?\s\S+?)$

MIND добавил 11.11.2011 в 14:06

dr_dimaz:
А что то у меня в "Парсинг из правой колонки водрстата" - перестала работать галочка "Собирать данные из левой колонки" - все равно собирает из правой.

Пример запроса в личку можно? Проверил на "окна" - все работает как надо. Спасибо.

berserkus
На сайте с 14.04.2009
Offline
101
#930

сделайте плиз в следующем релизе пару параметров для прокси чекера

1 - таймаут с выбором параметра, тупые прокси только время отнимают

2 - многопоточность, 20-50 за раз чекалось

"Развивайте свой сайт", - сказал Яндекс, "Развивайте свои алгоритмы", - сказали вебмастера и ушли в гугл... (-=ber$erk=-)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий