Парсинг НЧ

O7
На сайте с 09.11.2011
Offline
79
803

Всем привет! Такой вопрос, есть необходимость парсить свежие нч, например из вордтрэкера.

Как я понимаю, что для получения нч, необходимы определенные исходные данные.

Исходные данные - это небольшие тематические базы кеев следующего вида:

1. Предположим у нас есть категория компьютеры.

2. У этой категории есть множество под категорий (железо, мониторы, софт)

3. К примеру мы берем категорию железо, там тоже много под категорий (процессоры, мат. платы, память..)

4. Берем например процессоры. И для этой категории нам надо спарсить нч.

т.е для получения нч по категории процессоры, нам мало ввести в вордтрекер кей - процессоры, нам нужно ввести кей "процессоры Intel" или "процессоры AMD" или просто Intel и AMD.

т.е для каждой категории нам необходимы определенные конечные исходные данные, на основе которых мы бы могли получать свежие нч.

Кто разбирается в теме, скажите, я правильно понимаю ситуацию ?

Возможно у кого-то есть подобные наработки, и он бы смог ими поделиться ?

Или может кто-нибудь даст совет, по поводу источника таких исходных данных ?

Был бы очень благодарен за любую помощь, совет. Возможно кто-то работает в этом же направлении и мы бы могли пообщаться ?

R7
На сайте с 09.11.2010
Offline
10
#1

я конечно не очень в этом деле, но можешь делать так, спарсить кеи по запросу "процессоры" тебе оно выдало, руками чистишь и оставляешь те которые нужно, потом этот список загоняешь опять в парсер и парсишь опять. Первый раз ты спарсишь кеи типа "процессоры AMD", второй уже более нч запросы.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий