Система сбора инфы в инете

P
На сайте с 03.06.2003
Offline
8
9976

Нужна система которая периодически ходит по определенным сайтам и скачивает к себе инфу по какому-либо шаблону. При этом она-же лазает по инету, предположим дает запросы на поисковых серверах и обрабатывает полученные ссылки, и включает некоторые из сайтов в дальнейшую обработку или нет и это по заданным правилам. Всю скачаную инфу она сортирует и складывает в нужное место, а там сидит человек и уже в ручную фильтрует....

Есть-ли такое? Где глянуть? Или где ковырять чтобы сделать такое?

Нужна любая инфа по этой теме.

Станислав
Григорий Селезнев
На сайте с 25.09.2001
Offline
298
#1

очень полезная штука ;-))

P
На сайте с 03.06.2003
Offline
8
#2

И это все что есть по такой теме?

!Иван FXS
На сайте с 16.11.2001
Offline
119
#3

Такую "Антилопу Гну" можно собрать своими руками из деталей от швейной машины "Зингер" ... А именно - внутри MS Access.

НП, Иван FXS.

NL
На сайте с 29.01.2003
Offline
212
#4
А ... внутри MS Access

Тут уж каждый изголяется как умеет или на тех инструментах, которые лучше знает. Но только кажеться мне, что люди для своих целей пишут не одну большую и универсальную программу, а создают(или скачивают) некие тулзы, которые потом скопом и работают. Маленькой подзадаче - своя тулза, так оно привычнее как-то.

!Иван FXS
На сайте с 16.11.2001
Offline
119
#5
Но только кажеться мне, что люди для своих целей пишут не одну большую и универсальную программу, а создают(или скачивают) некие тулзы, которые потом и работают.

Дык, MS Access - это в моем понимании и есть та "большая и универсальная* программа", которую надо не писать самому, а просто освоить и использовать.

А вот как Вы будете обеспечивать, чтобы надерганные из разных месты тулзы "работали скопом" - это мне не понятно!

НП, Иван FXS.

_______________

* универсальная - умеет, например, вызывать IE, "посылать" его по нужному адресу и забирать у него то, что он на этом адресе надыбал.

NL
На сайте с 29.01.2003
Offline
212
#6
А вот как Вы будете обеспечивать, чтобы надерганные из разных месты тулзы "работали скопом" - это мне не понятно!

Чтобы ответить на этот вопрос, потребуется ответить на несколько промежуточных вопросов - что это будут за утилиты, сколько их будет? А вот чтобы ответить уже на эти вопросы, нужно уже уточнять что такое:

1) "определенные сайты"

2) "инфа по какому-либо шаблону"

3) "запросы на поисковых серверах"

4) "дальнейшая обработка"

5) "заданные правила"

6) "сортирует и складывает в нужное место"

N) ...

P.S. При такой универсальности и могучести этой "программы", человек, который в финале "сидит ... и уже в ручную фильтрует" кажется уже атавизмом - ненужным аппендицитом к этой программе :D

I
На сайте с 13.09.2001
Offline
79
Iva
#7

А про поисковую программу Copernic что-нибудь знаете? Кто-нибудь пользовался? Еще вот ссылочку нашла на список программ поиска.

Удачи! Iva feel the power
P
На сайте с 03.06.2003
Offline
8
#8

1) "определенные сайты"

Список сайтов которые надо посещать, формируется вручную.

2) "инфа по какому-либо шаблону"

Искать заданные словосочетания, в темах, в тексте.

Заданные по списку.

3) "запросы на поисковых серверах"

Это предположительно, а может сама ищет сайты, типа поискового робота.

4) "дальнейшая обработка"

То есть, сайт на котором публикуются необходимая для сбора информация.

5) "заданные правила"

Правила обработки текстов, поиска, включения сайта в один из списков обработки.

6) "сортирует и складывает в нужное место"

Сортирует по дате, по сайту, по вычисленной информативности текста. Складывает туда, куда скажут.

У меня нету ни каких инструментов, чтобы такое делать, к тому-же времени то же нету на самостоятельное писание такой системы. Мне нужна инфа, основы работы таких систем, чтоб сформулировать конкретное свое видение и передать на разработку спецам...

Цель темы проста, вместо того чтобы по этим сайтам ходил человек и читал на них инфу и выбирал что нужно а что нет, пусть большую часть делает система, а человек уже решает то или не то. Так как возможности сажать кучу людей на поиск и копирование инфы, смысла нету, затраты не будут окупаться....

euhenio
На сайте с 21.09.2001
Offline
357
#9

perl изучай. Это хороший инструмент для таких вещей.

с ув., Евгений Трофименко seo блог Trofimenko.ru ( http://trofimenko.ru/ ) но ыыы мало обновляется... Tools.Promosite.ru - анализатор апдейтов Яндекса (пожертвуйте лимиты на Яндекс.XML! ( https://searchengines.guru/ru/forum/801888/page7#comment_11942489 )) Konvr.ru - увеличение конверсии сайта на 81% за 4 недели ( http://konvr.ru/ )
dimok
На сайте с 08.11.2002
Offline
291
#10
perl изучай. Это хороший инструмент для таких вещей.

позволю себе внести поправку: регулярные выражения изучай (ну и язык, который умеет ими оперировать).

CLICKBAZA: есть траф - будут и деньги (https://clickbaza.com/)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий