!Иван FXS

!Иван FXS
Рейтинг
119
Регистрация
16.11.2001
Как писал Gray
Я так понимаю, вопрос состоит в мониторинге новостей?

Может, это и не то, но на всякий случай. Есть такая штука, как RSS ...

Да, конечно, - мониторинг новостей. Это реинкарнация темы

только теперь я хочу не через поисковики "заходить", а напрямую: скачивать новости и анализировать их "у себя" ...

За разъяснение про RSS - спасибо. Я встречал такую аббревиатуру, теперь - пригляжусь повнимательнее ... Ну и Славу Тихонова, конечно, давайте спросим, - буду очень признателен!

НП, Иван FXS .

Попытаюсь модифицировать вопрос:::

Существуют ли в ы-нете сервисы по "мониторингу и скачиванию контента"?

То есть, предположим, я имею 100 (200, 500, 1000) адресов-"оглавлений", то есть страниц, на которых не только переодически обновляется текст, но и - постоянно появляются новые (а старые - удаляются постепенно) "заголовки", выводящие на некие страницы-"сообщения" ...

Можно ли "заказать" ПОСТОЯННЫЙ автоматический мониторинг этих страниц-оглавлений и скачивание ОБНОВЛЕНИЙ контента - как с них самих, так и с тех страниц, которые они "оглавляют"?

НП, Иван FXS.

Как писал "Fanat"
overture.com webtracker.com
Nuzhna pomosh' pishi.
Alexei.

Алексей, спасибо, но что-то я там "с парадного входа" ничего не могу ценного обнаружить ...

Можно мне как-то получить от Вас более конкретную рекомендацию?

НП, Иван FXS.

Как писал euhenio

Могу дать на perl: паука + составитель индекса + поисковый скрипт. Но разбираться в деталях придется самому :)

Спасибо, perl мне не по зубам ...


АС (ассоциативные сети) и БЗ (базы знаний)...
- а вот это уже самому придется. А зачем, если не секрет?

Я испорчен интересом к теме ИИ (=искуственный интеллект, типа

http://groups.yahoo.com/group/IErussian/messages ) и поэтому считаю, что иначе - не выйдет ...

А вот - интересно - есть ведь поисковики на основе баз знаний, или для всех для них контент - это просто stritg type data?

НП, Иван FXS

Как писал euhenio

-Для чего? Для спама в форумы? Или для индексации форумов?

Ну Вы сказанули - для СПАМА! Я вообще-то в форумах ... ммм ... в коллективной мыследеятельности участвую (во как ;-) ).

Для индексации - пожалуй - с поправкой на то, что индексация, оказывается, многозначное слово ...

Ну и давайте я обозначу, чего еще хотелось бы. На уровне ключевых слов, ок: АС (ассоциативные сети) и БЗ (базы знаний).

НП, Иван FXS

Как писал euhenio

-О какой однозначости идет речь? Типа слово "хреновый" встречается в моем документе и только в нем?

О том, может ли таблица быть полностью (в смысле "смысла") восстановлен "из" индекса?

Для БД - не может, поскольку индекс строится по 1-му полю (нескольким полям), а для пары интернет-контента + "индекс в смысле поиска" ?

Вроде - может ... восстанавливает же Гугл страницы, да еще и подсвечивает ...

Как писал euhenio

-Я, например, пока не слыхал термина "индексатор контента". Предполагаю, что имеется в виду паук. По существу, а зачем он тебе нужен?

А что это - паук? (Сорри, мы не местыяяяя, словов ваших не понимаеееем ;-) )

Зачем: дык, приходится много бродить, много искать и много писать в фазные форумы ... Хочется инструмент.

НП, Иван FXS

Как писал AiK

А индекс и есть БД. То, что видно в любом поисковике - это интерфейс для составления запросов к этой БиДэ.

А! Понял, почему я Вас не понимаю: для меня БД состоит из таблиц И индексов. Для таблицы может быть построен (=поражден) любой конкретно заданый ее индекс (как инструмент быстрого поиска, сортировок, навигации ... ну в общем - как ИНСТРУМЕНТ).

Но (опять же, - по моему разумению) индекс не эквивалентен таблице, поскольку она не может быть по нему ВОССТАНОВЛЕНА ...

Или я ошибаюсь? Во всяком случае, я мне ни разу не приходилось сталкиваться с такой процедурой ...

А у Вас "индекс" интернета - это его контент ПОЛНОСТЬЮ (и - взаимооднозначно?) преобразованый в некую БД, я правильно ТЕПЕРЬ понимаю?

НП, Иван FXS

Как писал AiK

Здрасьте приехали. Ему побарабану интернет это контент или с твоего локального диска. Он ищет, а не индексирует.

Интернет ведь не является БАЗОЙ ДАННЫХ, а SQL - инструмент работы именно с БД, или я совсем отстал от жизни?

НП, Иван FXS

Как писал AiK

Это две составляющие единого целого. Например у MS имеется Index Server = "индексатор контента". Так же есть MS SQL Server = "поисковик".

Не понял: MS SQL Server какое отношение имеет к интернет-контенту?

НП, Иван FXS

Как писал groul
Имеется ввиду парсинг результатов поиска для своиx нужд?

О! Я понял: "парсинг" - это (В ДАННОМ КОНТЕКСТЕ) автоматическое разнесение и информации из текста по полям базы данных, так?

Мой вопрос был намного проще ... но парсинг - это было бы СУПЕР!

А какие имеются возможности (идеи?) по парсингу?

НП, Иван FXS

Всего: 644