Да, конечно, - мониторинг новостей. Это реинкарнация темы
только теперь я хочу не через поисковики "заходить", а напрямую: скачивать новости и анализировать их "у себя" ...
За разъяснение про RSS - спасибо. Я встречал такую аббревиатуру, теперь - пригляжусь повнимательнее ... Ну и Славу Тихонова, конечно, давайте спросим, - буду очень признателен!
НП, Иван FXS .
Попытаюсь модифицировать вопрос:::
Существуют ли в ы-нете сервисы по "мониторингу и скачиванию контента"?
То есть, предположим, я имею 100 (200, 500, 1000) адресов-"оглавлений", то есть страниц, на которых не только переодически обновляется текст, но и - постоянно появляются новые (а старые - удаляются постепенно) "заголовки", выводящие на некие страницы-"сообщения" ...
Можно ли "заказать" ПОСТОЯННЫЙ автоматический мониторинг этих страниц-оглавлений и скачивание ОБНОВЛЕНИЙ контента - как с них самих, так и с тех страниц, которые они "оглавляют"?
НП, Иван FXS.
Алексей, спасибо, но что-то я там "с парадного входа" ничего не могу ценного обнаружить ...
Можно мне как-то получить от Вас более конкретную рекомендацию?
Спасибо, perl мне не по зубам ...
Я испорчен интересом к теме ИИ (=искуственный интеллект, типа
http://groups.yahoo.com/group/IErussian/messages ) и поэтому считаю, что иначе - не выйдет ...
А вот - интересно - есть ведь поисковики на основе баз знаний, или для всех для них контент - это просто stritg type data?
НП, Иван FXS
Ну Вы сказанули - для СПАМА! Я вообще-то в форумах ... ммм ... в коллективной мыследеятельности участвую (во как ;-) ).
Для индексации - пожалуй - с поправкой на то, что индексация, оказывается, многозначное слово ...
Ну и давайте я обозначу, чего еще хотелось бы. На уровне ключевых слов, ок: АС (ассоциативные сети) и БЗ (базы знаний).
О том, может ли таблица быть полностью (в смысле "смысла") восстановлен "из" индекса?
Для БД - не может, поскольку индекс строится по 1-му полю (нескольким полям), а для пары интернет-контента + "индекс в смысле поиска" ?
Вроде - может ... восстанавливает же Гугл страницы, да еще и подсвечивает ...
А что это - паук? (Сорри, мы не местыяяяя, словов ваших не понимаеееем ;-) )
Зачем: дык, приходится много бродить, много искать и много писать в фазные форумы ... Хочется инструмент.
А! Понял, почему я Вас не понимаю: для меня БД состоит из таблиц И индексов. Для таблицы может быть построен (=поражден) любой конкретно заданый ее индекс (как инструмент быстрого поиска, сортировок, навигации ... ну в общем - как ИНСТРУМЕНТ).
Но (опять же, - по моему разумению) индекс не эквивалентен таблице, поскольку она не может быть по нему ВОССТАНОВЛЕНА ...
Или я ошибаюсь? Во всяком случае, я мне ни разу не приходилось сталкиваться с такой процедурой ...
А у Вас "индекс" интернета - это его контент ПОЛНОСТЬЮ (и - взаимооднозначно?) преобразованый в некую БД, я правильно ТЕПЕРЬ понимаю?
Интернет ведь не является БАЗОЙ ДАННЫХ, а SQL - инструмент работы именно с БД, или я совсем отстал от жизни?
Не понял: MS SQL Server какое отношение имеет к интернет-контенту?
О! Я понял: "парсинг" - это (В ДАННОМ КОНТЕКСТЕ) автоматическое разнесение и информации из текста по полям базы данных, так?
Мой вопрос был намного проще ... но парсинг - это было бы СУПЕР!
А какие имеются возможности (идеи?) по парсингу?