Интеллектуальный персональный агент "Мониторикс"

VT
На сайте с 27.01.2001
Offline
130
#31
neznaika:
А IP можно узнать?

Нет. Да и сервер далеко не один. Да и не спасет это.

Я не совсем понял, в чем проблема - считайте, что это один раз зашел человек, и передал ссылку другому человеку. Мониторикс - это помощник, а не враг.

neznaika, если Вы боитесь, что у Вас что-то скопипастят, так если это кому-то сильно нужно, то сделают это и без участия Мониторикса.

VT
На сайте с 27.01.2001
Offline
130
#32

Вообще я хотел бы попросить присутствующих относиться к Мониториксу как к средству получения оперативной информации, а не как к источнику автоматического наполнения сайтов.

Для простоты восприятия представьте себе, что Вы включили телевизор, который постоянно что-то показывает - например, новости или какие-то программы, новые или старые. В случае с Мониториксом происходит примерно то же самое - после включения RSS-канала он начинает транслировать все, что видит в Интернете по нужной теме. Это может быть как и старая информация (повтор программы по ТВ), так и новая, если кто-то напишет на интересующую Вас тему.

Надоел канал - смело переключайте его в агрегаторе на другой, и смотрите дальше то, что интересно!

M
На сайте с 29.03.2003
Offline
65
#33
Vyacheslav Tikhonov:
Как Monitorix/v.0.1. Но он же не поисковик, а Интеллектуальный Агент, поэтому правила в robots.txt игнорирует.

robots.txt относится ко всем системам, автоматически (без участия человека) извлекающим страницы из интернета, вне зависимости поисковик это или нет. Тот же Mediapartners-Google, бот, определяющий какую контекстную рекламу показывать, тоже не поисковик, но robots.txt соблюдает.

Проверь свои запросы: Вершки Рунета (http://www.43n39e.ru/)
VT
На сайте с 27.01.2001
Offline
130
#34
robots.txt относится ко всем системам, автоматически (без участия человека) извлекающим страницы из интернета, вне зависимости поисковик это или нет. Тот же Mediapartners-Google

Наличие robots.txt не является обязательным для исполнения, это рекомендация. Строго говоря, так поступают "воспитанные" роботы вроде Яндекса. А вот для приложений конкурентной разведки это вредно.

M
На сайте с 29.03.2003
Offline
65
#35
Vyacheslav Tikhonov:
Наличие robots.txt не является обязательным для исполнения, это рекомендация. Строго говоря, так поступают "воспитанные" роботы вроде Яндекса. А вот для приложений конкурентной разведки это вредно.

А невоспитанные быстро попадают в бан и получают репутацию если не malware, то корявого софта.

VT
На сайте с 27.01.2001
Offline
130
#36
А невоспитанные быстро попадают в бан и получают репутацию если не malware, то корявого софта.

В этом нет необходимости. Как правило, робот снимает одну страницу (с нужной информацией) с сайта - этого вполне достаточно.

В общем, поддерживать или нет robots.txt - это дело больше философии, чем технологии.

А насчет бана - я не понял, агент что, производит какие-то противоправные действия? Где это написано? Он просто находит нужную информацию и показывает пользователю.

VT
На сайте с 27.01.2001
Offline
130
#37

Вопрос коллегам.

Современный Интернет представляет сложное переплетение информационных потоков, которые зачастую все вместе создают ненужный шум. Поставлена задача "разложить" каналы распространения информации в интернете таким образом, чтобы по мере надобности можно было отключать лишнее.

Я вижу такие информационные каналы:

1) Телевидение - видеоролики, клипы, ТВ-программы в записи

2) Пресса - пресса, которую выкладывают в онлайн

3) Радио - радиопередачи в онлайне, расшифровки

4) Онлайн СМИ - интернет-сайты с новостями и статьями

4) Блоги - сайты, которые ведут пользователи (блоггеры)

5) Форумы - общественное мнение

6) Социальные сети - комьюнити, объединяющиеся вокруг единой идеи

7) Объявления - сайты частных объявлений

8) Товары и аукционы - продажа онлайн

9) Подкасты - звуковые и видеопередачи (можно отследить по анонсам)

10) Комментарии - мнение пользователей, размещенные после информационного сообщения

12) Информационные сайты - ресурсы информационной направленности, информирующие о чем-либо пользователей.

Что еще может быть? Какие каналы распространения информации я не учел?

ValD
На сайте с 14.06.2007
Offline
133
#38
Vyacheslav Tikhonov:
Мониторикс с одинаковой эффективностью может собирать как новости и статьи (то есть официальную точку зрения), так и блоги и форумы (индивидуальный взгляд людей на происходящее), что позволит Вам всегда быть в курсе всех событий. С помощью Мониторикса Вы подключаетесь к огромному информационному полю, которым сегодня является Интернет, и выбираете свой собственный канал информации, подобно тому, как переключаете каналы телевизора.

Так.. не до конца понял. Конкретный пример: тематика "SEO". Как ваш софт будет собирать инфу с форумов и блогов? С каких? Бот будет ползать по топикам и маякать по поводу каждого поста? Не понял механизма. Где это настраивается и кем определяется?

VT
На сайте с 27.01.2001
Offline
130
#39
Так.. не до конца понял. Конкретный пример: тематика "SEO". Как ваш софт будет собирать инфу с форумов и блогов? С каких?

Пользователь определяет набор сайтов и описывает ключевыми запросами нужные объекты - например, объект SEO включает seo, поисковая оптимизация, поисковое продвижение, оптимизация сайтов и т.д.

После этого можно подключиться к выбранному каналу и получать по подписке или в RSS новую информацию, которая появляется на сайтах. Вот пример, как Мониторикс обрабатывает Интернет.

goltsov
На сайте с 28.01.2008
Offline
19
#40

Штука очень полезная, только по-моему на этапе запуска и открытия - рано ее платной делать. Подождали бы несколько месяцев, пока массовая регистрация не начнется и люди привыкли бы к всем удобствам... Мне понравилось, но жаба душит пока :)

Пока люди просиживают часами на форумах в поисках истины, кто-то в это время зарабатывает деньги.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий