Комментарии - Vyacheslav Tikhonov - Профиль вебмастера - Форум об интернет-маркетинге

Интеллектуальный персональный агент "Мониторикс"

11 февраля 2010, 00:37

Спустя почти год озвучиваю последние новости от Мониторикса.

Итак, мы научились очень качественно распознавать микроэлементы на любых страницах и автоматически определять типы носителей информации: новости, статьи, блоги, форумы, социальные сети и т.д.

Особой ценностью обладает способность агента отслеживать новые комментарии под публикациями - без RSS-экспорта такая возможность недоступна ни Яндексу, ни Google, ни кому бы-то ни было из малых и больших искалок. Ослеживать социальные медиа становится очень просто - достаточно настроить соответствующий канал и получать все в наших RSS-потоках.

В качестве демонстрации технологии можно посмотреть две real-time ленты (полнотекст):

Стартапы

Социальные сети

Глобальный мониторинг более-менее освоили и начали подключать крупные корпорации.

В планах - "автоматическая" аналитика.

Алгоритм работы поисковиков

14 января 2010, 23:06

Seredniy:
у Вас есть любые из перечисленных Вами?

Я немного разбираюсь, как они работают.

Создание поисковика

14 января 2010, 22:57

dr_dax:
Да можно. У нас прога под линукс, я сниму на видео с экрана и кратко расскажу о возможностях. Но где-то в начале января. Сейчас очень сильно загружен по основной работе, конец года.

dr_dax, уже середина января. Есть какой-то прогресс по демке или видео?

Проблематика создания поисковых систем

14 января 2010, 22:45

Robertomorreti:
Добрый день! Нужна вся возможная информация о проблематики создания поисковых систем,
тоесть почему создание поисковиков - это тяжелая задача?
Приветствуются ссылки на информацию по данной теме.

Просьба высказываться только тех, кто может предоставить нужную информацию по данной теме.

Вот здесь есть недавнее и очень хорошее обсуждение на тему создания и раскрутки поисковика. Создание поисковика - техническая задача, и ее вполне реально решить, однако для успешного старта нужна идея, которая не копирует существующие аналоги, а предложит что-то новое и полезное для пользователей.

Алгоритм работы поисковиков

14 января 2010, 22:41

Azam4ik:
Есть ли алгоритм работы всех поисковиков? Если у вас есть хотя бы 1 аглоритм пс, то выложите или просто укажите ссылку.Выкладываем, кто что знает!

Их много, этих алгоритмов. Вас какие интересуют - ранжирования или сбора информации?

Вопрос по сложному поиску с нечетким описанием

18 июля 2009, 22:59

Вопрос как лучше это сделать? Пока пользуюсь расширенным поиском и комбинацией различных команд из языка запросов в яндексе и google, еще смотрел нигму но не очень понравилось. В общем что-то получает найти, но много так и не находится.

Вообще задача нетривиальная, но имеет решение, которое я называю контекстным мониторингом (в специальной литературе может быть другое название). Суть его сводится к следующему - если нужно отследить все документы по теме, которая в текстах страниц может быть описана множеством различных слов и задана очень нечетко, можно воспользоваться так называемым "контекстом" - семантическим ядром ключевых фраз, которые могут встречаться на страницах.

Однако, не стоит путать "семантическое ядро" запросов и семантически связанные словосочетания (лексические цепочки) - это разные понятия, так как в текстах обычно пишут не так, как ищут люди. В этом, по сути, и состоит работа сеошника - добавить одному тексту множество вариантов запросов, по которым он должен искаться.

Если интересуют подробности, можете ознакомиться с контекстным мониторингом на PRweb'е. Там есть примеры, когда в одну RSS-ку загонялись все страницы из Интернета, удовлетворяющие определенному контексту.

Выделение ключевых слов.

13 мая 2009, 01:36

а как можно распознавать навигационную разметку ? строить DOM ?

Кстати говоря. навигация обычно обрамлена ссылками, что может быть полезно для определения ключевых слов, относящихся к сайту в целом. В обычных текстах подобные вещи встречаются редко, разве что в названиях разделов на внутренней странице.

RSS по Яндекс Анадырь

14 апреля 2009, 22:38

А чем отличается от этого?

Это поиск только по блогам, которые знают Яндекс-Блоги. Чтобы информация туда попала, надо либо пинговать, либо добавляться ручками, поэтому там есть далеко не все.

RSS по Яндекс Анадырь

14 апреля 2009, 22:06

Анализируя тему, сделали интересное открытие, которое может кому-то пригодиться.

Оказывается, спустя некоторое время название алгоритма становится именем нарицательным и может упоминаться в Интернете без привязки к Яндексу-"родителю". Просто поиск по Анадырь или Арзамас дает сплошной мусор, так как названия уже подразумевают города, а не алгоритмы, поэтому в инфосреде идет сплошной белый шум.

Как лечить - для качественного мониторинга надо описывать контекст, к котором может упоминаться алгоритм. Например, анализируете контекст и составляете сложный запрос вида:

При составлении тезауруса сильно помогут темы форума, где обсуждаются все проблемы. Мы же попробуем этот контекст ввести в RSS и дать наиболее полную информацию по теме.

RSS по Яндекс Анадырь

12 апреля 2009, 01:15

Можно еще подумать и снять нужную информацию по алгоритмам Google с англоязычных сайтов, но здесь нужна очень хорошая система оценки качества контента, иначе RSS-ка будет обновляться с дикой скоростью и показывать в основном шум. Как вариант, можно посчитать context quality, но это длинный путь.

Хотя можно и промониторить все высказывания Мэтта Катца в контексте последних алгоритмов, конечно. Насколько это интересно?

Дзен реализовал для авторов возможность вывода денег через СПБ

Как снизить ДРР до 4,38% и повысить продажи с помощью VK Рекламы

Vyacheslav Tikhonov