МЕТА (meta.ua) сегодня у меня заказ оформила :)
Робот систем поиска плагиата в студенческих рефератах. Собранные данные используются в некоторых западных ВУЗах.
Интересной функцией интелектуального анализатора могла б быть функция распознавания подозрительных нежелательных действий пользователя сайта (подготовка к взлому, DoS и прочее).
Конечно, такая функция возможна только при создании достаточно мощной интеллектуальной базы правил и ее частого обновления
В другом треде я уже спрашивал мнения специалистов по IR, но повторю его еще раз - видите ли вы перспективы в квазиреляционном представлении WWW и в использовании языков, иммитирующих SQL (WebSQL и прочие)?
Возникает такой почти теоретический вопрос. Интересно услышать мысли мэтров.
Очень вероятно, что использование реляционных подходов при решении примитивной (в смысле “первичной” а не смыле “простой в реализации”) задачи поиска не целесообразно. Но .... возможно ли разширение функций поисковых машин (как систем, что владеют огромной БД ) в сторону более аналитических задач (например тот же data mining или web mining)? Такой путь уже прошли разработчики OLTP систем для предприятий.
Если такое случится ( а языки типа всяких WebQL-ей уже разработаны достаточно хорошо), то возможно и механизмы реализации поисковых систем будут изменятся в сторону большей схожести с реляционными или постреляционными СУБД?
Тема старая, но с продолжением.
Сегодня заметил, что на УАПортале уже работает поиск по сайтам.
Одним поисковиком стало больше!!!
Или я опоздал? (вообще-то я не пользуюсь Уапорталом, просто рекламу увидел)
Есть такой популярный метод раскрутки сайтов (как правило для Веб-мастеров и админов) – “ложные” запросы з реферером с рекламируемого сайта. Как не крутись, а Веб-админу (мастеру, оптимизатору ...) нужно знать какие есть на сайт внешние ссылки. Вот он и идет, проверяет, внимательно читает чужой сайт ...
Сорри. Внимательно просмотрел. Интересовался он robots.txt
Удивлялся я тому, что нигде на уапортале не указано (может не нашел?) что ето уже поисковик а не только каталог.
Сразу вопрос.
Используется ли тепер при поиске описание? Какие принципи ранжирования используются?
"
/ukr
uaportal.com
Mozilla 4.0 (MSIE 5.0 compatible); Uaportal crawler
Sunday, 30-Mar-2003 01:51:15 GMT
Там сначала ресурс, потом IP, потом UA потом время
И так страниц 200 за один день
Такую "мелочь" как robots.txt он не спрашивал.
А какой максимальный PR среди украинских сайтов? Я лично выше 7/10 не встречал.