Vyacheslav Tikhonov

Рейтинг
130
Регистрация
27.01.2001
Должность
Developer
Интересы
search engines, bots, information retrieval, data mining
Master's Degree in Computer Science
То есть понятием может быть именная группа. Примером связи может быть например связь между подлежащим и дополнением как между субьектом и обьектом действия в с действием в виде сказуемого. У меня для этого реализован специальный язык синтаксических правил.

Бесконечное количество связей между субъектом и объектом... Очень интересно узнать, как же разрешается омонимия.

То есть например пользователь вводит в поле субьекта действия слово кучма, в поле действия слово подписал в поле обьекта знак вопроса, и получает новости в которых кучма что то подписал за определенный период. Думаю такое реализовать вполне возможно.

Так а в чем же состоит семантическая связь? В любом поисковике, построенном на классических принципах, это уже реализовано - в стандартной td*idf-метрике. Все это лишь статистические связи.

Если здесь баннер вешать для каждой коллективной встречи в Киеве оптимизаторов с пивом, то наши анфасы тут всем глаза намозолят

А еще лучше в Директе объявление повесить на запрос 'поисковая оптимизация', с украинским таргетингом. Если не получится на первое место в выдаче этот топик вывести. :)

Где можно почитать более подробно (кроме указанной Вами ссылки)?

В Google. :)

Только там для человека в этой теме не сведущего там нет ничего кроме общего диагноза: "это очень сложно"... =|

Конечно, для понимания нужно хотя бы немного владеть терминологией.

Для начала советую почитать, что такое

TDT - Topic Detection and Tracking.

TDT призвана решить следующие задачи:

1. Сегментация статей (Story Segmentation) - задача разделения непрерывного потока на новости, связанные одним и тем же событием.

2. Отслеживание новостной дорожки (Topic Tracking) - нахождение всех новостей, которые "похожи" на множество эталонных новостей. Используется для отлова всех потенциально интересных документов по теме, которые могут появиться в будущем.

3. Определение дорожки (Topic Detection) - кластеризация всех новостей, порожденных конкретным событием.

4. Определение первой новости в дорожке (First Story Detection) -

для нахождения самого первого сообщения в новом событии.

5. Определение связей (Link Detection) - позволяет определить, порождены ли две новости одним и тем же событием.

Вам какую задачу нужно решить?

Прочитал всю ветку "Технических вопросов", но информации не нашёл...

Странно. А ведь вопрос уже обсуждался, причем с представителями Яндекса.

К сожалению, меня точно не будет.

Ace, я пока ничего не могу обещать - скорее всего, уезжаю в Польшу в эту пятницу. Все зависит от того, когда будет виза, поэтому точно о своем участии скажу уже в конце недели.

Kurt, а немного пошевелить серым веществом? :)

Где взять структурированый словарь синонимов русского языка?

Вообще-то идея использовать в метапоисковике синонимы - не самая лучшая. Почему - можно почитать

здесь.

Если я правильно понял, то объявился хозяин vengo.ru? :)

Сборная солянка из гугла/яндекса/рамблера и чего то еще.

Данных из Гугла нет, только Большая Русская тройка. Правда, перемешанная каким-то хитромудрым способом. :)

Всего: 847