Новости — объемное представление событий

BonaHost.ru
На сайте с 17.06.2007
Offline
30
558

Интернет, 12 апреля 2007 года. С сегодняшнего дня служба Яндекс.Новости предлагает новую страницу новостного сюжета (подборки сообщений, посвященных одному событию). Объемное представление новостей достигается сочетанием основных фактов, иллюстраций и справочной информации.

При выборе фактов используются сообщения от различных источников, что позволяет показать различные точки зрения. При этом приоритет получают информативные, оперативные и эксклюзивные новости. Сюжет иллюстрируется фотографиями и картами (если упомянуты какие-то географические объекты). С имен основных действующих лиц сюжета можно сразу перейти на их пресс-портреты.

Новый сюжет стал продолжением развития алгоритмов кластеризации, автоматического аннотирования и извлечения фактов, применяемых в Яндекс.Новостях. Технология, лежащая в его основе, получила название «многодокументная аннотация». «Из всех сообщений сюжета автоматически выделяются наиболее значимые объекты — имена людей, названия организаций, географические объекты, даты и числа. Они, наряду с ключевыми словами сюжета и новостными запросами, определяют выбор текстов для аннотации, — говорит Лев Гершензон, ведущий разработчик компании "Яндекс". — Фактографический подход к построению аннотации, как нам кажется, делает ее более информативной».

Служба Яндекс.Новости сегодня сотрудничает на договорных основах с 1700 источниками и обрабатывает ежедневно 100 тысяч сообщений. Главная задача Яндекс.Новостей — автоматически составить полную информационную картину дня. «Прямо на странице сюжета читатель получает представление о том, что произошло, а для получения подробной информации может выбрать тот источник, который ему больше нравится, — говорит Татьяна Платонова, руководитель службы Яндекс.Новости. — А сайт нашего партнера — источника — получает заинтересованного пользователя».

Обработка и систематизация новостей происходят автоматически. Алгоритмы анализа и ранжирования данных — оригинальная разработка Яндекса, основанная на определении текстуальной близости и кластеризации информационных потоков. Технология извлечения данных (fact extraction) в Яндекс.Новостях впервые была применена для автоматического выделения главных действующих лиц новостных сюжетов. Год назад был открыт доступ к пресс-портретам — справочной информации о людях, автоматически извлеченной из новостей СМИ. Автоматическое выделение и отождествление адресов и цитат построено на той же технологии.

Контакты:

Компания «Яндекс»

Елена Колмановская, главный редактор

Михаил Ушаков, руководитель пресс-службы

Телефон: (495) 739-7000

Факс: (495) 739-7070

E-mail: pr@yandex-team.ru

http://company.yandex.ru/news/2007/0412/index.xml

Хостинг (http://bonahost.ru) от 1.2$ за 200 Мб Аренда серверов (http://bonahost.ru/server.html) Core2Quad Q9450 2.66Ггц,4Гб RAM,2x500Гб HDD,RAID 0/1 -6350р.(260$).
AVV
На сайте с 31.07.2006
Offline
84
AVV
#1

Забыл поставить: http://company.yandex.ru/news/2007/0412/index.xml

П.С. BonaHost.ru, у вас нормально всё? Самочувствие нормальное? Может помочь чем?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий