Интервью с Ярославом Шакулой (Kevindark)

130

Vyacheslav Tikhonov

11 февраля 2007, 17:19

#91

Если такое сделать для Интернета, склеят за дубликат контент Программа работает по принципу того же translation memory алгоритма. Из массива текстов, разбитых на логические части, вытягиваются рандомом эти самые части, и соединяются воедино. Ничего сложного, но это те же тексты, только перемешанные.

Вообще говоря, это не совсем так. Используется операция сегментации, при которой части текста аннотируются и из него извлекаются наиболее важные предложения. При наличии обширной базы об исследуемом предмете из этих сегментов можно собрать вполне приличный и логически связанный дайджест, причем с учетом ретроспективы, плюс посчитать тезаурус - семантическое ядро предметной области.

Готовые ответы в поиске Яндекс ввел изменения в Яндекс представил поиск изображений

[Удален]

11 февраля 2007, 17:53

#92

Vyacheslav Tikhonov, я в более упрощенном виде описал)

VT

130

Vyacheslav Tikhonov

11 февраля 2007, 17:56

#93

я в более упрощенном виде описал

Да, только это реальность, а не фантастика, как и извлечение знаний из обычного HTML. ;)

95

Карманный флудер

16 февраля 2007, 18:29

#94

Прогоните его в НьюКэп ;)

Тексты заказываю тут (http://text.ru/bestbuy)

VK приобрела 70% в структуре компании-разработчика red_mad_robot

Маркетинг для шоколадной фабрики. На 34% выше средний чек