Ага, их есть у нас :)
Основная мысль - ваша система будет бесполезной без умения обучаться в незнакомых ей контекстах. Поэтому лучше сосредоточьтесь на системе, которая бы применяла весь упомянутый инструментарий (морфологию, синтаксис, семантику) и генерировала базы знаний о предметных областях на основании скормленных ей "образцовых" текстов.
Если такое осилите - то "решить" пересказ текста будет более простой задачей. Если не осилите - то не стоит и париться с очередным тысячепервым "продвинутым синонимайзером"... Хотя, конечно, абсурдна сама идея - строить адронный коллайдер чтобы разогнанными частицами жаб глушить :)
Ну это вы тоже зря упрощаете. Вычисления вычислениям рознь. Исследователи ИИ хоть и медленно, но движутся вперед. Применительно к теме: "создать текст" и "пересказать текст" - это принципиально разные задачи. Вторая как раз не требует творчества, а требует вычислений. Проблема - создать базу для вычислений.
Другое дело, что ТС, похоже, о существующих направлениях в исследовании ИИ не в курсе, и таки будет изобретать велик...
Как раз это было бы сделать проще, чем решить вашу задачу :) Еще лет 20 (если не больше) назад в MIT создали алгоритм "Эльза" (или "Элиза"), который имитировал работу психотерапевта-"роджерианца". Да так удачно, что даже обслуга машины через некоторое время начала забываться и с машиной беседовать. Если интересно, поищите книгу Джозефа Вейценбаума "Возможности машин и человеческий разум" - полный текст в рунете я видел в открытом доступе...
Этот пример - это нечто большее, чем "просто пересказ". Эти фразы построены из исходной с пониманием контекста проблемы (причинно-следственных связей реального мира). Ведь никакой морфологический или синтаксический разбор не поможет машине понять, что факт "отмена страховки" может иметь определенные последствия. Да, на отдельной узкой теме машину можно научить, набив ручками базу знаний, но для произвольного текста на неизвестную тему - сомнительно...
По какому стандарту?
Если нужно продать квартиру (одну!), то и нужно продавать квартиру, а не фигней страдать :)
Проинформируйте наиболее значимых риэлторов в нужном регионе, дайте объявления в спец. прессу (которой вагон и тележка), поставьте желаемую цену и ждите. Можете предложить риэлтору комиссию "лично от себя", если квартира уйдет по нужной цене. Если действительно есть за что платить больше, то продадите. Если нет, то никакой сайт не решит...
"Доступ к возможности зарабатывать" полностью определяется прослойкой между кепкой и ушами :)
Зачем спорить и писать письма, если можно читать спецификации и экспериментировать? :)
Тэг <b> - это чисто визуальная разметка текста, а <strong> - это логическое выделение важного контента, не зависящее от используемого устройства вывода.. Скажем, правильному речевому браузеру ваш тэг <b> должен быть абсолютно фиолетов, в отличие от <strong>. С точки зрения спецификации более правильным и "красивым" будет использовать тэг <strong> и при помощи стилей установить правила его отображения в зависимости от типа медиа...
В отличие от данного примера, "Однокла$$ники" - это название реально изданной книги, которая "расстроила" владельцев одноименного ресурса настолько, что те подали в суд на издательство. История не то, чтобы уж совсем скандальная, но определенный инфошум был. Так что разница есть некоторая.
Но тема и правда не стоит выеденного яйца. Разве что если сделать так
http://yandex.ru/yandsearch?text=%22%D0%BE%D0%B4%D0%BD%D0%BE%D0%BA%D0%BB%D0%B0%24%24%D0%BD%D0%B8%D0%BA%D0%B8%22&lr=187
религия не позволяет... :)
Зачем дезинформируете человека? В официальной спецификации HTML нет ни слова о том, что заголовок первого уровня можно использовать только "один раз по назначению"...
О, вот это по-нашему, по славянски: у богатых забрать, другим богатым раздать, ходорковского посадить... Универсальный рецепт :)
Так кто победит-то? :)