seraphim

Рейтинг
60
Регистрация
14.04.2008
Интересы
b27349
MD5sys:


P.S. Если будут ещё мысли - пишите ;)

Ага, их есть у нас :)

Основная мысль - ваша система будет бесполезной без умения обучаться в незнакомых ей контекстах. Поэтому лучше сосредоточьтесь на системе, которая бы применяла весь упомянутый инструментарий (морфологию, синтаксис, семантику) и генерировала базы знаний о предметных областях на основании скормленных ей "образцовых" текстов.

Если такое осилите - то "решить" пересказ текста будет более простой задачей. Если не осилите - то не стоит и париться с очередным тысячепервым "продвинутым синонимайзером"... Хотя, конечно, абсурдна сама идея - строить адронный коллайдер чтобы разогнанными частицами жаб глушить :)

kevindark:
Современные компьютеры умеют только вычислять. Это важно понимать, прежде чем думать о генераторах текста)

Ну это вы тоже зря упрощаете. Вычисления вычислениям рознь. Исследователи ИИ хоть и медленно, но движутся вперед. Применительно к теме: "создать текст" и "пересказать текст" - это принципиально разные задачи. Вторая как раз не требует творчества, а требует вычислений. Проблема - создать базу для вычислений.

Другое дело, что ТС, похоже, о существующих направлениях в исследовании ИИ не в курсе, и таки будет изобретать велик...

MD5sys:
Да, лет 10 назад я так же думал об ИИ :), но сейчас совсем не так. Такую глобальную цель - создать умную систему, которая будет беседовать как человек я не ставлю...

Как раз это было бы сделать проще, чем решить вашу задачу :) Еще лет 20 (если не больше) назад в MIT создали алгоритм "Эльза" (или "Элиза"), который имитировал работу психотерапевта-"роджерианца". Да так удачно, что даже обслуга машины через некоторое время начала забываться и с машиной беседовать. Если интересно, поищите книгу Джозефа Вейценбаума "Возможности машин и человеческий разум" - полный текст в рунете я видел в открытом доступе...

MD5sys:
...Задача отточить систему для конкретной относительно узкой цели. В какой-то степени это будет то что Вы сказали - перестановка, комбинирование и т.п. И при правильном анализе это уже будет начало выдачи качественного контента.

К примеру, есть новость, озаглавленная:

Обязательную страховку по ипотеке отменят

Анализируя её (морфологический, синтаксический и тематический разбор) - система должна определить главные мысли (в данном случае - отмена обязательной страховки при ипотеке) и формировать например такие заголовки:

"Отмена обязательной страховки для заёмщиков по ипотеке"
"Ипотека может подешеветь из-за отмены обязательной страховки"
"Отмена обязательной страховки для заёмщиков по ипотеке"
"Ипотечный кредит можно будет взять без страховки"
"Будет отменено обязательное страхование пользователей ипотечных кредитов"
"Ипотека без страховки: возможность или опасность?"
...

Этот пример - это нечто большее, чем "просто пересказ". Эти фразы построены из исходной с пониманием контекста проблемы (причинно-следственных связей реального мира). Ведь никакой морфологический или синтаксический разбор не поможет машине понять, что факт "отмена страховки" может иметь определенные последствия. Да, на отдельной узкой теме машину можно научить, набив ручками базу знаний, но для произвольного текста на неизвестную тему - сомнительно...

panic:
выделять тегом <h1> ключевые слова в тексте тупо, имхо, это же тег заголовка, да и по стандарту он должен встречаться на странице 1 раз, потом идут уже h2, h3 и т.д.

По какому стандарту?

Если нужно продать квартиру (одну!), то и нужно продавать квартиру, а не фигней страдать :)

Проинформируйте наиболее значимых риэлторов в нужном регионе, дайте объявления в спец. прессу (которой вагон и тележка), поставьте желаемую цену и ждите. Можете предложить риэлтору комиссию "лично от себя", если квартира уйдет по нужной цене. Если действительно есть за что платить больше, то продадите. Если нет, то никакой сайт не решит...

Dinapoli:
Главное чтобы это не перекрило доступ к возможности зарабатывать ( глобализация эта )

"Доступ к возможности зарабатывать" полностью определяется прослойкой между кепкой и ушами :)

konde:
Многие спорят по поводу использования для выделений данных тегв.
Решил задать вопрос прямо в яндекс и получил ответ, но перед публикацией хотел бы узнать общее мнение по этому поводу.

Зачем спорить и писать письма, если можно читать спецификации и экспериментировать? :)

Тэг <b> - это чисто визуальная разметка текста, а <strong> - это логическое выделение важного контента, не зависящее от используемого устройства вывода.. Скажем, правильному речевому браузеру ваш тэг <b> должен быть абсолютно фиолетов, в отличие от <strong>. С точки зрения спецификации более правильным и "красивым" будет использовать тэг <strong> и при помощи стилей установить правила его отображения в зависимости от типа медиа...

Miha Kuzmin (KMY):
Ага, а если такое искать:

http://yandex.ru/yandsearch?text=allinurl%3A
http://www.google.com/search?hl=ru&newwindow=1&q=allinurl%3A&btnG=%D0%9F%D0%BE%D0%B8%D1%81%D0%BA&lr=

Мораль сей басни: тс дебил. Ибо такого говна можно и в ту, и в другую сторону привести. А у убогого видимо яндекс сайт забанил.

В отличие от данного примера, "Однокла$$ники" - это название реально изданной книги, которая "расстроила" владельцев одноименного ресурса настолько, что те подали в суд на издательство. История не то, чтобы уж совсем скандальная, но определенный инфошум был. Так что разница есть некоторая.

Но тема и правда не стоит выеденного яйца. Разве что если сделать так

http://yandex.ru/yandsearch?text=%22%D0%BE%D0%B4%D0%BD%D0%BE%D0%BA%D0%BB%D0%B0%24%24%D0%BD%D0%B8%D0%BA%D0%B8%22&lr=187

религия не позволяет... :)

ctrl+a:
используйте <H1> 1 раз по назначению, и будет вам счастье...

Зачем дезинформируете человека? В официальной спецификации HTML нет ни слова о том, что заголовок первого уровня можно использовать только "один раз по назначению"...

Artemjus:
...Предлагаю просто ограничить/запретить гугл.ру в россии, т.е. поступить как китайцы в свое время...

О, вот это по-нашему, по славянски: у богатых забрать, другим богатым раздать, ходорковского посадить... Универсальный рецепт :)

boga@voxnet.ru:
Когда моему сыну было 6 лет, он задавал кучу вопросов.

Однажды он спросил: "Если подерутся каратист и крокодил, то кто победит?"
Извиняюсь, за офф, но тема навеяла....:D

Так кто победит-то? :)

Всего: 381