не хаос

не хаос
Рейтинг
96
Регистрация
18.10.2021
softerra #:
Желательно указывать тематику. А то ноете ноете, а о чем непонятно. Гадание на кофейной гуще? Серп наполнен, подстраивайтесь ..

Это их тактика, когда нет фактов, пруфов, фактуры, – переходить на личности от злобы.

Vidos #:

Клиент покупает у конкурентов. Мне вот тут недавно понадобилась Компрессионная муфта TEBO ПНД соединительная ( рубанул трубу на даче случайно). 


Набрал запрос, зашёл топ один -топ два -топ три

И заказал подешевле на сайте который находится в топ 8. Пофиг топ 1, ищем дешевле. 


Вы свои цены анализировали по сравнению с конкурентами? Поэтому топ1  не показатель наличия клиентов!

Одежду, обувь, еду, стройматериалы для ремонта, запчасти для машин как покупали так и покупают. Значит какая-то ошибка в маркетинге, бестолковые маркетологи видимо там.

Вы думаете что легко обучить этот ИИ? Вы бы хоть для общего развития почитали сначала как это все устроено.
"Галлюцинации в моделях, особенно языковых (LLM), — это ситуации, когда модель выдаёт уверенный, но ложный или выдуманный ответ. Это может быть придуманный факт, несоответствие источникам, или логическая ошибка. В генеративных задачах галлюцинации — одна из самых серьёзных проблем.

Измерять галлюцинации сложно: у модели нет встроенного понимания правды, и она не знает, когда врёт. Поэтому оценки галлюцинаций часто делаются постфактум, с привлечением людей (ручная валидация), мета-моделей (детекторы галлюцинаций) или сравнения с базами знаний или источниками.

Пока нет универсального определения галлюцинации, всё зависит от задачи и контекста. Автоматические методы оценки ещё далеки от надёжности, поэтому требуется ручная разметка или наличие "истины", с которой можно сравнивать.

Среди автоматических можно выделить:

FactCC — модель-классификатор, обученная различать фактологически верные и ложные высказывания. Применима для задач суммаризации.

DAE Score (Dependency Arc Entailment) — основан на сопоставлении смысловой близости между сгенерированным и исходным текстом через синтаксические связи. Часто используется в задачах абстрактной суммаризации.

QAGS (Question Answering and Generation Score) — применим в задачах суммаризации и генерации. Оценивает фактологическую точность через промежуточные шаги: генерация вопросов по оригинальному тексту и получение ответов на них из сгенерированного. Чем больше совпадений, тем ниже уровень галлюцинаций.

GPT-based оценка — использование крупной модели (чаще всего GPT) для анализа фактической достоверности текста. Модель получает инструкцию: "Оцени, содержит ли данный текст утверждения, не подтверждаемые оригиналом", — и возвращает бинарный или градуированный вывод.

Одни из наиболее известных протоколов ручной аннотации HALO, HELP и MAF предлагают формализованные подходы, которые позволяют оценивать не просто факт искажения, но и его характер, контекст, уровень серьёзности.

HALO (Hallucination Annotation with Logical Outline) применяется в первую очередь в задачах open-domain диалогов.

Аннотация проводится вручную по заранее заданной схеме: оценивается, насколько генерация модели соответствует исходным фактам, и классифицируется тип галлюцинации.

Например, если пользователь спрашивает у модели: «Кто написал Преступление и наказание?», и та отвечает «Лев Толстой», HALO позволит оценить это как полную фактическую ошибку — придуманную галлюцинацию.

Если же модель скажет, что роман написал Достоевский, но в 1885 году (вместо 1866), это будет искажённый факт.

HALO также учитывает логические ошибки: если вывод модели формально вытекает из данных, но логика нарушена (например, делает обобщения без основания), аннотаторы фиксируют это как логическую галлюцинацию.

Этот протокол полезен для оценки моделей, предназначенных для общения с пользователями, где важно, чтобы модель не только звучала убедительно, но и говорила по делу.

HELP (Hallucination Evaluation with Language Professionals) используется в медицинских задачах, где ошибки модели могут стоить дорого. Здесь аннотирование проводят врачи или медицинские редакторы.

Они вручную оценивают тексты, сгенерированные моделью (например, ответы на клинические вопросы), и помечают фрагменты, содержащие недостоверную информацию.

Особенность HELP в том, что здесь учитываются не только явные фактические ошибки, но и потенциально опасные домыслы: например, если модель «рекомендует» метод лечения, эффективность которого не доказана, либо путает дозировки препаратов. Такая разметка требует глубоких знаний предметной области и чаще всего применяется в исследовательских работах или при тестировании медицинских чат-ботов.

MAF (Meaning Addition, Alteration, Fabrication) — это ещё один ручной протокол, ориентированный на разложение галлюцинации по типу и степени искажения. Он используется, например, при оценке саммари моделей (рефератов, пересказов и т.п.).

В рамках MAF аннотаторы определяют, добавила ли модель информацию, которой не было в исходном тексте (fabrication), изменила ли смысл (alteration) или добавила дополнительный смысл, который сложно проверить (addition).

Например, если модель суммирует статью о климате и «добавляет» утверждение о прямой связи между CO₂ и ураганами (чего в исходной статье нет), это будет fabrication.

Такой подход удобен в задачах суммаризации, реферирования, генерации новостей, особенно если важно избежать недостоверных обобщений.

Эти ручные метрики помогают строить датасеты для последующей автоматической оценки, калибровки моделей и обучения на обратной связи. Несмотря на их трудоёмкость, именно они задают стандарт, по которому можно сравнивать работу разных моделей на чувствительных или требующих фактической строгости задачах." sostav.ru

Одно и тоже лекарство одного может вылечить, у другого вызвать шок. В этом вся сложность.
Поэтому там очень долго нужно учиться, это не зенкой накручивать просмотры.
Сделайте любительский блог а в него уже приглашайте выступить кардиологов с образованием, опытом, рекомендациями. Проявите креатив, чтобы соответствовать всем требованиям ПС.
Очередная порция страшилок.
"Женщину уволили после 25 лет работы в банке из-за ИИ, которого она сама обучала.


Её начальство просило улучшить сервис и обучить ИИ для клиентов. ИИ научился, босс игнорировал её 8 дней, а потом сократил вместе с коллегами — с роботом работать выгоднее.


Свой среди чужих, чужой среди своих.


Подписывайся 🤖 Нейроновости"

Время покажет хайп это или полезное дело. Но от рутины избавляет, это уже точно.
qilly #:

А этот... защитника вебмастеров Сливинский, он че, говорил что в последнее время? Ну так понимаю сайты В С Ё?

Мой проект с 40-50к дейли скатился в 4-5к и несет сущие копейки. Поддерживаю чисто хз даже для чего его)

Яндекс - позорище Рунета!

Зам его здесь каждый день выступает, вроде про агонию сайтов ничего не говорит пока что.

Хорошие специалисты хвастаться и рекламировать себя не будут, клиенты их по сарафанному радио передают друг другу.
Платит директор а не ноунейм, от этого и исходить.
Всего: 1779