E-E-A-T: опыт, экспертность, авторитетность, достоверность. Контент должен демонстрировать глубокое понимание темы, подкрепленное реальным опытом автора или компании. Например, статья о ремонте автомобилей от автосервиса с 10-летним стажем будет ранжироваться лучше, чем такая же статья от случайного блогера. Поисковики научились оценивать авторитет источника.
Техническое SEO как основа. Безупречное техническое состояние сайта стало обязательным условием успеха. Ключевые моменты: скорость загрузки (особенно метрики Core Web Vitals), мобильная оптимизация, правильная разметка Schema.org. Медленные сайты без SSL-сертификатов «Яндекс» вообще перестал пускать в топ. Это не рекомендация — это требование.
Комплексный контент-маркетинг. Вместо коротких SEO-текстов нужно создавать материалы, которые реально решают проблемы пользователей. Тексты, видео, инфографика, подкасты — все, что поможет человеку разобраться в вопросе. Хороший пример — не статья «Как выбрать окна», а полноценный гид с чек-листами, калькулятором стоимости, видеообзорами материалов и реальными отзывами клиентов.
Да, но с пониманием новых правил игры. SEO стало сложнее, требует больше экспертизы и времени. Но при правильном подходе остается одним из самых эффективных каналов привлечения клиентов." sostav.ru
Это их тактика, когда нет фактов, пруфов, фактуры, – переходить на личности от злобы.
Клиент покупает у конкурентов. Мне вот тут недавно понадобилась Компрессионная муфта TEBO ПНД соединительная ( рубанул трубу на даче случайно).
Набрал запрос, зашёл топ один -топ два -топ три
И заказал подешевле на сайте который находится в топ 8. Пофиг топ 1, ищем дешевле.
Вы свои цены анализировали по сравнению с конкурентами? Поэтому топ1 не показатель наличия клиентов!
Одежду, обувь, еду, стройматериалы для ремонта, запчасти для машин как покупали так и покупают. Значит какая-то ошибка в маркетинге, бестолковые маркетологи видимо там.
Измерять галлюцинации сложно: у модели нет встроенного понимания правды, и она не знает, когда врёт. Поэтому оценки галлюцинаций часто делаются постфактум, с привлечением людей (ручная валидация), мета-моделей (детекторы галлюцинаций) или сравнения с базами знаний или источниками.
Пока нет универсального определения галлюцинации, всё зависит от задачи и контекста. Автоматические методы оценки ещё далеки от надёжности, поэтому требуется ручная разметка или наличие "истины", с которой можно сравнивать.
Среди автоматических можно выделить:
FactCC — модель-классификатор, обученная различать фактологически верные и ложные высказывания. Применима для задач суммаризации.
DAE Score (Dependency Arc Entailment) — основан на сопоставлении смысловой близости между сгенерированным и исходным текстом через синтаксические связи. Часто используется в задачах абстрактной суммаризации.
QAGS (Question Answering and Generation Score) — применим в задачах суммаризации и генерации. Оценивает фактологическую точность через промежуточные шаги: генерация вопросов по оригинальному тексту и получение ответов на них из сгенерированного. Чем больше совпадений, тем ниже уровень галлюцинаций.
GPT-based оценка — использование крупной модели (чаще всего GPT) для анализа фактической достоверности текста. Модель получает инструкцию: "Оцени, содержит ли данный текст утверждения, не подтверждаемые оригиналом", — и возвращает бинарный или градуированный вывод.
Одни из наиболее известных протоколов ручной аннотации HALO, HELP и MAF предлагают формализованные подходы, которые позволяют оценивать не просто факт искажения, но и его характер, контекст, уровень серьёзности.
HALO (Hallucination Annotation with Logical Outline) применяется в первую очередь в задачах open-domain диалогов.
Аннотация проводится вручную по заранее заданной схеме: оценивается, насколько генерация модели соответствует исходным фактам, и классифицируется тип галлюцинации.
Например, если пользователь спрашивает у модели: «Кто написал Преступление и наказание?», и та отвечает «Лев Толстой», HALO позволит оценить это как полную фактическую ошибку — придуманную галлюцинацию.
Если же модель скажет, что роман написал Достоевский, но в 1885 году (вместо 1866), это будет искажённый факт.
HALO также учитывает логические ошибки: если вывод модели формально вытекает из данных, но логика нарушена (например, делает обобщения без основания), аннотаторы фиксируют это как логическую галлюцинацию.
Этот протокол полезен для оценки моделей, предназначенных для общения с пользователями, где важно, чтобы модель не только звучала убедительно, но и говорила по делу.
HELP (Hallucination Evaluation with Language Professionals) используется в медицинских задачах, где ошибки модели могут стоить дорого. Здесь аннотирование проводят врачи или медицинские редакторы.
Они вручную оценивают тексты, сгенерированные моделью (например, ответы на клинические вопросы), и помечают фрагменты, содержащие недостоверную информацию.
Особенность HELP в том, что здесь учитываются не только явные фактические ошибки, но и потенциально опасные домыслы: например, если модель «рекомендует» метод лечения, эффективность которого не доказана, либо путает дозировки препаратов. Такая разметка требует глубоких знаний предметной области и чаще всего применяется в исследовательских работах или при тестировании медицинских чат-ботов.
MAF (Meaning Addition, Alteration, Fabrication) — это ещё один ручной протокол, ориентированный на разложение галлюцинации по типу и степени искажения. Он используется, например, при оценке саммари моделей (рефератов, пересказов и т.п.).
В рамках MAF аннотаторы определяют, добавила ли модель информацию, которой не было в исходном тексте (fabrication), изменила ли смысл (alteration) или добавила дополнительный смысл, который сложно проверить (addition).
Например, если модель суммирует статью о климате и «добавляет» утверждение о прямой связи между CO₂ и ураганами (чего в исходной статье нет), это будет fabrication.
Такой подход удобен в задачах суммаризации, реферирования, генерации новостей, особенно если важно избежать недостоверных обобщений.
Эти ручные метрики помогают строить датасеты для последующей автоматической оценки, калибровки моделей и обучения на обратной связи. Несмотря на их трудоёмкость, именно они задают стандарт, по которому можно сравнивать работу разных моделей на чувствительных или требующих фактической строгости задачах." sostav.ru