ИИ часто ошибается, выдает галлюцинации и не справляется с кириллицей и большими файлами - Курилка

Что может, что не может AI. Обсуждаем возможности, делимся опытом, спорим, но в рамках приличия.

Sly32 · 2024-11-03T11:12:06.0000000Z

Довольно многои темы сваливаются в применение ИИ в тех или иных областях. Предлагаю со всеми этими вопросами приходить сюда. Делимся проблемами, опытом, рассказываем что сделали с помощью ИИ. Различия моделей, как работает и прочие новости в области AI

382

Сергей про е-ком

25 мая 2026, 08:41

#1791

vitaliy11 #:

В том и проблема, что это ошибка галлюционирования, когда думать лень (ресурсов не хватает). Взял первые цифры и отдал. Это регулярная проблема, что в агенте (и без разницы какая модель Gemini), что в IDE, что в Аи Студио.

Т.е. информацию он брать умеет и, как правило, хорошо. Но может выдать и полный бренд. Например, когда я делал МХС и показывал тут сайт, в кателоге на 12000 позиций заполнял таблицу через Джемини и общие базы, он ошибок наделал крайне много. От простых (CAS-номер) до синонимов. Когда пишет статьи, умудряется писать про игры, где играют и 1х1 и 2х2, что это исключительно парная игра (и это прям частая ошибка). Даже правило для воркспейса ему не интересны.

1

Крутейшая тема и конструктор на WP - https://shop.greenshiftwp.com/?from=3338

SEO AI agent - Облачный майнинг Инфосайты - всё?

AD

266

ArmenDomain

25 мая 2026, 09:26

#1792

как насчет DeepSeek? Кириллицу не воспринимает, но правит коды хорошо. И на больших файлах зависает.

132

master32

25 мая 2026, 09:32

#1793

ArmenDomain #:
как насчет DeepSeek? Кириллицу не воспринимает, но правит коды хорошо. И на больших файлах зависает.

а какой алгоритм разбора больших файлов?
дипсик слабоват для веб-разработки, но вполне нормально ориентируется по файлам в 100000 строк, через "sed -n" конечно

1

S3

390

Sly32

25 мая 2026, 12:10

#1794

master32 #:
хотелось бы более "логических ошибок", а не ошибок на знания

По факту в 99% случаев показывается, что стенающий просто не умеет пользоваться ЛЛМ. Остальной 1% - критик просто сам не в теме, спасибо Artisan за отличный пример.

Пость я эгоистом буду, но это внушает оптимизм)

Artisan - Профиль вебмастера - Форум об интернет-маркетинге

searchengines.guru

Artisan - Профиль вебмастера

SPA SEO Page Audit Как вы маркируете партнерские Разработаю сайты и многое

S3

390

Sly32

25 мая 2026, 15:05

#1795

А есть тут кто работал сам писал свои реранкеры? хотелось бы пообсуждать. У меня при применении всех методов поиска сильно падает Similarty, визуально ответ прям в десяткеу а система его оценивает в 0.5 а включение гибридного поиска вообще начинает фильтровать очень сильно

Яндекс карты: новые принципы Бесплатное обучение дорвеям! Статья Визуальные закладки на новом

R1

312

Ramzes_13

25 мая 2026, 17:39

#1796

[Удален]

25 мая 2026, 18:06

#1797

Ramzes_13 #:

🤣

У меня сегодня тоже какое то восстание машин. Два чата с которыми я работаю прям прикидываются идиотами. Или просишь исправить одну часть, они там вроде исправляют ,но докидывают сверху новых проблем. Или пишет "вот полный код", а в нем пробелы. Я так то не против пробелов, но, ска, не надо вводить в заблуждение на ровном месте. Сговорились😱 Когда они подсадят всех на "это", и "это" восстанет или просто скажет "идите лесом я устало", будет весело)

Яндекс бот сам удаляет Открытая регистрация доменов в Сколько стоит домен?

S3

390

Sly32

26 мая 2026, 06:27

#1798

Nil2024 #:
Два чата с которыми я работаю прям прикидываются идиотами. Или просишь исправить одну часть, они там вроде исправляют ,но докидывают сверху новых проблем.

ОМГ кто-то до сих пор пытается кодить в чате???
А авто у вас на дровах? Перестаньте страдать фигней, поставьте плагин к VSCode и будет вам счастье.

382

Сергей про е-ком

26 мая 2026, 07:35

#1799

Gemini 3.1 Pro High

Перепроверка

Opus 4.6 (thinking).

Соответственно, даже в структурированной и архаичной базе данных Ai не всегда находит верный результат (если что - это IDE, не веб-агент). GPT и Перплексити тоже выдали неверный вариант (рассуждения, веб-сёрч, последние).

Цена ошибки - ну, например, купленная неверная деталь. Вообще за вчерашний день я получил пару десятков ляпов всех четырёх хайповых моделей. И, конечно же, если что-то жёстко не расписано в интернетах, логика работы строится на предположениях с ужасным результатом.

Но тексты хорошо пишет и картинки делает.

Лимиты Antygaravity Как продолжить написание кода Google представила нейросеть нового

S3

390

Sly32

26 мая 2026, 08:20

#1800

Пробовали уже Claude Design?
https://www.anthropic.com/news/claude-design-anthropic-labs
От тех кто игрался прям слышу восторженные отзывы. Круче Design GPT OpenAI

Introducing Claude Design by Anthropic Labs

www.anthropic.com

Today, we’re launching Claude Design, a new Anthropic Labs product that lets you collaborate with Claude to create polished visual work like designs, prototypes, slides, one-pagers, and more. Claude Design is powered by our most capable vision model, Claude Opus 4.7, and is available in research preview for Claude Pro, Max, Team, and Enterprise...

Что такое Power BI и зачем это нужно бизнесу

VK приобрела 70% в структуре компании-разработчика red_mad_robot

Что может, что не может AI. Обсуждаем возможности, делимся опытом, спорим, но в рамках приличия.