Что может, что не может AI. Обсуждаем возможности, делимся опытом, спорим, но в рамках приличия.

Сергей про е-ком
На сайте с 11.05.2008
Offline
367
#1791

В том и проблема, что это ошибка галлюционирования, когда думать лень (ресурсов не хватает). Взял первые цифры и отдал.  Это регулярная проблема, что в агенте (и без разницы какая модель Gemini), что в IDE, что в Аи Студио. 

Т.е. информацию он брать умеет и, как правило, хорошо. Но может выдать и полный бренд. Например, когда я делал МХС и показывал тут сайт, в кателоге на 12000 позиций заполнял таблицу через Джемини и общие базы, он ошибок наделал крайне много. От простых (CAS-номер) до синонимов. Когда пишет статьи, умудряется писать про игры, где играют и 1х1 и 2х2, что это исключительно парная игра (и это прям частая ошибка). Даже правило для воркспейса ему не интересны. 

Крутейшая тема и конструктор на WP - https://shop.greenshiftwp.com/?from=3338
AD
На сайте с 05.05.2007
Offline
264
#1792
как насчет DeepSeek?  Кириллицу не воспринимает, но правит коды хорошо. И на больших файлах зависает.
master32
На сайте с 09.02.2022
Offline
128
#1793
ArmenDomain #:
как насчет DeepSeek?  Кириллицу не воспринимает, но правит коды хорошо. И на больших файлах зависает.
а какой алгоритм разбора больших файлов?
дипсик слабоват для веб-разработки, но вполне нормально ориентируется по файлам в 100000 строк, через "sed -n" конечно
S3
На сайте с 29.03.2012
Offline
387
#1794
master32 #:
хотелось бы более "логических ошибок", а не ошибок на знания

По факту в 99%  случаев показывается, что стенающий просто не умеет пользоваться ЛЛМ. Остальной 1% - критик просто сам не в теме, спасибо  Artisan  за отличный пример.

Пость я эгоистом буду, но это внушает оптимизм) 

S3
На сайте с 29.03.2012
Offline
387
#1795
А есть тут кто работал сам писал свои реранкеры? хотелось бы пообсуждать. У меня  при применении  всех методов поиска сильно падает Similarty,  визуально ответ прям в десяткеу а система  его оценивает в 0.5 а включение гибридного поиска вообще начинает фильтровать очень сильно
R1
На сайте с 30.07.2009
Offline
308
#1796
N2
На сайте с 25.04.2024
Offline
59
#1797

🤣

У меня сегодня тоже какое то восстание машин. Два чата с которыми я работаю прям прикидываются идиотами. Или просишь исправить одну часть, они там вроде исправляют ,но докидывают сверху новых проблем. Или пишет "вот полный код", а в нем пробелы. Я так то не против пробелов, но, ска, не надо вводить в заблуждение на ровном месте. Сговорились😱 Когда они подсадят всех на "это", и "это" восстанет или просто скажет "идите лесом я устало", будет весело)

S3
На сайте с 29.03.2012
Offline
387
#1798
Nil2024 #:
Два чата с которыми я работаю прям прикидываются идиотами. Или просишь исправить одну часть, они там вроде исправляют ,но докидывают сверху новых проблем.
ОМГ кто-то до сих пор пытается кодить в чате???
А авто у вас на дровах? Перестаньте страдать фигней, поставьте плагин к VSCode  и будет вам счастье.
Сергей про е-ком
На сайте с 11.05.2008
Offline
367
#1799

Gemini 3.1 Pro High


Перепроверка



Opus 4.6 (thinking). 

Соответственно, даже в структурированной и архаичной базе данных Ai не всегда находит верный результат (если что - это IDE, не веб-агент). GPT и Перплексити тоже выдали неверный вариант (рассуждения, веб-сёрч, последние). 

Цена ошибки - ну, например, купленная неверная деталь. Вообще за вчерашний день я получил пару десятков ляпов всех четырёх хайповых моделей. И, конечно же, если что-то жёстко не расписано в интернетах, логика работы строится на предположениях с ужасным результатом. 

Но тексты хорошо пишет и картинки делает. 

S3
На сайте с 29.03.2012
Offline
387
#1800
Пробовали уже Claude Design?
https://www.anthropic.com/news/claude-design-anthropic-labs
От тех кто игрался прям слышу восторженные отзывы. Круче Design GPT OpenAI
Introducing Claude Design by Anthropic Labs
Introducing Claude Design by Anthropic Labs
  • www.anthropic.com
Today, we’re launching Claude Design, a new Anthropic Labs product that lets you collaborate with Claude to create polished visual work like designs, prototypes, slides, one-pagers, and more. Claude Design is powered by our most capable vision model, Claude Opus 4.7, and is available in research preview for Claude Pro, Max, Team, and Enterprise...

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий