Обсуждается проблема обучения LLM на семантику и использование фейковых API - Курилка

Что может, что не может AI. Обсуждаем возможности, делимся опытом, спорим, но в рамках приличия.

Sly32 · 2024-11-03T11:12:06.0000000Z

Довольно многои темы сваливаются в применение ИИ в тех или иных областях. Предлагаю со всеми этими вопросами приходить сюда. Делимся проблемами, опытом, рассказываем что сделали с помощью ИИ. Различия моделей, как работает и прочие новости в области AI

S3

391

Sly32

7 марта 2026, 07:19

#1081

Сергей про е-ком #:
Эти данные вытаскиваются Ai, как вариант, по URL.

О чем ты вообще говоришь? при чем тут УРЛы? Я тебе про то, что под капотом у ЛЛМ - ты мне приводишь результат работы бота какого-то...

Раз уж ты решил, что ты программист - возьми и посмотри какие ответы отдает голая ЛЛМ.

Вова - ты не Я поймал Lora на Фильтрация и кластеризация ключей

386

Сергей про е-ком

7 марта 2026, 07:32

#1082

Какая в данном случае разница с LLM? Я привёл конкретный пример первого экрана. С LLM работаю точно также в контексте семантики. Отрезая всё лишнее. И, да, в формате ответа ошибок нет. Есть ошибки с логикой LLM и с тем, что она де факто необучаема. )

Крутейшая тема и конструктор на WP - https://shop.greenshiftwp.com/?from=3338

Skimlinks и аналоги для Индусы захватят мир(программирования) ИИ врёт?

S3

391

Sly32

7 марта 2026, 07:35

#1083

Сергей про е-ком #:
Какая в данном случае разница с LLM?

Огромная.

Сергей про е-ком #:
Есть ошибки с логикой LLM и с тем, что она де факто необучаема. )

Да? Спасибо, что просвятил. Непонятно тогда чем я занимаюсь на работе)))

Почитай про Supervised Fine-Tuning (SFT), Parameter-Efficient Fine-Tuning (PEFT), Prompt-tuning и многие другие интересные штуки.

386

Сергей про е-ком

7 марта 2026, 07:38

#1084

Sly32 #:
Огромная.

Да? Спасибо, что просвятил. Непонятно тогда чем я занимаюсь на работе)))

Я тоже не понимаю. Но сервиса по SEO мы до сих пор не видим. Ну и, согласен, я неверно мысль сформулировал. Обучить LLM на работу с семантикой невозможно. Потому что слишком много неизвестных и данных. А это - краеугольный камень SEO. Ты, кстати, если идею не забросил, изучи тему hard и soft кластеризации, сними выдачу, погоняй. Это - автоматика по СЕРПу, не по интенту. Так вот, у тебя не будет прогнозируемых результатов. Они всегда будут разные. Это - печально. Т.е. ты можешь обучить на конкретную нишу (например, та самая доставка грузов), но для каждой новой ниши тебе надо будет обучать отдельно. А это дольше, чем руками сделать.

1

Новый нейротопик Обучение цели переносится на Как получить ТИЦ 500.

S3

391

Sly32

7 марта 2026, 07:46

#1085

Сергей про е-ком #:
Но сервиса по SEO мы до сих пор не видим

Именно потому что у меня есть основная работа, за которую мне платят. А этот сервис - так, развлечение.

Сергей про е-ком #:
Потому что слишком много неизвестных и данных. А это - краеугольный камень SEO. Ты, кстати, если идею не забросил, изучи тему hard и soft кластеризации, сними выдачу, погоняй. Это - автоматика по СЕРПу, не по интенту. Так вот, у тебя не будет прогнозируемых результатов. Они всегда будут разные. Это - печально. Т.е. ты можешь обучить на конкретную нишу (например, та самая доставка грузов), но для каждой новой ниши тебе надо будет обучать отдельно. А это дольше, чем руками сделать.

Забавно, ты описал в целом правильный алгоритм, но пришел к неправильному выводу о невозможности. В том и плюс таких систем, что они будут гораздо быстрее и точнее работать, чем собирать все это руками. Датасеты под каждую тематику достаточно создать один раз и они будут храниться, при необходимости вытягиваться. Дообучение, как ты это назвал(на самом деле это называется обогащение дополнительными знаниями - RAG)

За подсказки спасибо, попробую, учту.
К сожалению, должен признаться, появилась в голове более интересная идея сервиса. Все свободное время уходит на него. По сео-агенту пока статия накопления знаний. Так что будут еще идеи - пиши, с удовольствием подумаю над ними. Пока достаточно области семантики

Google анонсировал "AI Mode" Готовы ли Вы? relap от Surfingbird -

S3

391

Sly32

7 марта 2026, 08:26

#1086

Кстати, любителям использовать всякие сомнительные сервисы а потом ругать клауд/гпт стоит задуматься -

Исследователи провели аудит 17 сторонних API для LLM-агентов и выяснили:

• почти 46% endpoint'ов не проходят fingerprint-тесты

• API заявляет, что это GPT-5 или Gemini-2.5, а на бэкенде тихо подставлен GLM-4

• точность на медицинском бенчмарке падает с 83% до 37%

Эти фейковые API уже процитированы в 187 научных статьях, а некоторые связанные с ними проекты набрали почти 60 тысяч звёзд на GitHub.И главная проблема тут в том, что научные выводы строятся на поддельных моделях.

https://arxiv.org/abs/2603.01919

Real Money, Fake Models: Deceptive Model Claims in Shadow APIs

arxiv.org

View PDF HTML (experimental) Access to frontier large language models (LLMs), such as GPT-5 and Gemini-2.5, is often hindered by high pricing, payment barriers, and regional restrictions. These limitations drive the proliferation of $\textit{shadow APIs}$, third-party services that claim to provide access to official model services without...

Статьи нейросети для сайта Наполнить сайт статьями от Более трети россиян не

S3

391

Sly32

14 марта 2026, 12:16

#1087

Ответов я так и не дождался, ну и ладно. Потому как основная идея продвигается и вот уже есть какие-то результаты. Начиная с разработки простенького ресурса для репетиоров, где можно найти нужного, зарезервировать время и заниматься с жимым репетитором, перешел сначала к идее тестов/квизов по любым предметам, а теперь еще и к полностью автономному тьютору на базе ИИ. Можно создать тему, наполнить вопросами и твои ИИ аватар будет вести занятие с ученикомпо этой теме, помогая изучать и проверяя знания. Получается довольно забавно. Даже в базе, без RAG и продвинутых промптов получается подобие интерактивного урока по теме. Пока что тьютор очень лоялен, но все это будет настраиваться. Также вместо текстового чата будет голосовое общение, интерактивная доска... Использую Openai. Один урок на 10 вопросов стоит примерно 1 цент, но хочу еще и бесплатные модели прикрутить. Пока не разворачивал на постоянном хостинге, но кому интересно могу в личку скинуть видео с демонстрацией, как работает. Тут только скрины. Разверну на хостинге - приглашу желающих потестить)

Блог и магазинчик. Как Нужна ли "Реалити разработка" Сколько платить админам?

386

Сергей про е-ком

14 марта 2026, 12:20

#1088

Картинки не работают, семантику я тебе скинул, ответа не дождался. )

S3

391

Sly32

14 марта 2026, 12:25

#1089

Сергей про е-ком #:
Картинки не работают, семантику я тебе скинул, ответа не дождался. )

не заметил, потому как в бане был, гляну. Картинки видимо долго подгружаются.

386

Сергей про е-ком

14 марта 2026, 12:49

#1090

Sly32 #:
не заметил, потому как в бане был, гляну. Картинки видимо долго подгружаются.

Я тебе и послал, когда ты из бана вышел. )

Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ

В 2023 году Одноклассники пресекли более 9 млн подозрительных входов в учетные записи

Что может, что не может AI. Обсуждаем возможности, делимся опытом, спорим, но в рамках приличия.