Угу, давай...
Вот именно. Со своей стороны ты можешь создать своего агента, обученного на твоих данных. Но это будет работать только в нем. никакой общий чат ты не обучишь.Нет, ну ты конечно можешь скачать модель и дополнить ее своим слоями, но я очень сомневаюсь, что это тебе под силу...
А как я могу проверить, что ты на своем сайте не бред пишешь? А ГПТ проверит, допустим с помощью построения эмбеддингов:
- Генерирует эмбеддинги для всех текстов
- Сравнивают косинусное сходство.
- Если два текста слишком похожи (например, similarity > 0.95) — один из них выбрасывают.
Это только один из этапов.Я пробовал прогонять раззные тексты, даже сообщения с этого форума - довольно интересные результаты.
Тексты некоторых персонажей прямо на уровне модерации удалаются, а из 10 может выбрать только один по similarty_scoreНо что я распинаюсь, для тебя это все белый шум. Азимова почитай про роль математики в обществе...
Да, блин, почитай уже как создаются модели для нейросетей! Уже надоело как попугаю твердить одно и тоже. Отличают и очень хорошо. Новый контент будет добавляться, если он соответствует критериям. Для этого работают довольно сложные алгоритмы. Я могу рассказать в простой форме, но вряд ли тебе это на самом деле нужно. Тебе нужно поныть тут.
Поделишься, проверим? А вообще, чтоб не льстить себе, советую изучить, как чат работает с ChatHistory и в целом, что это такое. Твои "закладки" - только для тебя.
И в сотый раз - никто не скармливает ГПТ такие инфосайты. Но ты все равно эту мантру продолжаешь.
Идиотский вопрос - для соблюдения авторского права, зачем же еще?
Она генерит свои ответы на основе данных, на которых ее обучили, зачем передергивать мой ответ? Источники - разные, что непонятного.
Да, двоечник тоже генерит бред, если не знает ответа, нейросеть поступает также, не понимаю удивления. Это не база данных.
Твои выводы не имеют ничего общего с реальностью. Могу поспорить, если я попрошу привести статистику, по которой ты сделал такие выводы - получу фигу. А может дело в другом - поисковые системы теперь лучше фильтруют траффик и передают запросы более релевантные контенту, сооттветственно, трафик стал чище. И такой вопрос - посещаемость выросла или нет?
То есть получается, что если ты на сайте приводишь решение теоремы Пифагора - ты нарушаешь авторское право учебника по геометрии за 8-й класс? Ты же его взял за основу? Нейросети НЕ ЗАНИМАЮТСЯ прямым цитированием! Пора уже уяснить! Там в самом названии - Generatе. Точно также любого выпускника можно притянуть за нарушение, потому что он использует знания, полученные в институте. По твоей логике.
Авторское право для всех одинаково. Да, с этим есть проблема в использовании ИИ, никуда не денешься. Но она ничем не отличается от такой же с твоим сайтом. Просто это гораздо масштабнее и затронуло много областей. Придут к тому что доступ в ИИ будет только платным, а создатели будут платить авторские.
Я не очень понял твой вопрос, видимо. Потому и отсеяли, что он неадекваты))
Ну вот я не понимаю. Вроде ты не производишь впечатление абсолютного тупицы. Но изо дня в день долдонишь эту мантру. Уже писал не раз и вот снова - почему бы сначала не поинтересоваться, как ИИ собирает информацию. Как ее выбраковывает. Для нейросети точно так же источник инфромации - книги, учебники, научные труды - это основа. Ну не попадет туда инфа из вот этих сайтиков, рерайченых и основанных на генерации - они отфильтруются алгоритмами. Не идет в модель весь мусор в сети - от отфильтровывается как дубликат, иначе никаких мощностей не хватит. И совпадение ответов вычисляется по формулам. Это уже даже тут не раз было пережевано и вы все равно твердите эту ерунду.
Я, например написал себе систему, которая подбирает релевантные ответы на основе косинусного совпадения, это самый простой способ, а есть и покруче алгоритмы, но меня для них уже знаний математики не хватает.
Ну так и есть, раздел с советами по фласк сделан "на отвали", чисто под сеошку, а не для пользователя.
Ну так а эти "магазинчики" откуда берут свой контент? Точно так же тырят. Вот круг и замкнулся. Нейросети стали предоставлять более удобный сервис, вот и выигрывают в конкуренции на рынке. И тут надо не плакаться а искать варианты - как это можно обернуть себе на пользу.
Толковый совет 👍. Но в форме может быть относительный путь, а может вообще быть обработка на JS, который в другом файле. Можно просто в консоли разаботчика посмотреть в браузере. Там же можно увидеть и есть ли какая защита, например, токен.