Sly32

Рейтинг
372
Регистрация
29.03.2012
Vladimir K #:
Когда и если сработает эти скину в личку.

Угу, давай...

Vladimir K #:
возник затуп с обработкой данных с портала открытых данных, жпт попросил скинуть ему 10 строк примера.

Вот именно. Со своей стороны ты можешь создать своего агента, обученного на твоих данных. Но это будет работать только в нем. никакой общий чат ты не обучишь.
Нет, ну ты конечно можешь скачать модель и дополнить ее своим слоями, но я очень сомневаюсь, что это тебе под силу...

plab #:
Основной критерий должен быть - достоверность информации. Как ЖПТ это проверит?

А как я могу проверить, что ты на своем сайте не бред пишешь? 
 А ГПТ проверит, допустим с помощью  построения эмбеддингов:

- Генерирует эмбеддинги для всех текстов

- Сравнивают косинусное сходство.

- Если два текста слишком похожи (например, similarity > 0.95) — один из них выбрасывают.

Это только один из этапов.
Я пробовал прогонять раззные тексты, даже сообщения с этого форума - довольно интересные результаты. 

Тексты некоторых персонажей прямо на уровне модерации удалаются, а из 10 может выбрать только один по similarty_score
Но что я распинаюсь, для тебя это все белый шум. Азимова почитай про роль математики в обществе...

plab #:
А как ты отличишь, "такой" сайт от "нетакого"? Какие новые появляются, с таких и жрут-с обновления для своих ЖПТ.

Да, блин, почитай уже как создаются модели для нейросетей! Уже надоело как попугаю твердить одно и тоже.  Отличают и очень хорошо. Новый контент будет добавляться, если он соответствует критериям. Для этого работают довольно сложные алгоритмы. Я могу рассказать в простой форме,  но вряд ли тебе это на самом деле нужно. Тебе нужно поныть тут.

Vladimir K #:
Уже сделал несколько "закладок" на будущее. Выдумал "термины", за три месяца жпт стал по ним выдавать то, что я выдумал. Знаю кого через год этим буду путать)). Берите на вооружение.

Поделишься, проверим? А вообще, чтоб не льстить себе, советую изучить, как чат работает с ChatHistory и в целом, что это такое.  Твои "закладки"   - только для тебя.

plab #:
Чтобы ЖПТ оставался в здравом уме, ему надо скармливать здравую информацию. Сейчас в качественный контент никто вкладываться не будет. Не окупается. Инфо-сайты пилят школьники из ответов ЖПТ

И в сотый раз - никто не скармливает ГПТ такие инфосайты. Но ты все равно эту мантру продолжаешь.

plab #:
Зачем тогда ставят ссылки на сайты-источники информации для своих ЖПТ-ответов?

Идиотский вопрос - для соблюдения авторского права, зачем же еще?

plab #:
что она генерит свои уникальные ответы на базе научных знаний

Она генерит свои ответы на основе данных, на которых ее обучили, зачем передергивать мой ответ? Источники - разные, что непонятного.

plab #:
Поэтому реальные практические данные становятся с примесью бреда.

Да, двоечник тоже генерит бред, если не знает ответа, нейросеть поступает также, не понимаю удивления. Это не база данных.

plab #:
Поясняю. Когда только врубили GPT, показатели поведенческих характеристик сайтов улучшились. На сайтах остался траф более старшего возраста и дерьмовых комментариев уменьшилось. Среднее время, проведенное трафом на сайтах, улучшилось. Так понятно? Если бы ЖПТ давал нормальные ответы, умные бы на сайты не ходили. Говорю прямо - ЖПТ читают дураки.

Твои выводы не имеют ничего общего с реальностью. Могу поспорить, если я попрошу привести статистику, по которой ты сделал такие выводы - получу фигу. А может дело в другом - поисковые системы теперь лучше фильтруют траффик и передают запросы более релевантные контенту, сооттветственно, трафик стал чище. И такой вопрос - посещаемость выросла или нет?

plab #:
У книг есть авторское право. Их нельзя взять за основу.

То есть получается, что если ты на сайте приводишь решение теоремы Пифагора - ты нарушаешь авторское право учебника по геометрии за 8-й класс? Ты же его взял за основу?  Нейросети НЕ ЗАНИМАЮТСЯ прямым цитированием! Пора уже уяснить! Там в самом названии - Generatе. Точно также любого выпускника можно притянуть за нарушение, потому что он использует знания, полученные в институте. По твоей логике.

Авторское право для всех одинаково. Да, с этим есть проблема в использовании ИИ, никуда не денешься. Но она ничем не отличается от такой же с твоим сайтом. Просто это гораздо масштабнее и затронуло много областей. Придут к тому что доступ в ИИ будет только платным, а создатели будут платить авторские.

plab #:
Тогда почему нейросети отсеяли с сайтов в первую очередь неадекватов и школоту? 

Я не очень понял твой вопрос, видимо. Потому и отсеяли, что он неадекваты))

plab #:
В основном да, но из книг и достоверных источников информации.
plab #:
Уже стадо умельцев кормит ЖПТ его же ответами. 

Ну вот я не понимаю. Вроде ты не производишь впечатление абсолютного тупицы. Но изо дня в день долдонишь эту мантру. Уже писал не раз и вот снова - почему бы сначала не поинтересоваться, как ИИ собирает информацию. Как ее выбраковывает. Для нейросети точно так же источник инфромации - книги, учебники, научные труды - это основа. Ну не попадет туда инфа из вот этих сайтиков, рерайченых и основанных на генерации - они отфильтруются алгоритмами. Не идет в модель весь мусор в сети - от отфильтровывается как дубликат, иначе никаких мощностей не хватит. И совпадение ответов вычисляется по формулам. Это уже даже тут не раз было пережевано и вы все равно твердите эту ерунду. 

Я, например написал себе систему, которая подбирает релевантные ответы на основе косинусного совпадения, это самый простой способ, а есть и покруче алгоритмы, но меня для них уже знаний математики не хватает. 

Snake800 #:
Там, как я понял, просто предлагается купить шаблон. Каких-либо мануалов не увидел.

Ну   так и есть, раздел с советами по фласк сделан "на отвали", чисто под сеошку, а не для пользователя. 

plab #:
Так супермаркеты-ЖПТ тырят "товары" из этих магазинчиков-сайтов.

Ну так а эти "магазинчики" откуда берут свой контент? Точно так же тырят. Вот круг и замкнулся. Нейросети стали предоставлять более удобный сервис, вот и выигрывают в конкуренции на рынке. И тут надо не плакаться а искать варианты - как это можно обернуть себе на пользу.

Vladimir #:
Как проверить, посмотреть код - какой файл получает и обрабатывает данные с формы

Толковый совет 👍. Но в форме может быть относительный путь, а может вообще быть обработка на JS, который в другом файле. Можно просто в консоли разаботчика посмотреть в браузере. Там же можно увидеть и есть ли какая защита, например, токен.

Всего: 7407