Ты всерьез считаешь, что нейросеть обучается по статьям с инфошечек? мдя... Так, к слову, существующих данны достаточно для обучения нейросетей на десятилетия вперед. Новая модель, вот например GPT-5 это не только новые данные, хотя несомненно, что в обучение добавляют свежее. Самое важное - новые алгоритмы, как уже убедились, они могут и ухудшить работу.
А я собственно и работаю сейчас на одно из крупнейших мировых информационных агенств. И вижу какое бабло они тратят на все эти нейросети.
Ты пытаешься смешать в один вопрос разные вещи и ждешь ответа. Какая связь между данными в нейросети, на которых она обучается и статьями в поиске? Ты прям думаешь, написал условный Вася сайт и тут же чатГПТ побежал его забирать? Это не так работает. Это не поисковый краулер, там другая задача. Кароче, инфы в сети достаточно, как это работает, ищите и читайте, если интересно.
Открывать пора платные курсы тут на форуме, по чтению для начала. Количество никак не влияет, дупликаты отбрасываются. Термин "верное размещение" мне непонятен. Нейромодели оперируют своими понятиями, из которых векторное сходство - самое простое. Любая информация будет сначала сравниваться с эталонными данными, допустим академическими дисциплинами, науками, а все это количество, ссылки - для нейросети ненужная информация.
Вы сговорились, да?
Угу, давай...
Вот именно. Со своей стороны ты можешь создать своего агента, обученного на твоих данных. Но это будет работать только в нем. никакой общий чат ты не обучишь.Нет, ну ты конечно можешь скачать модель и дополнить ее своим слоями, но я очень сомневаюсь, что это тебе под силу...
А как я могу проверить, что ты на своем сайте не бред пишешь? А ГПТ проверит, допустим с помощью построения эмбеддингов:
- Генерирует эмбеддинги для всех текстов
- Сравнивают косинусное сходство.
- Если два текста слишком похожи (например, similarity > 0.95) — один из них выбрасывают.
Это только один из этапов.Я пробовал прогонять раззные тексты, даже сообщения с этого форума - довольно интересные результаты.
Тексты некоторых персонажей прямо на уровне модерации удалаются, а из 10 может выбрать только один по similarty_scoreНо что я распинаюсь, для тебя это все белый шум. Азимова почитай про роль математики в обществе...
Да, блин, почитай уже как создаются модели для нейросетей! Уже надоело как попугаю твердить одно и тоже. Отличают и очень хорошо. Новый контент будет добавляться, если он соответствует критериям. Для этого работают довольно сложные алгоритмы. Я могу рассказать в простой форме, но вряд ли тебе это на самом деле нужно. Тебе нужно поныть тут.
Поделишься, проверим? А вообще, чтоб не льстить себе, советую изучить, как чат работает с ChatHistory и в целом, что это такое. Твои "закладки" - только для тебя.
И в сотый раз - никто не скармливает ГПТ такие инфосайты. Но ты все равно эту мантру продолжаешь.
Идиотский вопрос - для соблюдения авторского права, зачем же еще?
Она генерит свои ответы на основе данных, на которых ее обучили, зачем передергивать мой ответ? Источники - разные, что непонятного.
Да, двоечник тоже генерит бред, если не знает ответа, нейросеть поступает также, не понимаю удивления. Это не база данных.
Твои выводы не имеют ничего общего с реальностью. Могу поспорить, если я попрошу привести статистику, по которой ты сделал такие выводы - получу фигу. А может дело в другом - поисковые системы теперь лучше фильтруют траффик и передают запросы более релевантные контенту, сооттветственно, трафик стал чище. И такой вопрос - посещаемость выросла или нет?
То есть получается, что если ты на сайте приводишь решение теоремы Пифагора - ты нарушаешь авторское право учебника по геометрии за 8-й класс? Ты же его взял за основу? Нейросети НЕ ЗАНИМАЮТСЯ прямым цитированием! Пора уже уяснить! Там в самом названии - Generatе. Точно также любого выпускника можно притянуть за нарушение, потому что он использует знания, полученные в институте. По твоей логике.
Авторское право для всех одинаково. Да, с этим есть проблема в использовании ИИ, никуда не денешься. Но она ничем не отличается от такой же с твоим сайтом. Просто это гораздо масштабнее и затронуло много областей. Придут к тому что доступ в ИИ будет только платным, а создатели будут платить авторские.