Sly32

Рейтинг
367
Регистрация
29.03.2012
Vladimir SEO #:
прямая, не будет статей - не будет данных в нейросети. Это же очевидно 

Ты всерьез считаешь, что нейросеть обучается по статьям с инфошечек? мдя...  Так, к слову, существующих данны достаточно для обучения нейросетей на десятилетия вперед. Новая модель, вот например GPT-5 это не только новые данные, хотя несомненно, что в обучение добавляют свежее. Самое важное - новые алгоритмы, как уже убедились, они могут и ухудшить работу. 

А я собственно и работаю сейчас на одно из крупнейших мировых информационных агенств. И вижу какое бабло они тратят на все эти нейросети.

Vladimir SEO #:
да просто интересно - где ? реально количество статейников будет падать изза ии ответов , ибо нету трафика - нету денег с адсенса

Ты пытаешься смешать в один вопрос разные вещи и ждешь ответа. Какая связь между данными в нейросети, на которых она обучается и статьями в поиске? Ты прям думаешь, написал условный Вася сайт и тут же чатГПТ побежал его забирать?  Это не так работает. Это не поисковый краулер, там другая задача. Кароче, инфы в сети достаточно, как это работает, ищите и читайте, если интересно.

Vladimir K #:
Думаешь при обновлении базы, если размещение было верным и достаточным в количестве, не съест ?

Открывать пора платные курсы тут на форуме, по чтению для начала.  Количество никак не влияет, дупликаты отбрасываются. Термин "верное размещение"  мне непонятен. Нейромодели оперируют своими понятиями, из которых векторное сходство - самое простое. Любая информация будет сначала сравниваться с эталонными данными, допустим академическими дисциплинами, науками, а все это количество, ссылки - для нейросети ненужная информация. 

Vladimir SEO #:
тут важный вопрос - где брать новый контент если инфо сайты сдуются грубо говоря ? 

Вы сговорились, да?

Vladimir K #:
Когда и если сработает эти скину в личку.

Угу, давай...

Vladimir K #:
возник затуп с обработкой данных с портала открытых данных, жпт попросил скинуть ему 10 строк примера.

Вот именно. Со своей стороны ты можешь создать своего агента, обученного на твоих данных. Но это будет работать только в нем. никакой общий чат ты не обучишь.
Нет, ну ты конечно можешь скачать модель и дополнить ее своим слоями, но я очень сомневаюсь, что это тебе под силу...

plab #:
Основной критерий должен быть - достоверность информации. Как ЖПТ это проверит?

А как я могу проверить, что ты на своем сайте не бред пишешь? 
 А ГПТ проверит, допустим с помощью  построения эмбеддингов:

- Генерирует эмбеддинги для всех текстов

- Сравнивают косинусное сходство.

- Если два текста слишком похожи (например, similarity > 0.95) — один из них выбрасывают.

Это только один из этапов.
Я пробовал прогонять раззные тексты, даже сообщения с этого форума - довольно интересные результаты. 

Тексты некоторых персонажей прямо на уровне модерации удалаются, а из 10 может выбрать только один по similarty_score
Но что я распинаюсь, для тебя это все белый шум. Азимова почитай про роль математики в обществе...

plab #:
А как ты отличишь, "такой" сайт от "нетакого"? Какие новые появляются, с таких и жрут-с обновления для своих ЖПТ.

Да, блин, почитай уже как создаются модели для нейросетей! Уже надоело как попугаю твердить одно и тоже.  Отличают и очень хорошо. Новый контент будет добавляться, если он соответствует критериям. Для этого работают довольно сложные алгоритмы. Я могу рассказать в простой форме,  но вряд ли тебе это на самом деле нужно. Тебе нужно поныть тут.

Vladimir K #:
Уже сделал несколько "закладок" на будущее. Выдумал "термины", за три месяца жпт стал по ним выдавать то, что я выдумал. Знаю кого через год этим буду путать)). Берите на вооружение.

Поделишься, проверим? А вообще, чтоб не льстить себе, советую изучить, как чат работает с ChatHistory и в целом, что это такое.  Твои "закладки"   - только для тебя.

plab #:
Чтобы ЖПТ оставался в здравом уме, ему надо скармливать здравую информацию. Сейчас в качественный контент никто вкладываться не будет. Не окупается. Инфо-сайты пилят школьники из ответов ЖПТ

И в сотый раз - никто не скармливает ГПТ такие инфосайты. Но ты все равно эту мантру продолжаешь.

plab #:
Зачем тогда ставят ссылки на сайты-источники информации для своих ЖПТ-ответов?

Идиотский вопрос - для соблюдения авторского права, зачем же еще?

plab #:
что она генерит свои уникальные ответы на базе научных знаний

Она генерит свои ответы на основе данных, на которых ее обучили, зачем передергивать мой ответ? Источники - разные, что непонятного.

plab #:
Поэтому реальные практические данные становятся с примесью бреда.

Да, двоечник тоже генерит бред, если не знает ответа, нейросеть поступает также, не понимаю удивления. Это не база данных.

plab #:
Поясняю. Когда только врубили GPT, показатели поведенческих характеристик сайтов улучшились. На сайтах остался траф более старшего возраста и дерьмовых комментариев уменьшилось. Среднее время, проведенное трафом на сайтах, улучшилось. Так понятно? Если бы ЖПТ давал нормальные ответы, умные бы на сайты не ходили. Говорю прямо - ЖПТ читают дураки.

Твои выводы не имеют ничего общего с реальностью. Могу поспорить, если я попрошу привести статистику, по которой ты сделал такие выводы - получу фигу. А может дело в другом - поисковые системы теперь лучше фильтруют траффик и передают запросы более релевантные контенту, сооттветственно, трафик стал чище. И такой вопрос - посещаемость выросла или нет?

plab #:
У книг есть авторское право. Их нельзя взять за основу.

То есть получается, что если ты на сайте приводишь решение теоремы Пифагора - ты нарушаешь авторское право учебника по геометрии за 8-й класс? Ты же его взял за основу?  Нейросети НЕ ЗАНИМАЮТСЯ прямым цитированием! Пора уже уяснить! Там в самом названии - Generatе. Точно также любого выпускника можно притянуть за нарушение, потому что он использует знания, полученные в институте. По твоей логике.

Авторское право для всех одинаково. Да, с этим есть проблема в использовании ИИ, никуда не денешься. Но она ничем не отличается от такой же с твоим сайтом. Просто это гораздо масштабнее и затронуло много областей. Придут к тому что доступ в ИИ будет только платным, а создатели будут платить авторские.

Всего: 7101