LikeAVirgin

Рейтинг
144
Регистрация
05.09.2011
GreenLis #:
Вы мне базу-то не рассказывайте, я сам в тренировках LLM участвовал, тех самых, которые у всех на слуху. И я как бы в курсе, откуда они берут инфу и что это можно подтвердить.  Пейсбук недавно спалился, откуда и как они извлекали данные для базы. 

И когда вы в тренировах участвовали, то вы видели имнно такую базу: "информационный запрос" = "источник"? Вот прямо по каждому возможному промту, который пользователь может задать?

Интересно, а что там стояло как источник на промт "что такое грибы"? Вот прямо один единственный и неповторимый источник, где ИИ взял уникальную информацию на тему "грибы"? Или 100.000 инфосайтов, на которых одна и та же инфа повторялась? И если это так, то который из этих 100.000 источников должен появиться как источник для ответа ИИ? Который на первом месте? Где? В Яндексе, в Гугле? С ГЕО, без ГЕО? На каком языке? Вы, наверное, слышали, что тот же ChatGPT в массе обучен на английском и делает переводы в режиме реального времени на язык промпта. 

Мне кажется, что мы тут мешаем различные подходы:
1. Когда AI Overview отвечает на общий запрос, который не может априори иметь одного источника как "что такое грибы". 
2. Когда AI Overview отвечает на узкий запрос и дает ссылку, откуда он это взял. Если вопрос отвечен ИИ исчерпывающе, то перехода на сайт, к сожалению, не будет. Да. Это - потеря пользователя, который искал быстрый ответ на простой вопрос. Кому нужно копать глубже, уйдет все же на сайт. Не на все вопросы ИИ может ответить исчерпывающе.
3. Когда AI Overview отвечает на узкий запрос и НЕ дает ссылку, откуда он это взял - это самый проблематичный вариант. 

И дальше еще совсем другая история: это работа с чатом изначально. Когда я ищу с самого начала не в поисковике, а промтом в чате. 

По моим наблюдениям:
1. Гугл буквально пару дней назад переместил AI overview на второе место. На первом я вижу TOP1 поисковой выдачи (не Ads!), на втором AI Overview, потом все остальное.
2. Внутри ChatGPT, ответы на очень узкие вопросы чаще стали сопровождаться ссылками. Раньше такого не было. Раньше нужно было или поисковый модус включать или активно просить подтвердить информацию ссылками. Сейчас уже без "активно" кидает ссылки.


GreenLis #:
Именно по этому можно запромтить предоставление подтверждающих ссылок в генерируемом тексте,

Прямо вот все 100 источников выдаст откуда она брала информацию слово за слово? "Не пишите ерунды, пожалуйста."

ИИ выдает ответы, как я писала выше: токены, ембеддинги, векторы. Если вы просите предоставление подтверждающих ссылок, то он переключается в модус запроса в поисковую базу. Ищет там, сравнивает векторы своего ответа с векторами в выдаче и выдает пару-тройку результатов, которые совпадают по векторам с предыдущим ответом. Не наоборот!

Appassionato #:
20 сайтов обработано - значит всем 20 и оплата.

Нет такой информации в нейронке. Там токены, ембеддинги, векторы. Я даже не знаю, как вам это объяснить. Нейронка - это не база в классическом смысле, как выдача. Она слово за слово составляет инструкцию. Она НЕ знает, откуда из каких источников будет взято следующее слово для ответа. Нет там такой информации и так как эта технология работает - не может ее быть.

Appassionato #:
Потому что там была информация и бесплатно (точнее с окупаемостью за счёт рекламы, лицензирования и т.д.).

Обратите внимание: информация, которую я в своем конкретном выше описанном примере не нашла. Да, мы 30 минут искали и нам показали очень много рекламы. Но результата мы не получили. Вот в чем проблема. Мы ее, эту бесплатную информацию, просто не нашли.

не хаос #:
Что же это, у них игроков своего форума или чата нет что ли?

Это - дети. 😂 Какие форумы, какие чаты?

Appassionato #:
за каждый промт, в котором используется информация авторов.

Проблема в технологии: нейронные сети так не работают. У них нет однозначного сопоставления: информация = сайт. А что если информация стояла на 10 или 20 сайтов? Кто поставщик? Кому платить?

Appassionato #:
явный запрет на использование информации.

Для автора это понятная мотивация. Но для меня как пользователя - это уход в прошлый век. Явный запрет будет работать только, если его будут делать все, без исключения. Блоггер-геймер-любитель не будет и вот она инфа в ChatGPT. Все остальные сидят со своим запретом и радуются... чему?

Я вам сейчас дам конкретный неоднозначный use case.

У меня младшее поколение играет на Nintendo. Я сама не играю, от слова совсем. Они где-то там в какой игре на каком уровне уперлись и им его не пройти. Мы по старинке лезем в поисковик. Запрос сложный: название игры, название уровня, описание момента, где не пройти. Полчаса ползаем по блогам, смотрим YouTube, на разных языках, результата ноль. Решения нет.

Дальше идея. Фоткаем экран, отсылаем фотку в ChatGPT с простейшим вопросом "Не можем пройти уровень". Что делает ChatGPT:
1. Точно узнает нашу игру (мы не задавали название в промте)
2. Уточняет nintendo или playstation (видимо, есть разница, я в этом не разбираюсь)
3. Дает пошаговую инструкцию, как пройти затычку, которая сразу же срабатывает.
4. Использует для инструкции наш язык, переводы не нужны.

Что имеем:
- полчаса в классическом поиске без результатов
- 15 секунд фото и промт в ChatGPT, результат почти мгновенный.

А дальше мои мысли. Я абсолютно понимаю, что ChatGPT инструкцию не сам придумал. Что это была выжимка как раз с этих блогов/видео, которые кто-то когда-то делал. И если бы мы сразу же пошли путем ChatGPT, то ни блоггеры, ни ютуберы не получили бы за их работу ничего. Диллема на лицо: если блоггер, ютубер за это ничего не получил, он больше этого делать не будет. ChatGPT взять информацию будет неоткуда.

Но в то же время мне как пользователю, которому была нужна информация, классическая выдача не помогла даже за  30 минут решить проблему. Т. е. требовать убрать ИИ и полностью вернуться к классическому поиску человек-потребитель в здравом смысле не будет. Потому что без него решения возможно не было бы вообще или по крайней мере потребовалось бы еще больше времени.

Вот такой вот case: и да, я не знаю, как это можно решить на данный момент. 

Fun Fact номер 2: попыталась сделать запрос-заявку на перенос проекта в reg.ru. Пришел ответ: 
"Ваш запрос в службу поддержки REG.RU отклонен. Мы не можем принять ваше обращение, так как отказались от заявок по e-mail в пользу более удобной и безопасной системы. Она позволяет быстрее реагировать на входящие заявки." И дальше ссылка на их базу знаний.
Такой необычный подход для потенциальных новых клиентов. 😀

Fun Fact: Поискала "лучшие хостинги в России". Первым в рейтингах вылезает timeweb.com. При переходе на сайт, мой ESET его блокирует, подозрение в фишинге. 😀
Coby #:
Нидерланды из России доступны

А вы уверены, что это надолго? Я не хочу возиться с переносом сейчас, чтобы через 2 месяца искать следующую дыру. Сайт .ru, белый, и пусть хостится в РФ, если он сможет покрывать свои расходы. Владельцу не принципиально было с самого начала его за рубежом хостить. Просто так сложилось "исторически". И пока он работал, все всех устраивало. 😀 

Дадуда #:

Сможете. Если есть у кого подключенная Робокасса.

Спасибо. Не знала. Это было бы идеально, как вариант, если полный обвал в РСЯ, а хостинг не проплачен. 

Всего: 555