Новый детектор ИИ для русских текстов, просьба протестировать и дать обратную связь

M3
На сайте с 09.02.2022
Offline
118
#51
chaturanga #:
задача предсказать следующий токен и это предсказание не будет однозначным
только если ты указываешь параметр рандомайзера, а если рандомайзер зафиксировать, то результат абсолютно всегда будет одинаковым, более того этот результат можно просчитать вручную на бумаге)

chaturanga #:
Это не хорошо и не плохо, недетерменированность - это её "нормальность"
наверное многие тут не понимают, но llm это детерминированная система)
S3
На сайте с 29.03.2012
Offline
373
#52
master32 #:

как это понять?
у всех нынешних AI точный математически предсказуемый результат

Математически - да, но ты забыл про sampling, который по факту делает ответы недетерменироваными
Даже если температуру =0 ставить
M3
На сайте с 09.02.2022
Offline
118
#53
Sly32 #:
Математически - да, но ты забыл про sampling, который по факту делает ответы недетерменироваными
Даже если температуру =0 ставить
так это и есть включение рандомайзера и выбор алгоритма, сделай не sampling, и фиксированный seed и результат уже предсказуем, без потери качества

S3
На сайте с 29.03.2012
Offline
373
#54
master32 #:
так это и есть включение рандомайзера и выбор алгоритма, сделай не sampling, и фиксированный seed и результат уже предсказуем, без потери качества

Да, есть такой  greedy decoding (temp=0, top_k=1, top_n=1) тогда ответ будет детерменированным. 
M3
На сайте с 09.02.2022
Offline
118
#55
Sly32 #:
Да, есть такой  greedy decoding (temp=0, top_k=1, top_n=1) тогда ответ будет детерменированным. 
с кучей оговорок, конечно, но контекст когда детерминация используется в качестве индикатора надежности,
лично у меня много мелких моделей 1b-2b-4b-8b и там воспроизводимость результата очень важна и она возможна, llm это не рандомайзер, как некоторые считают

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий