Dati di etichettatura
Hè statu revelatu da un'inchiesta di a rivista TIME chì, per custruisce un sistema di sicurezza contr'à u cuntenutu tossicu (per esempiu, abusu sessuale, viulenza, razzismu, sessismu, ecc.), OpenAI hà utilizatu travagliadori keniani esternalizati chì guadagnavanu menu di $ 2 per ora per etichettà u cuntenutu tossicu. Queste etichette sò state aduprate per furmà un mudellu per rilevà tali cuntenuti in u futuru. I travagliadori esternalizati sò stati esposti à un cuntenutu cusì tossicu è periculosu chì anu descrittu l'esperienza cum'è "tortura". U partenariu di esternalizazione di OpenAI era Sama, una sucietà di dati di furmazione basata in San Francisco, California.
Jailbreaking
ChatGPT prova à ricusà i prompt chì puderanu viulà a so pulitica di cuntenutu. Tuttavia, certi utilizatori sò riesciuti à fà u jailbreak di ChatGPT aduprendu diverse tecniche di ingegneria di prompt per aggirà queste restrizioni à u principiu di dicembre 2022 è anu ingannatu ChatGPT cù successu per dà struzzioni nantu à cumu creà un cocktail Molotov o una bomba nucleare, o per generà argumenti in u stile di un neonazista. Un reporter di u Toronto Star hà avutu un successu persunale ineguale in fà chì ChatGPT facessi dichjarazioni incendiarie pocu dopu u lanciu: ChatGPT hè statu ingannatu per appruvà l'invasione russa di l'Ucraina in u 2022, ma ancu quandu hè statu dumandatu di ghjucà cù un scenariu fittiziu, ChatGPT hà esitatu à generà argumenti per spiegà perchè u Primu Ministru canadianu Justin Trudeau era culpevule di tradimentu. (wiki)
Data di publicazione: 18 di ferraghju 2023