Anthropic daagt gebruikers uit om AI-model te jailbreaken  

Zelfs de meest permissieve AI-modellen van bedrijven hebben gevoelige onderwerpen waar hun makers liever niet over praten. Denk daarbij aan massavernietigingswapens, illegale activiteiten of de Chinese politieke geschiedenis.  Door de jaren heen hebben creatieve AI-gebruikers van alles geprobeerd om deze modellen toch verboden antwoorden te laten geven. Bijvoorbeeld door middel van bizarre tekststrings. Claude-maker Anthropic […]
techzine
04-02-2025 10:24