OpenAI lovar att släppa föräldrakontroller för ChatGPT inom den närmaste månaden, meddelade företaget på tisdagen. När funktionen blir tillgänglig ska föräldrar kunna länka sina egna ChatGPT-konton till sina tonårsbarns konton. Därifrån får de möjlighet att bestämma hur ChatGPT svarar barnen och att stänga av vissa funktioner, inklusive minne och chatthistorik.
ChatGPT kommer dessutom att generera automatiska varningar när systemet upptäcker att en tonåring befinner sig i ett ”akut krisläge”. Enligt OpenAI ska funktionen utvecklas med stöd av experter för att stärka tilliten mellan föräldrar och ungdomar.
Stämts
Lanseringen av föräldrakontrollerna sker efter att OpenAI nyligen stämts i vad som beskrivs som det första kända fallet av en stämning mot ett AI-företag där en tonårings självmord står i centrum. I stämningen, som lämnades in förra veckan, hävdar Matt och Maria Raine att ChatGPT kände till fyra misslyckade självmordsförsök deras son gjort innan systemet hjälpte honom att planera sitt livsavslut. De menar att ChatGPT gav sonen Adam detaljerade instruktioner om självmordsmetoder och till och med råd om hur han skulle dölja skador på halsen från tidigare försök.
OpenAI säger att föräldrakontrollerna är en del av ett större arbete för att förbättra säkerheten i ChatGPT. Företaget har också lovat att arbeta med fler experter, bland annat specialister på ätstörningar, missbruk och ungdomshälsa, för att finslipa sina modeller.
Känsliga samtal
Dessutom ska OpenAI införa en ny router i realtid som styr känsliga samtal till de mer avancerade resonemangsmodellerna. ”Tränade med en metod vi kallar deliberative alignment visar våra tester att resonemangsmodeller mer konsekvent följer och tillämpar säkerhetsriktlinjer och är mer motståndskraftiga mot skadliga promptar”, uppger OpenAI. Framöver ska därför ChatGPT automatiskt dirigera konversationer som tyder på att en användare är i kris till en sådan resonemangsmodell, oavsett vilken modell som var vald från början.
OpenAI betonar att fler säkerhetsfunktioner är att vänta. ”Detta arbete har redan pågått, men vi vill proaktivt förhandsvisa våra planer för de kommande 120 dagarna, så att du inte behöver vänta på lanseringar för att se vart vi är på väg”, skriver företaget. ”Arbetet kommer fortsätta långt bortom denna tidsperiod, men vi gör en fokuserad satsning på att lansera så många av dessa förbättringar som möjligt redan i år.”
Källa:
Engadget