Anthropic scientists hacked Claude’s brain — and it noticed. Here’s why that’s huge

av Mikael Winterkvist | okt 31, 2025

When researchers at Anthropic injected the concept of ”betrayal” into their Claude AI model’s neural networks and asked if it noticed anything unusual, the system paused before responding: ”I’m experiencing something that feels like an intrusive thought about ’betrayal’.”

The exchange, detailed in new research published Wednesday, marks what scientists say is the first rigorous evidence that large language models possess a limited but genuine ability to observe and report on their own internal processes — a capability that challenges longstanding assumptions about what these systems can do and raises profound questions about their future development.

Venturebeat

Mikael Winterkvist

Fyrabarns-far, farfar, morfar och egen företagare i Skellefteå med kliande fingrar. Jag skriver om fotografering, sport, dataprylar, politik, nöje, musik och film. Vid sidan av den här bloggen så jobbar jag med med det egna företaget Winterkvist.com. Familjen består av hustru, fyra barn (utflugna) och fem barnbarn.

Jag har hållit på med datorer sedan tidigt 1980-tal och drev Artic BBS innan Internet knappt existerade. Efter BBS-tiden har det blivit hemsidor, design, digitala medier och trycksaker. Under tiden som journalist jobbade jag med Mac men privat har det varit Windows som har gällt fram till vintern 2007. Då var det dags att byta och då bytte vi, företaget, helt produktionsplattform till macOS. På den vägen är det.

_____________________________________________________________________________________

Anmäl dig till Magasin Mackens nyhetsbrev

Du får förhandsinformation om Macken, våra planer och du får informationen, först och direkt till din mail. Vi lovar att inte skicka din information vidare och vi lovar att inte skicka ut mer än max ett nyhetsbrev per månad.

Anmäl dig här

_____________________________________________________________________________________

Magasin Macken använder AI för att samla in information och underlag för de texter som publiceras. Vi använder även AI för att skapa bilder och illustrationer. Dessa märks alltid med att det är AI-bilder om bilderna är fotorealistiska. I förekommande fall så läggs även till länkar till källa och referenser till i texterna som alltid kontrolleras av en mänsklig skribent - som är den som skriver och redigerar alla texter till alla väsentliga delar.

Vill du kommentera den här texten, komma med förslag, kritik eller ställa frågor så gör du det enklast i något av de sociala medier som jag och Magasin Macken finns med i. Länkarna hittar du nedan.

De senaste inläggen:

Lasso ger total kontroll över skrivbordet

Hantera flera fönster på Mac kan snabbt bli ett kaos av överlappande mappar, borttappade webbläsare och ändlösa försök med att dra saker rätt. Lasso löser problemet och gör skrivbordet prydligt, fokuserat och helt under din kontroll. Programmet låter dig ordna…

läs mer

Efter granskningen av Joakim Lundell – här är frågan som aldrig ställts

Bo Göran Bodin har granskat mediapersonligheten, youtubern och makthavaren Joakim Lundell. En infekterad familjekonflikt, en bok som toppar försäljningslistorna och oskyldiga som dras in i en värld där sanningen är något som du inte behöver ta så mycket hänsyn till,…

läs mer

Söndagen som granskar, guidar och testar – allt i Magasin Macken

Söndagens Magasin Macken samlar granskningar, guider och recensioner som spänner över både teknik och berättelser. Här finns uppföljningen på genomgången av Joakim Lundell, praktiska tips för att få bättre ordning på skrivbordet och tydliga guider till nya funktioner i macOS…

läs mer

« Äldre inlägg