Nya Claude klarar kod, logik och längre tankekedjor

av | aug 8, 2025 | Artificiell intelligens, Bluesky, Mastodon, Threads

Anthropic har släppt en ny version av sin avancerade AI-modell. Claude Opus 4.1 är en förbättrad uppföljare till Opus 4, med tydliga framsteg när det gäller kodanalys, logiska resonemang och självstyrande arbetsuppgifter.

Enligt Anthropic presterar den nya modellen bättre på komplexa utmaningar som kräver flera steg, lång kontext och självständig uppgiftslösning – det som ibland beskrivs som AI-agenter.

Testresultaten visar att modellen når 74,5 procent på SWE-bench Verified, ett benchmark som används för att mäta AI:s tekniska kapacitet. Tidigare versioner har legat klart lägre. Claude Sonnet 3.7 nådde 62,3 procent och Opus 4 låg på 72,5. Modellen används nu av utvecklare hos bland annat GitHub, där man lyfter fram att Claude Opus 4.1 kan föreslå förbättringar i kod utan att införa nya fel. Det är en egenskap som blivit särskilt viktig när AI används i produktionsmiljöer.

Flera utvecklingsplattformar uppger att modellen överträffar sina föregångare även i praktiska tester med juniora programmerare. Enligt Anthropic är skillnaderna särskilt tydliga när det gäller verktyg som kräver lång arbetsminneskapacitet, korsreferenser och logiska resonemang. Den nya modellen finns tillgänglig via Claude Pro, Max, Team och Enterprise – samt genom samarbeten med Google Cloud, Amazon Bedrock, GitHub Copilot och via företagets egna API. Prissättningen är oförändrad jämfört med Opus 4.

Källa: 9to5Mac

Magasin Macken använder AI för att samla in information och underlag för de texter som publiceras. Vi använder även AI för att skapa bilder och illustrationer. Dessa märks alltid med att det är AI-bilder. I förekommande fall så läggs även till länkar till källa och referenser till i texterna som alltid kontrolleras av en mänsklig skribent – som är den som skriver och redigerar alla texter till alla väsentliga delar. 

Prenumerera
Nortis om
guest
0 Comments
Nyaste
Äldsta Mest röstade
Inline Feedbacks
Se alla kommentarer

blank

Mikael Winterkvist

Fyrabarns-far, farfar, morfar och egen företagare i Skellefteå med kliande fingrar. Jag skriver om fotografering, sport, dataprylar, politik, nöje, musik och film. Vid sidan av den här bloggen så jobbar jag med med det egna företaget Winterkvist.com. Familjen består av hustru, fyra barn (utflugna) och fem barnbarn.

Jag har hållit på med datorer sedan tidigt 1980-tal och drev Artic BBS innan Internet knappt existerade. Efter BBS-tiden har det blivit hemsidor, design, digitala medier och trycksaker. Under tiden som journalist jobbade jag med Mac men privat har det varit Windows som har gällt fram till vintern 2007. Då var det dags att byta och då bytte vi, företaget, helt produktionsplattform till macOS. På den vägen är det.

_____________________________________________________________________________________

Anmäl dig till Magasin Mackens nyhetsbrev

Du får förhandsinformation om Macken, våra planer och du får informationen, först och direkt till din mail. Vi lovar att inte skicka din information vidare och vi lovar att inte skicka ut mer än max ett nyhetsbrev per månad.

Anmäl dig här

_____________________________________________________________________________________

De senaste inläggen:

Delar du lösenord på HBO Max? Då är det snart slut

Delar du lösenord på HBO Max? Då är det snart slut

HBO Max, strömningstjänsten från Warner Bros. Discovery, planerar att skruva upp tempot i kampen mot att konton delas utanför hushållet. Under bolagets senaste kvartalsrapport meddelade streamingchefen JB Perrette att nuvarande milda påminnelser snart ersätts av mer pressande budskap – och…

läs mer
Forskare varnar: AI-kod smyger in säkerhetsbrister

Forskare varnar: AI-kod smyger in säkerhetsbrister

Kod som skrivs med hjälp av AI-verktyg som ChatGPT och GitHub Copilot används nu i stor skala – även i säkerhetskritiska system. Samtidigt är det fortfarande oklart vem som bär ansvaret när dessa verktyg producerar kod med allvarliga sårbarheter. En…

läs mer