Nya Claude klarar kod, logik och längre tankekedjor

av | aug 8, 2025 | Artificiell intelligens, Bluesky, Mastodon, Threads

Anthropic har släppt en ny version av sin avancerade AI-modell. Claude Opus 4.1 är en förbättrad uppföljare till Opus 4, med tydliga framsteg när det gäller kodanalys, logiska resonemang och självstyrande arbetsuppgifter.

Enligt Anthropic presterar den nya modellen bättre på komplexa utmaningar som kräver flera steg, lång kontext och självständig uppgiftslösning – det som ibland beskrivs som AI-agenter.

Testresultaten visar att modellen når 74,5 procent på SWE-bench Verified, ett benchmark som används för att mäta AI:s tekniska kapacitet. Tidigare versioner har legat klart lägre. Claude Sonnet 3.7 nådde 62,3 procent och Opus 4 låg på 72,5. Modellen används nu av utvecklare hos bland annat GitHub, där man lyfter fram att Claude Opus 4.1 kan föreslå förbättringar i kod utan att införa nya fel. Det är en egenskap som blivit särskilt viktig när AI används i produktionsmiljöer.

Flera utvecklingsplattformar uppger att modellen överträffar sina föregångare även i praktiska tester med juniora programmerare. Enligt Anthropic är skillnaderna särskilt tydliga när det gäller verktyg som kräver lång arbetsminneskapacitet, korsreferenser och logiska resonemang. Den nya modellen finns tillgänglig via Claude Pro, Max, Team och Enterprise – samt genom samarbeten med Google Cloud, Amazon Bedrock, GitHub Copilot och via företagets egna API. Prissättningen är oförändrad jämfört med Opus 4.

Källa: 9to5Mac

Magasin Macken använder AI för att samla in information och underlag för de texter som publiceras. Vi använder även AI för att skapa bilder och illustrationer. Dessa märks alltid med att det är AI-bilder om bilderna är fotorealistiska. I förekommande fall så läggs även till länkar till källa och referenser till i texterna som alltid kontrolleras av en mänsklig skribent – som är den som skriver och redigerar alla texter till alla väsentliga delar. 

0 kommentarer


Mikael Winterkvist

Fyrabarns-far, farfar, morfar och egen företagare i Skellefteå med kliande fingrar. Jag skriver om fotografering, sport, dataprylar, politik, nöje, musik och film. Vid sidan av den här bloggen så jobbar jag med med det egna företaget Winterkvist.com. Familjen består av hustru, fyra barn (utflugna) och fem barnbarn.

Jag har hållit på med datorer sedan tidigt 1980-tal och drev Artic BBS innan Internet knappt existerade. Efter BBS-tiden har det blivit hemsidor, design, digitala medier och trycksaker. Under tiden som journalist jobbade jag med Mac men privat har det varit Windows som har gällt fram till vintern 2007. Då var det dags att byta och då bytte vi, företaget, helt produktionsplattform till macOS. På den vägen är det.

_____________________________________________________________________________________

Anmäl dig till Magasin Mackens nyhetsbrev

Du får förhandsinformation om Macken, våra planer och du får informationen, först och direkt till din mail. Vi lovar att inte skicka din information vidare och vi lovar att inte skicka ut mer än max ett nyhetsbrev per månad.

Anmäl dig här

_____________________________________________________________________________________

De senaste inläggen:

EU vill lätta på reglerna för cookie-banners

EU vill lätta på reglerna för cookie-banners

För mer än ett decennium sedan skrev EU om internetreglerna och tvingade hela nätet att införa strängare krav på samtycke till cookies genom ändringar i ePrivacy-direktivet. Sedan 2009 har allt från teknikjättar till små bloggar och i princip alla nätbaserade…

läs mer