Anthropic har släppt en ny version av sin avancerade AI-modell. Claude Opus 4.1 är en förbättrad uppföljare till Opus 4, med tydliga framsteg när det gäller kodanalys, logiska resonemang och självstyrande arbetsuppgifter.
Enligt Anthropic presterar den nya modellen bättre på komplexa utmaningar som kräver flera steg, lång kontext och självständig uppgiftslösning – det som ibland beskrivs som AI-agenter.
Testresultaten visar att modellen når 74,5 procent på SWE-bench Verified, ett benchmark som används för att mäta AI:s tekniska kapacitet. Tidigare versioner har legat klart lägre. Claude Sonnet 3.7 nådde 62,3 procent och Opus 4 låg på 72,5. Modellen används nu av utvecklare hos bland annat GitHub, där man lyfter fram att Claude Opus 4.1 kan föreslå förbättringar i kod utan att införa nya fel. Det är en egenskap som blivit särskilt viktig när AI används i produktionsmiljöer.
Flera utvecklingsplattformar uppger att modellen överträffar sina föregångare även i praktiska tester med juniora programmerare. Enligt Anthropic är skillnaderna särskilt tydliga när det gäller verktyg som kräver lång arbetsminneskapacitet, korsreferenser och logiska resonemang. Den nya modellen finns tillgänglig via Claude Pro, Max, Team och Enterprise – samt genom samarbeten med Google Cloud, Amazon Bedrock, GitHub Copilot och via företagets egna API. Prissättningen är oförändrad jämfört med Opus 4.
Källa: 9to5Mac