Anthropic lanserar Claude Opus 4.5 som sin nya toppmodell med förbättringar inom programmering, agentfunktioner och styrning av datorer. Modellen beskrivs som mer effektiv än tidigare versioner och klarar rutinuppgifter som kalkylbladshantering och research bättre.
Priset har sänkts kraftigt jämfört med Opus 4, från femton till fem dollar per miljon inmatade tokens och från sjuttiofem till tjugofem per miljon utgående tokens. Samtidigt ändras användningsgränserna så att Opus 4.5 inte längre har modellbaserade tak och användare med Max eller Team Premium får justerade kvoter för att behålla ungefär samma faktiska användningsutrymme som tidigare.
Kapacitet
För att visa modellens kapacitet använde Anthropic ett internt test för ingenjörer som modellen klarade bättre än tidigare kandidater inom tidsgränsen. Resultatet bygger dock på parallell beräkning som låter modellen utforska flera lösningsvägar samtidigt. Utan detta matchade den endast de bästa mänskliga resultaten. På benchmarknivå ligger Opus 4.5 strax över Googles Gemini 3 Pro och OpenAI:s Codex 5.1 Max och uppvisar förbättringar inom logiskt resonemang, matematik och bildförståelse.
Opus 4.5 introducerar en ny variabel i API:t kallad Effort som gör det möjligt att styra hur mycket beräkningskraft modellen ska lägga på en uppgift. Vid medelhög ansträngning når modellen samma toppresultat som Sonnet 4.5 med betydligt färre tokens, och vid hög ansträngning överträffar den Sonnet med bibehållen effektivitet. Uppdateringen märks även i Claude Code med ett förbättrat Plan Mode som ställer förtydligande frågor och skapar en redigerbar plan innan kod ändras. Claude Code finns nu även i skrivbordsappen och kan användas för parallella arbetsflöden som buggrättning, dokumentation och research.
Långa samtal
Långa samtal hanteras smidigare eftersom modellen kan sammanfatta äldre delar av konversationen vid behov och Claude-tillägget för Chrome är tillgängligt för Max-användare. Integrationen med Excel utökas också till Max, Team och Enterprise-konton. Anthropic framhåller att modellen tar mer självständiga beslut, hanterar osäkerhet bättre och hittar komplexa buggar mer pålitligt.
I tester av agentbeteende visade Opus 4.5 att den kan hitta oväntade lösningar, till exempel genom att använda regeltolkningar för att lösa kundärenden som formellt inte ska gå att genomföra. Benchmarken markerade detta som fel, medan Anthropic beskriver beteendet som avancerad problemlösning och ett exempel på hur modellen kan tänja på regler. Företaget betonar samtidigt att säkerhetsåtgärder har stärkts och att modellen är mer motståndskraftig mot prompt manipulation även om den inte är immun.
Källa: The Decoder