AI-kriget hettar till: OpenAI lanserar GPT-5.2 som svar på Googles Gemini

AI-kriget hettar till: OpenAI lanserar GPT-5.2 som svar på Googles Gemini

OpenAI släppte under torsdagen GPT-5.2. Detta är deras senaste familj av AI-modeller för ChatGPT. Modellen kommer i tre versioner kallade Instant, Thinking och Pro.

Lanseringen följer VD Sam Altmans interna ”Code Red”-memo tidigare i månaden. Memot instruerade företaget att omfördela resurser för att förbättra ChatGPT som svar på konkurrenstrycket från Googles AI-modell Gemini 3.

– Vi designade 5.2 för att frigöra ännu mer ekonomiskt värde för människor. Den är bättre på att skapa kalkylblad, bygga presentationer, skriva kod, tolka bilder, förstå lång kontext, använda verktyg och koppla samman komplexa projekt i flera steg, sa Fidji Simo, OpenAIs produktchef, under en presskonferens på torsdagen.

Liksom tidigare versioner av GPT-5 tjänar de tre modellnivåerna olika syften: Instant hanterar snabbare uppgifter som skrivande och översättning. Thinking spottar ut simulerad resonerande text i ett försök att ta sig an mer komplext arbete som kodning och matematik. Pro producerar ännu mer simulerad resonerande text med målet att leverera högsta precision i prestanda för svåra problem.

GPT-5.2 har ett kontextfönster på 400 000 tokens. Detta tillåter modellen att behandla hundratals dokument samtidigt. Dess kunskapsgränsdatum är satt till den 31 augusti 2025.

GPT-5.2 rullas ut till betalande ChatGPT-prenumeranter med start på torsdagen. API-åtkomst finns tillgänglig för utvecklare. Priset i API:et ligger på 1,75 dollar per miljon inmatningstokens för standardmodellen, en ökning med 40 procent jämfört med GPT-5.1. OpenAI uppger att den äldre GPT-5.1 kommer att finnas kvar i ChatGPT för betalanvändare i tre månader under en rullgardinsmeny för äldre modeller.

Fokus på att komma ikapp Google

Lanseringen följer en knepig månad för OpenAI. Altman utfärdade i början av december en intern ”Code Red”-instruktion. Detta skedde efter att Googles Gemini 3-modell toppat flera AI-riktmärken och vunnit marknadsandelar. Memot krävde att andra initiativ, inklusive annonseringsplaner för ChatGPT, skulle skjutas upp. Fokuset skulle istället ligga på att förbättra chattbottens kärnupplevelse.

Insatserna för OpenAI är betydande. Företaget har åtagit sig att investera totalt 1,4 biljoner dollar i utbyggnader av AI-infrastruktur under de närmaste åren. Dessa satsningar gjordes när företaget hade en mer uppenbar teknikledning bland AI-företagen. Googles Gemini-app har nu mer än 650 miljoner månatliga aktiva användare. OpenAI rapporterar 800 miljoner veckovisa aktiva användare för ChatGPT.

För att hålla jämna steg med (eller ligga före) konkurrenterna sker modellsläppen i en stadig takt. GPT-5.2 representerar OpenAIs tredje stora modellsläpp sedan augusti. GPT-5 lanserades den månaden med ett nytt routingsystem som växlade mellan lägen för omedelbara svar och simulerat resonemang. Användare klagade dock på att svaren kändes kalla och kliniska. Uppdateringen GPT-5.1 i november lade till åtta förinställda ”personlighets”-alternativ och fokuserade på att göra systemet mer konversationellt.

Prestandaförbättringar

Märkligt nog valde OpenAI att inte lista några riktmärken på sin reklamsida som jämförde GPT-5.2 med Gemini 3. Detta trots att modellsläppet är en respons på Gemini 3:s prestanda. Istället fokuserar den officiella bloggposten på GPT-5.2:s förbättringar jämfört med sina föregångare och dess prestanda på OpenAIs nya riktmärke GDPval. Detta riktmärke försöker mäta professionella kunskapsarbetsuppgifter över 44 yrken.

OpenAI delade under presskonferensen några jämförande riktmärken som inkluderade Gemini 3 Pro och Claude Opus 4.5. Företaget tillbakavisade dock narrativet om att GPT-5.2 skulle ha stressats ut på marknaden som svar på Google. ”Det är viktigt att notera att detta har varit under utveckling i många, många månader,” sa Simo till reportrarna. Tidpunkten för lanseringen är dock, som vi noterar, ett strategiskt beslut.

blank

Enligt de delade siffrorna fick GPT-5.2 Thinking 55,6 procent på SWE-Bench Pro, ett riktmärke för programvaruutveckling. Motsvarande siffra för Gemini 3 Pro var 43,3 procent och 52,0 procent för Claude Opus 4.5. På GPQA Diamond, ett riktmärke för vetenskap på forskarnivå, fick GPT-5.2 92,4 procent, jämfört med Gemini 3 Pro:s 91,9 procent.

OpenAI säger att GPT-5.2 Thinking slår eller ligger lika med ”mänskliga yrkesverksamma” på 70,9 procent av uppgifterna i riktmärket GDPval (jämfört med 53,3 procent för Gemini 3 Pro). Företaget hävdar också att modellen slutför dessa uppgifter mer än 11 gånger snabbare. Det kostar dessutom mindre än 1 procent av kostnaden för mänskliga experter.

GPT-5.2 Thinking genererar också svar med 38 procent färre ”konfabulationer” (fantasier) än GPT-5.1. Det hävdar Max Schwarzer, OpenAIs chef för efterträning. Han sade till VentureBeat att modellen ”hallucinerar väsentligt mindre” än sin föregångare.

Riktmärken

Ta alla dessa riktmärken med en nypa salt. De är lätta att presentera på ett sätt som är positivt för ett företag, särskilt när vetenskapen om att mäta AI-prestanda objektivt inte har landat i bechmark-metoder lika de som finns för datorer och annan hårdvara. Inom kort så lär oberoende riktmärkesresultat från forskare utanför OpenAI att ta tid att komma fram. Under tiden kan användare invänta utrullningen av den nya versionen och testa de nya funktionerna.

Läs mer

OpenAI skakat av Gemini – Men vem är bäst i vardagen? Vi jämför tre giganter

 

OpenAI i ”Kod Röd”: Skyndar på GPT-5.2 efter succé för Gemini 3

 

OpenAI förnekar annonser i ChatGPT och kallar dem rekommendationer

 

 

Adobe Photoshop och Acrobat integreras i ChatGPT

Adobe Photoshop och Acrobat integreras i ChatGPT

blank

OpenAI fortsätter sin satsning på att omvandla ChatGPT till ett operativsystem genom att lägga till stöd för fler populära applikationer. Nu kan användare få tillgång till Photoshop, Acrobat och Adobe Express direkt inuti chattbotten.

Så fungerar integrationen:

  • Tillgänglighet: Apparna är gratis att använda via OpenAI:s webbplats. Användare måste dock logga in på sitt Adobe-konto för att kunna generera PDF:er och illustrationer med Acrobat och Adobe Express.

  • Användning: För att använda någon av apparna i ChatGPT kan användaren antingen nämna dem i sin prompt eller välja dem via plusmenyn.

  • Photoshop: Integrationen med Photoshop är särskilt intressant. Gränssnittet anpassas efter prompten och visar endast de reglage som är relevanta för önskemålet. Om användaren till exempel vill ljusa upp en bild, visas reglage för exponering, skuggor och högdagrar.

  • Teknik: ChatGPT interagerar med Adobes verktyg genom en MCP-server för att erbjuda en begränsad del av apparnas funktioner. Detta gör de vanligtvis komplexa Adobe-programmen mer tillgängliga.

  • Framtid: Adobe ser samarbetet som en ”naturlig passform” där de kan utnyttja ChatGPT:s nya Apps SDK för att integrera sina applikationer i plattformen. Adobe kommer dock fortsatt att vara den plats användare går till om de vill ha full kraft, precision och kontroll.

Enligt Aubrey Cattell, vice vd på Adobe, skapar Adobe ”Lego-klossarna” och detaljerade instruktioner, och sedan bestämmer ChatGPT vad den ska göra. Han betonade att de kontinuerligt arbetar med att finslipa integrationen baserat på användarnas intentioner och naturligt språk.

Källa:
Engadget

Så upptäcker du att text, bild eller video är skapad av AI

Så upptäcker du att text, bild eller video är skapad av AI

blank

Det blir allt svårare att skilja på material skapat av människor och det som genererats av artificiell intelligens, men det finns fortfarande tydliga mönster du kan leta efter för att upptäcka fusk.

Tecken på AI-genererad text

När det gäller text ska du se upp för perfekt grammatik men svagt innehåll. AI-text är ofta för opersonlig och saknar de små egenheter eller det temperament som en människa naturligt lägger in. Den använder ofta upprepade fraser och klyschor, och trots att språket är felfritt kan resonemanget vara ytligt eller sakna verklig djup. Du känner igen det på att texten är för perfekt tråkig.

Tecken på AI-genererade bilder och deepfakes

AI är bra på det stora hela, men misslyckas ofta med detaljerna. När du granskar en bild ska du särskilt titta på händer och fingrar. Dessa är notoriskt svåra för AI att hantera och leder ofta till för många fingrar, konstiga böjningar eller suddiga lemmar. Du bör också leta efter inkonsekventa skuggor, onaturliga reflektioner i ögonen och extremt jämn, porslinsliknande hud som saknar porer. I bakgrunden kan du se att text eller föremål blir till otydlig smet.

Tecken på AI-genererad video

När du tittar på en video ska du leta efter tecken på deepfakes. Titta på personens ögon. En AI har ibland svårt att få personen att blinka naturligt eller att visa de mikro-uttryck som du förväntar dig i ett mänskligt samtal. Du bör också vara uppmärksam på synkroniseringen mellan läpprörelser och talet, som kan vara något fördröjd eller felaktig. I dåliga deepfakes kan också hudens färg blinka till eller ändras snabbt i ansiktet.

När det gäller bilder och video så titta också efter text. Det kan vara skyltar, märken och liknande. Här missar ofta AI och stavar fel, slänger in konstiga tecken och liknande.

Bästa verktyget 

Det bästa verktyget du har är dock kritiskt tänkande. Känns npgot för perfekt, för generiskt eller för otroligt, bör du alltid dubbelkolla källan.

Det finns verktyg, även AI, som säger sig kunna identifiera texter, bilder och videor som skapats med AI. Våra egna tester visar att det är rätt kantiga och oprecisa verktyg. Text som vi vet inte är skriven med AI klassas som att den sannolik är skriven av ett AI-program, detsamma gäller bilder medan det ser ut som att video är något bättre.

Verktyg för text

ZeroGPT Denna webbtjänst låter dig klistra in text för att få en bedömning av sannolikheten att texten är AI-skriven. Den är populär och enkel att använda när du vill kontrollera texter från till exempel skolarbeten eller artiklar. Länk: https://www.zerogpt.com/

Verktyg för AI-genererade bilder och video

Hive Moderation AI Detector Detta är ett mångsidigt verktyg som kan bedöma om bilder, ljud och ibland video har genererats av AI. Den är bra på att känna igen mönster som är typiska för populära bildgeneratorer. Länk: https://hivedetect.com/

TinEye Även om det inte är en ren AI-detektor är omvänd bildsökning ett av dina viktigaste verktyg. TinEye låter dig ladda upp en bild för att se var den har publicerats tidigare på nätet. Om bilden är ett AI-genererat deepfake eller en manipulerad bild kan du ofta spåra originalbilden eller upptäcka att bilden är helt ny och utan källhistorik. Länk: https://tineye.com/

OpenAI förnekar annonser i ChatGPT och kallar dem rekommendationer

OpenAI förnekar annonser i ChatGPT och kallar dem rekommendationer

blank

 

OpenAI har förnekat rapporterna om att de har infört annonser i ChatGPT Plus efter att användare upptäckt rekommendationer för shoppingappar.

Som uppmärksammades på X ställde en ChatGPT Plus-användare en vanlig fråga om Windows BitLocker. Samtidigt som AI:n svarade på frågan, rekommenderade den också att handla matvaror hos Target. Matvaror eller hushållsmat har uppenbart ingen koppling till BitLocker, men bubblan ”Handla för hem och matvaror” dök ändå upp, och det är ganska rimligt att anta att det rör sig om en annons.

blank

Trots detta hävdar en chef på OpenAI att detta ”inte är en annons” utan en app-rekommendation från en pilotpartner, och att företaget vill att appförslag ska framstå som mer ”organiska” inuti ChatGPT.

Annons

”Vi har lanserat appar från några av våra pilotpartners sedan DevDay, inklusive Target, och har arbetat för att göra upptäcktsmekanismen för appar mer organisk inuti ChatGPT,” skrev Daniel McAuley i ett inlägg på X. ”Vårt mål är att appar förstärker användarupplevelsen när de är relevanta för en konversation, och vi arbetar fortfarande med det. Vem som helst kan bygga appar med hjälp av apparnas SDK, och vi planerar att öppna inskick och app-katalogen snart,” förklarade han.

För de flesta ser det fortfarande ut och känns som en annons. Du ser en varumärkeslogotyp, ett kort shoppingmeddelande och en uppmaning till handling, inuti en betalprodukt, trots att du aldrig frågade om shopping eller Target. ChatGPT trycker automatiskt in ett kommersiellt förslag i ett svar, precis som rekommendationer dyker upp i Start-menyn i Windows 11, och försvarar det dessutom.

Läs mer

Reklam på väg in i ChatGPT – förändrar upplevelsen

 

När dina AI-bottar får spader, hittar på, gissar och har fel

 

OpenAI skakat av Gemini – Men vem är bäst i vardagen? Vi jämför tre giganter

 

 

OpenAI i ”Kod Röd”: Skyndar på GPT-5.2 efter succé för Gemini 3

OpenAI i ”Kod Röd”: Skyndar på GPT-5.2 efter succé för Gemini 3

blank

Tidigare i veckan rapporterades det att OpenAI var i upprörning över det nuvarande tillståndet för Googles generativa AI-modell Gemini. En så kallad ”kod röd”-förklaring ska ha utfärdats, vilket enligt uppgift kommer att leda till att nästa uppgradering av ChatGPT anländer tidigare än förväntat.

OpenAI släppte sin stora modelluppgradering, GPT-5, den 7 augusti. Modellen förbättrade användarupplevelsen genom att automatiskt dirigera förfrågningar till de aktuella undermodellerna för snabba svar eller djupare analyser. Den 12 november ersatte OpenAI GPT-5 med en ”varmare, mer intelligent” modell kallad GPT-5.1.

Tre månader

Medan det tog tre månader att gå från GPT-5 till GPT-5.1 låter det som att OpenAI kommer att lansera GPT-5.2 på mindre än en månad. Tom Warren rapporterar för The Verge att OpenAI planerar att släppa GPT-5.2 nästa vecka, tisdagen den 9 december. Källor med insyn i OpenAIs planer uppger att företaget planerar sin första respons på Gemini 3 med den kommande GPT-5.2-uppdateringen.

Jag förstår att GPT-5.2 är redo att släppas och kan dyka upp så snart som i början av nästa vecka. Källor berättar för mig att 5.2-uppdateringen bör minska gapet som Google skapade med lanseringen av Gemini 3 förra månaden – en modell som toppade topplistorna och imponerade på Sam Altman och xAI:s VD Elon Musk.

Fokusera

Enligt Warren bör den senaste uppdateringen fokusera på ”hastighet, tillförlitlighet och anpassningsbarhet” snarare än nya funktioner. OpenAI har verkligen inte varit blyg med att släppa nya funktioner och förbättringar till sin nuvarande modell. De senaste veckorna har OpenAI lagt till gruppsessioner i ChatGPT samt slagit ihop text- och röstlägen.

Källa:
9 to 5 Mac

OpenAI skakat av Gemini – Men vem är bäst i vardagen? Vi jämför tre giganter

OpenAI skakat av Gemini – Men vem är bäst i vardagen? Vi jämför tre giganter

blank

OpenAI är skakade av den senaste versionen av Googles Gemini och det finns uppgifter om att runt 200 millioner användare har lämnat ChatGPT. Sam Altman, chef för Open AI ska nu ha gått ut internt och sagt att all kraft och energi ska läggas på att förbättra ChatGPT för att kunna slå tillbaka.

Så hur är det då vid daglig användning om lite enklare kodning, texthantering och bildgenerering jämförs?

ChatGPT:s stora styrka, under lång tid har varit att AI-funktionen varit bra, om än kanske inte bäst på, de flesta uppgifter. ChatGPT har haft en anständigt texthantering, en hygglig förmåga att kunna skriva kod och en bra generering av bilder. jag har testat om jämfört Claude, Gemini och ChatGPT med varandra och ha då i åtanke att betygen inte anger hur bra AI-lösningen är på uppgifterna utan hur bra den är på uppgiften i jämförelse med de övriga. Det faktum att Claude får högsta betyg när det gällt kodning betyder inte att den är suverän på att skriva kod – bara mycket bättre än konkurrenterna.

ChatGPT

  • Bilder ++++
  • Text +++
  • Kodning +++

I snitt: 3.33

Googles Gemini

  • Bilder ++
  • Text ++++
  • Kodning ++++

I snitt: 3.33

Claude

  • Kodning +++++
  • Text +++
  • Bilder +

I snitt: 3

Slutsatser:

ChatGPT är fortfarande hyggligt bäst allround men har klart halkat efter vad gäller text och kod. ChatGPT 5 skulle vara bättre på text, kunna skriva med bättre flyt och kunna skapa längre bättre sammanhållna texter. De första intrycken var lovande men nu producerar ChatGPT platt, livlös, stel och hackig text som dessutom påfallande ofta bryter mot svensk grammatik. Meningar inleds med sammanbindande ord för att ta ett exempel. Texterna innehåller också mycket ofta ren utfyllnad, floskler.

Gemini är bättre på båda de uppgifterna men har uppenbara problem med att följa instruktioner för att generera bilder. I mina tester så lyckades Gemini inte vid ett enda tillfälle, trots tiotalet försök, att generera en bild i liggande, 16:9 format. Under försöken att generera en klassisk jultomte så skapade Gemini ett flygplan, en katt och en äldre herr i rökrock. Gemini följde dessutom inte instruktionerna när jag bad om att först få se prompten innan bilderna genererades.

Claude är inriktad på att koda och det märks, tydligt. Ska du koda så följer Claude en logik, ett etablerat sätt att jobba med snapshots, sparade versioner och kodkontroll. Claude kan inte skapa bilder överhuvudtaget och har brister i sin texthantering – men som sagt – Claude har fokus på kod.

Ska du vara lite mer allround så är det just nu smartast att kombinera Gemini och ChatGPT, i alla fall om du behöver bilder.