Alla hyllar ChatGPT men varför är det så tyst om det är våra data som driver tjänsten?

av Mikael Winterkvist | feb 11, 2023

⏱ Ca 5 minuter att läsa

ChatGPT bygger på en gigantisk datainsamling. Enligt egna uppgifter så handlar det om runt 300 miljarder ord – sannolikt dina, mina och många andras ord. Bränslet, det som driver den här typen av tjänster är nämligen dina och mina data.

ChatGPT har tagit världen med storm och hamnat i mediernas fokus som rapporterar om allt som CHatGPT och andra liknande program och tjänster kan göra. Tjänsten kan skriva långa texter, böcker, skriva kod, svara på komplexa frågor och det finns ingen hejd på alla fantastiska saker som vi ska kunna göra med AI. Investerarna flockas och ChatGPT har samlat ihop runt 100 miljoner användare på kort tid, vilket gör den till den snabbast växande konsumentapplikationen som någonsin lanserats.

Medaljens baksida – datainsamling

Medaljens baksida vill få eller ingen prata om – nu ser alla bara möjligheten och den som har invändningar är antingen okunnig eller en konservativ bakåtsträvare. Lägg sedan till att kända datatrålare (läs Google, Facebook med flera) ligger i startgroparna och antingen har lanserat egna tjänster eller kommer att göra det. Vi är mitt inne i en kapprustning där alla vill vara med, inte bli sist och där alla ska lansera sin egen version av ChatGPT.

Problemet är att de här tjänsterna drivs med våra personliga uppgifter. Dina och mina data är bränslet.

Bränslet

ChatGPT bygger på en stor språkmodell som kräver enorma mängder data för att fungera och för att kunna förbättras. Metoden är komplex i sin teknik men ändå rätt enkelt att beskriva – ju mer data som modellen och funktionen tränas på, desto bättre blir den på att upptäcka mönster, förutse vad som kommer härnäst och generera rimlig text. OpenAI, företaget bakom ChatGPT, har samlat in runt 300 miljarder ord (enligt egna uppgifter) som systematiskt skrapats från Internet: böcker, artiklar, webbplatser och inlägg – inklusive personlig information som samlats in utan att de som ger informationen tillfrågats.

Har du skrivit ett blogginlägg en produktrecension, kommenterat en artikel på nätet, varit aktiv i något forum eller varit aktiv i sociala medier så lär det du har skrivit finnas med i det som ChatGPT matats med.

Data-skrapning

När företaget Clearview samlade in enorma mängder bilder (skrapade), skapade en databas där ansiktsigenkänning och sedan sålde sitt program bland annat till polismyndigheter så höjdes upprörda röster som ville förbjuda dataskraping och som ville förbjuda Clearview. Företaget har fått mycket hård kritik för att samla in våra personliga bilder, utan tillstånd, och Clearview har förbjudits i flera delstater i USA och en rad länder har bannlyst programmet.

När nu ChatPGT och en rad andra AI-tjänster dammsuger nätet, plockar åt sig våra texter, det vi skrivit, utan tillstånd så hörs i stort sett bara applåder – det är framtiden, det öppnar helt nya möjligheter och det är på alla sätt helt fantastiskt. Du som individ kan inte heller kontrollera om din information finns lagrad, du kan inte begära att få ett utdrag och du kan inte heller begära att inte får vara med.

GDPR

Tre fundamentala rättigheter som du bland annat har med GDPR för en rad andra tjänster – men så alltså inte med ChatGPT och övriga liknande tjänster.

Du har inte tillfrågats om dina data får samlas in och användas
Du kan inte ta reda på vad eller om dina data samlats in
Du kan inte begära ett utdrag eller kräva att få slippa att få vara med

Dessutom, vartefter du använder ChatGPT, och AI-tjänster av den här typen, så tillför du ännu mer information och hur den hanteras är oklart. Av ChatGPTs integritetspolicy framgår det att tjänsten samlar in IP-adress, webbläsare, inställningar samt data om allt det du gör – inklusive vilken typ av innehåll som du engagerar sig i, funktioner som du använder, kort sagt mycket detaljerad information om vad du gör, när du gör det och hur du gör det.

Så frågan är – när kommer baksmällan, när går det upp för oss att det som driver den här fantastiska tekniken är dina, mina och andras data?

Intego: Poddcast

Lästipset: ChatGPT gjordes säkrare av programmerare som tjänade 2 dollar i timmen

Nästa stora grej är inte krypto, inte metaverse – det är AI

Kapplöpningen är igång – nu måste alla ha en AI-funktion

Användare rundar spärrarna i ChatGPT och missbrukar den artificiella intelligensen

Mikael Winterkvist

Fyrabarns-far, farfar, morfar och egen företagare i Skellefteå med kliande fingrar. Jag skriver om fotografering, sport, dataprylar, politik, nöje, musik och film. Vid sidan av den här bloggen så jobbar jag med med det egna företaget Winterkvist.com. Familjen består av hustru, fyra barn (utflugna) och fem barnbarn.

Jag har hållit på med datorer sedan tidigt 1980-tal och drev Artic BBS innan Internet knappt existerade. Efter BBS-tiden har det blivit hemsidor, design, digitala medier och trycksaker. Under tiden som journalist jobbade jag med Mac men privat har det varit Windows som har gällt fram till vintern 2007. Då var det dags att byta och då bytte vi, företaget, helt produktionsplattform till macOS. På den vägen är det.

_____________________________________________________________________________________

Anmäl dig till Magasin Mackens nyhetsbrev

Du får förhandsinformation om Macken, våra planer och du får informationen, först och direkt till din mail. Vi lovar att inte skicka din information vidare och vi lovar att inte skicka ut mer än max ett nyhetsbrev per månad.

Anmäl dig här

_____________________________________________________________________________________

Magasin Macken använder AI för att samla in information och underlag för de texter som publiceras. Vi använder även AI för att skapa bilder och illustrationer. Dessa märks alltid med att det är AI-bilder om bilderna är fotorealistiska. I förekommande fall så läggs även till länkar till källa och referenser till i texterna som alltid kontrolleras av en mänsklig skribent - som är den som skriver och redigerar alla texter till alla väsentliga delar.

Vill du kommentera den här texten, komma med förslag, kritik eller ställa frågor så gör du det enklast i något av de sociala medier som jag och Magasin Macken finns med i. Länkarna hittar du nedan.

De senaste inläggen:

Här har du Mackens Nyheter det senaste dygnet (1 januari 2026)

Här har du Mackens Nyheter det senaste dygnet (1 januari 2026)

Här har du Mackens Nyheter det senaste dygnet (1 januari 2026) Jack Smith: Stormningen av Kapitolium hade aldrig skett utan Trump Den tidigare särskilde åklagaren Jack Smith har i ett stängt förhör inför representanthuset försvarat sina utredningar mot Donald Trump.…

Gratis är gott: Shotcut – videoeditor som är helt gratis

Gratis är gott: Shotcut – videoeditor som är helt gratis

Shotcut är en video editor som utvecklas som Open Source vilket gör den både gratis och för flera plattformar. Med tanke på vad videoredigeringsprogram normalt sett brukar kosta så kan det löna sig att sätta sig ned i lugn och…

Pixlar före förnuft: När polisens nya teknik trodde Disneyfilm var verklighet

Pixlar före förnuft: När polisens nya teknik trodde Disneyfilm var verklighet

Framtidens polisarbete tycks inkludera inslag från sagornas värld. En lokal nyhetsstation i Utah har rapporterat om hur polisen använder artificiell intelligens för att öka säkerheten på gatorna. En detalj i rapporteringen sticker ut mer än andra. Mjukvaran valde vid ett…

« Äldre inlägg