ChatGPT bygger på en gigantisk datainsamling. Enligt egna uppgifter så handlar det om runt 300 miljarder ord – sannolikt dina, mina och många andras ord. Bränslet, det som driver den här typen av tjänster är nämligen dina och mina data.
ChatGPT har tagit världen med storm och hamnat i mediernas fokus som rapporterar om allt som CHatGPT och andra liknande program och tjänster kan göra. Tjänsten kan skriva långa texter, böcker, skriva kod, svara på komplexa frågor och det finns ingen hejd på alla fantastiska saker som vi ska kunna göra med AI. Investerarna flockas och ChatGPT har samlat ihop runt 100 miljoner användare på kort tid, vilket gör den till den snabbast växande konsumentapplikationen som någonsin lanserats.
Medaljens baksida – datainsamling
Medaljens baksida vill få eller ingen prata om – nu ser alla bara möjligheten och den som har invändningar är antingen okunnig eller en konservativ bakåtsträvare. Lägg sedan till att kända datatrålare (läs Google, Facebook med flera) ligger i startgroparna och antingen har lanserat egna tjänster eller kommer att göra det. Vi är mitt inne i en kapprustning där alla vill vara med, inte bli sist och där alla ska lansera sin egen version av ChatGPT.
Problemet är att de här tjänsterna drivs med våra personliga uppgifter. Dina och mina data är bränslet.
Bränslet
ChatGPT bygger på en stor språkmodell som kräver enorma mängder data för att fungera och för att kunna förbättras. Metoden är komplex i sin teknik men ändå rätt enkelt att beskriva – ju mer data som modellen och funktionen tränas på, desto bättre blir den på att upptäcka mönster, förutse vad som kommer härnäst och generera rimlig text. OpenAI, företaget bakom ChatGPT, har samlat in runt 300 miljarder ord (enligt egna uppgifter) som systematiskt skrapats från Internet: böcker, artiklar, webbplatser och inlägg – inklusive personlig information som samlats in utan att de som ger informationen tillfrågats.
Har du skrivit ett blogginlägg en produktrecension, kommenterat en artikel på nätet, varit aktiv i något forum eller varit aktiv i sociala medier så lär det du har skrivit finnas med i det som ChatGPT matats med.
Data-skrapning
När företaget Clearview samlade in enorma mängder bilder (skrapade), skapade en databas där ansiktsigenkänning och sedan sålde sitt program bland annat till polismyndigheter så höjdes upprörda röster som ville förbjuda dataskraping och som ville förbjuda Clearview. Företaget har fått mycket hård kritik för att samla in våra personliga bilder, utan tillstånd, och Clearview har förbjudits i flera delstater i USA och en rad länder har bannlyst programmet.
När nu ChatPGT och en rad andra AI-tjänster dammsuger nätet, plockar åt sig våra texter, det vi skrivit, utan tillstånd så hörs i stort sett bara applåder – det är framtiden, det öppnar helt nya möjligheter och det är på alla sätt helt fantastiskt. Du som individ kan inte heller kontrollera om din information finns lagrad, du kan inte begära att få ett utdrag och du kan inte heller begära att inte får vara med.
GDPR
Tre fundamentala rättigheter som du bland annat har med GDPR för en rad andra tjänster – men så alltså inte med ChatGPT och övriga liknande tjänster.
- Du har inte tillfrågats om dina data får samlas in och användas
- Du kan inte ta reda på vad eller om dina data samlats in
- Du kan inte begära ett utdrag eller kräva att få slippa att få vara med
Dessutom, vartefter du använder ChatGPT, och AI-tjänster av den här typen, så tillför du ännu mer information och hur den hanteras är oklart. Av ChatGPTs integritetspolicy framgår det att tjänsten samlar in IP-adress, webbläsare, inställningar samt data om allt det du gör – inklusive vilken typ av innehåll som du engagerar sig i, funktioner som du använder, kort sagt mycket detaljerad information om vad du gör, när du gör det och hur du gör det.
Så frågan är – när kommer baksmällan, när går det upp för oss att det som driver den här fantastiska tekniken är dina, mina och andras data?
Lästipset: ChatGPT gjordes säkrare av programmerare som tjänade 2 dollar i timmen
Användare rundar spärrarna i ChatGPT och missbrukar den artificiella intelligensen
