Cloudflare avslöjar hur AI-sökmotor smyger förbi spärrar för att stjäla data

av Mikael Winterkvist | aug 6, 2025

Cloudflare anklagar AI-sökmotorn Perplexity för att medvetet bryta mot webbens regler för datainsamling. I en rapport beskriver Cloudflare hur Perplexity använder avancerade tekniker för att kringgå webbplatsers försök att stoppa automatisk skrapning.

Företaget hävdar att Perplexity först använder sina egna, öppet deklarerade användaragenter, men när dessa blockeras byter systemet identitet och efterliknar vanliga webbläsare som Google Chrome på macOS. Samtidigt roterar man IP-adresser och nätverksleverantörer för att göra det svårare att spåra trafiken.

Cloudflare upptäckte metoden genom att sätta upp särskilda testdomäner där robotar uttryckligen förbjöds i robots.txt. När Perplexity kort därefter kunde ge detaljerade svar som byggde på innehållet på dessa sidor drog Cloudflare slutsatsen att företaget kringgår spärrarna. Enligt Cloudflare är detta en tydlig signal om att Perplexity inte bara samlar in data öppet, utan även i hemlighet trots aktiva blockeringar.

Dolt beteende

Som en direkt följd av upptäckten har Cloudflare tagit bort Perplexity från sin lista över verifierade bots – en lista som annars ger pålitliga aktörer fördelar som bättre tillgång till nätverk och lägre risk för felaktig blockering. Cloudflare har även infört nya skyddsmekanismer för att stoppa liknande dolt beteende från andra aktörer.

Perplexity avvisar dock kritiken. Företaget menar att deras system endast hämtar information när användare gör en sökning och att de inte använder traditionella metoder för att skapa index eller lagra data för framtida AI-träning. Enligt Perplexity rör det sig snarare om missförstånd eller ett PR-trick från Cloudflare.

Konflikt

Branschexperter ser situationen som en del av en större konflikt mellan AI-plattformar och innehållsägare på webben. Många publicister och företag försöker skydda sitt material från att användas gratis i AI-tjänster, samtidigt som AI-aktörerna hävdar att de måste kunna hämta information för att kunna erbjuda konkurrenskraftiga tjänster. Händelsen väcker frågor om hur framtida regleringar ska utformas och var gränsen går mellan legitim informationshämtning och otillåten dataskrapning.

Källa:

Mikael Winterkvist

Fyrabarns-far, farfar, morfar och egen företagare i Skellefteå med kliande fingrar. Jag skriver om fotografering, sport, dataprylar, politik, nöje, musik och film. Vid sidan av den här bloggen så jobbar jag med med det egna företaget Winterkvist.com. Familjen består av hustru, fyra barn (utflugna) och fem barnbarn.

Jag har hållit på med datorer sedan tidigt 1980-tal och drev Artic BBS innan Internet knappt existerade. Efter BBS-tiden har det blivit hemsidor, design, digitala medier och trycksaker. Under tiden som journalist jobbade jag med Mac men privat har det varit Windows som har gällt fram till vintern 2007. Då var det dags att byta och då bytte vi, företaget, helt produktionsplattform till macOS. På den vägen är det.

_____________________________________________________________________________________

Anmäl dig till Magasin Mackens nyhetsbrev

Du får förhandsinformation om Macken, våra planer och du får informationen, först och direkt till din mail. Vi lovar att inte skicka din information vidare och vi lovar att inte skicka ut mer än max ett nyhetsbrev per månad.

Anmäl dig här

_____________________________________________________________________________________

Magasin Macken använder AI för att samla in information och underlag för de texter som publiceras. Vi använder även AI för att skapa bilder och illustrationer. Dessa märks alltid med att det är AI-bilder om bilderna är fotorealistiska. I förekommande fall så läggs även till länkar till källa och referenser till i texterna som alltid kontrolleras av en mänsklig skribent - som är den som skriver och redigerar alla texter till alla väsentliga delar.

Vill du kommentera den här texten, komma med förslag, kritik eller ställa frågor så gör du det enklast i något av de sociala medier som jag och Magasin Macken finns med i. Länkarna hittar du nedan.

De senaste inläggen:

Apples vikbara iPhone – en surfplatta i fickformat snarare än en stor telefon

Apples vikbara iPhone – en surfplatta i fickformat snarare än en stor telefon

Apples första vikbara Iphone kan bli betydligt mindre än vad många har föreställt sig. Uppgifter från The Information gör gällande att den yttre skärmen på den bokliknande enheten endast mäter 5,3 tum. Det är mindre än skärmen på Iphone mini.…

Transparensens paradox: Epstein-dokumenten gav bara upphov till fler frågor

Transparensens paradox: Epstein-dokumenten gav bara upphov till fler frågor

Offentliggörandet av de omfattande dokumenten rörande Jeffrey Epstein förväntades ge en slutpunkt. Många hoppades att namnen på listorna och de tusentals sidorna av vittnesmål skulle bringa klarhet i ett av modern amerikansk rättshistorias mest smutsiga kapitel. Resultatet blev det motsatta.…

Lästipset: Telefonbaserad pension – när morföräldrarna fastnar i skärmen

Lästipset: Telefonbaserad pension – när morföräldrarna fastnar i skärmen

En vän reste nyligen tvärs över landet för att fira jul med släkten. Den vanliga stressen med högtidsresor brukar i vanliga fall vägas upp av att se barnen umgås med sina morföräldrar. I år var det annorlunda. Barnen var inte…

« Äldre inlägg