Cloudflare avslöjar hur AI-sökmotor smyger förbi spärrar för att stjäla data

av | aug 6, 2025 | Artificiell intelligens, Bluesky, Mastodon, Threads

Cloudflare anklagar AI-sökmotorn Perplexity för att medvetet bryta mot webbens regler för datainsamling. I en rapport beskriver Cloudflare hur Perplexity använder avancerade tekniker för att kringgå webbplatsers försök att stoppa automatisk skrapning.

Företaget hävdar att Perplexity först använder sina egna, öppet deklarerade användaragenter, men när dessa blockeras byter systemet identitet och efterliknar vanliga webbläsare som Google Chrome på macOS. Samtidigt roterar man IP-adresser och nätverksleverantörer för att göra det svårare att spåra trafiken.

Cloudflare upptäckte metoden genom att sätta upp särskilda testdomäner där robotar uttryckligen förbjöds i robots.txt. När Perplexity kort därefter kunde ge detaljerade svar som byggde på innehållet på dessa sidor drog Cloudflare slutsatsen att företaget kringgår spärrarna. Enligt Cloudflare är detta en tydlig signal om att Perplexity inte bara samlar in data öppet, utan även i hemlighet trots aktiva blockeringar.

Dolt beteende

Som en direkt följd av upptäckten har Cloudflare tagit bort Perplexity från sin lista över verifierade bots – en lista som annars ger pålitliga aktörer fördelar som bättre tillgång till nätverk och lägre risk för felaktig blockering. Cloudflare har även infört nya skyddsmekanismer för att stoppa liknande dolt beteende från andra aktörer.

Perplexity avvisar dock kritiken. Företaget menar att deras system endast hämtar information när användare gör en sökning och att de inte använder traditionella metoder för att skapa index eller lagra data för framtida AI-träning. Enligt Perplexity rör det sig snarare om missförstånd eller ett PR-trick från Cloudflare.

Konflikt

Branschexperter ser situationen som en del av en större konflikt mellan AI-plattformar och innehållsägare på webben. Många publicister och företag försöker skydda sitt material från att användas gratis i AI-tjänster, samtidigt som AI-aktörerna hävdar att de måste kunna hämta information för att kunna erbjuda konkurrenskraftiga tjänster. Händelsen väcker frågor om hur framtida regleringar ska utformas och var gränsen går mellan legitim informationshämtning och otillåten dataskrapning.

Källa:

Cloudflare

Magasin Macken använder AI för att samla in information och underlag för de texter som publiceras. Vi använder även AI för att skapa bilder och illustrationer. Dessa märks alltid med att det är AI-bilder. I förekommande fall så läggs även till länkar till källa och referenser till i texterna som alltid kontrolleras av en mänsklig skribent – som är den som skriver och redigerar alla texter till alla väsentliga delar. 

Prenumerera
Nortis om
guest
0 Comments
Nyaste
Äldsta Mest röstade
Inline Feedbacks
Se alla kommentarer

blank

Mikael Winterkvist

Fyrabarns-far, farfar, morfar och egen företagare i Skellefteå med kliande fingrar. Jag skriver om fotografering, sport, dataprylar, politik, nöje, musik och film. Vid sidan av den här bloggen så jobbar jag med med det egna företaget Winterkvist.com. Familjen består av hustru, fyra barn (utflugna) och fem barnbarn.

Jag har hållit på med datorer sedan tidigt 1980-tal och drev Artic BBS innan Internet knappt existerade. Efter BBS-tiden har det blivit hemsidor, design, digitala medier och trycksaker. Under tiden som journalist jobbade jag med Mac men privat har det varit Windows som har gällt fram till vintern 2007. Då var det dags att byta och då bytte vi, företaget, helt produktionsplattform till macOS. På den vägen är det.

_____________________________________________________________________________________

Anmäl dig till Magasin Mackens nyhetsbrev

Du får förhandsinformation om Macken, våra planer och du får informationen, först och direkt till din mail. Vi lovar att inte skicka din information vidare och vi lovar att inte skicka ut mer än max ett nyhetsbrev per månad.

Anmäl dig här

_____________________________________________________________________________________

De senaste inläggen:

Tusentals falska TikTok Shop-sajter sprider skadlig kod

Tusentals falska TikTok Shop-sajter sprider skadlig kod

En ny rapport avslöjar att över 15 000 falska domäner som utger sig för att vara TikTok Shop används för att sprida skadlig programvara och stjäla användardata. Enligt cybersäkerhetsföretaget [företagsnamn] riktar sig attacken mot både köpare och säljare genom att efterlikna…

läs mer