Wikipedia, SSL och övervakningen

18 februari 2014

Internet har varit på väg mot SSL, som används för att göra det svårare för utomstående att avlyssna trafik, sedan länge. Wikipedia introducerade möjligheten att smidigt använda HTTPS (webbtrafik krypterad med SSL) 2011 och med några få undantag går all inloggad trafik över SSL sedan augusti 2013. Edward Snowden och hans avslöjanden, som kanske inte kom som någon stor överraskning men som tvingade alla att konfrontera det faktum att vi nu visste vad vi tidigare kanske hade misstänkt, fick planerna på utvidga den krypterade trafiken att prioriteras upp. Wikimedia Foundation arbetar för att även oinloggad trafik som norm skall gå över HTTPS istället för HTTP. Om det är NSA man oroar sig för är frågan hur mycket det kommer att hjälpa, men varje litet steg gör att det åtminstone kräver lite mer ansträngning och resurser för den som lyssnar.

Ryan Lane på Wikimedia Foundation skrev i somras en lista över den närmaste framtidens åtgärder och problem. Bland annat vill man göra så att all trafik automatiskt skall gå över HTTPS istället för HTTP för att göra det svårare att lyssna på den, men eftersom länder som Kina och Iran spärrar tillgången till Wikipedia om man använder SSL – just eftersom de så gärna vill se vilka artiklar invånarna besöker, till exempel för att kunna blockera känsliga uppslagsord – skulle det i dagsläget göra uppslagsverket otillgängligt för väldigt många människor. Dessutom är det i dag ineffektivt.

Det SSL gör i det här fallet är att dölja vad du gör på en särskild webbplats. Det används till exempel för att skydda lösenord, banköverföringar eller köp med kreditkort, men i det här fallet också för att värna besökarnas privatliv så att det inte går att kartlägga vad de läser om. Förenklat går det ut på att din webbläsare upprättar kontakt med servern där webbplatsen du vill nå finns och krypterat skickar information om mer exakt vilken sida du vill se. Servern skickar sedan ett svar som skall vara skyddat från insyn. Allt man kan se är vilken webbplats du besöker och hur stor trafiken är.

Det är just det där med hur stor trafiken är som är problemet. Eftersom man ser hur mycket data du tar emot kan den som har tillgång till trafiken lista ut hur stor artikeln är med försvinnande liten felmarginal, särskilt om det finns minst en bild i den. Vi kan skriva ett program, en så kallad spindel, som går igenom artiklar på Wikipedia och kartlägger hur stora de är, flera gånger om dagen för att inte missa om en artikel redigeras. Sedan jämförs ditt besök helt enkelt med listan över artiklar i olika storlek. Många mycket korta artiklar kommer att vara lika små, men de allra flesta som faktiskt är intressanta att spana på är längre, och då ökar chansen markant att deras storlek är unik. Skulle två artiklar vara lika stora kan den som lyssnar på trafiken ta hjälp av att Wikipedia i så stor utsträckning bygger på länkar och att man klickar sig vidare till andra uppslagsord och se om din trafik matchar storleken på någon artikel som antingen länkar eller länkas från artikeln du läser.

Wikipedia är väldigt stort, men de områden som är riktigt intressanta att övervaka är förmodligen betydligt färre än den samlade mängden ämnen. Begränsar vi oss till femtiotusen artiklar är det både enkelt att hantera nog och med utrymme för att kartlägga diverse politiska, religiösa, filosofiska eller för den delen sexuella böjelser.

Att låta all trafik gå över ett protokoll som SPDY hade förmodligen kunnat lösa just det här problemet, men det finns än så länge inte ens på kartan. Det kommer ta tid innan man har kommit så långt att den som har tillgång till trafiken inte kan se vilka artiklar vi besöker på Wikipedia.

Länkar
Om HTTPS och Wikimediaprojekten
Native HTTPS support enabled for all Wikimedia Foundation wikis
The future of HTTPS on Wikimedia projects
HTTPS by default beta program
Om HTTPS på Wikipedia
Om spindlar på Wikipedia
Om TLS/SSL på Wikipedia (kallas ofta bara SSL)
Om SPDY på Wikipedia
Om forward secrecy på Wikipedia