Den automatiserade kunskapsproduktionen

21 januari 2014

Strax efter millennieskiftet bestämde sig den katolska kyrkan för att Internet behövde ett skyddshelgon, en insikt som borde ha drabbat alla som någon gång har läst kommentarerna till en video på Youtube. Den dåvarande påven, Johannes Paulus II, föreslog Isidor av Sevilla. Huruvida någonting faktiskt beslutades eller om det rann ut i sanden verkar en smula oklart, men det hade inte varit ett dåligt val. Isidor av Sevilla var en kyrkofader och filosof, i dag bäst ihågkommen för sitt verk Etymologia, som han skrev under tidigt 600-tal. Det är en encyklopedi uppdelad i tjugo böcker, tänkt att samla hans samtids kunskap och vetande, och den förblev inflytelserik och viktig kunskapskälla i århundraden efter Isidors död. Han citerar 154 olika författare – förmodligen blott något färre än engelskspråkiga Wikipedia hänvisar till i sina artiklar om Shakespeares liv och verk.

Få försöker sig på att på egen hand skriva allomfattande uppslagsverk nu för tiden. Wikipedias framgång beror på att man har lyckats få så oerhört många människor att lägga sin fritid på att samla, och sprida, vetandet. Likväl sker förstås enskilda stordåd även inom wikins ramar. Svenskspråkiga Wikipedias allra flitigaste bidragsgivare, Lsjbot, har till exempel oförtröttligt skapat hundratusentals artiklar om fåglar, svampar och insekter under det senaste året.

Lsjbot är som namnet antyder en bot, en liten bit kod som med uppmuntran från sin skötare hämtar information från några olika databaser och utifrån mallar skapar korta artiklar med grundläggande fakta om mer eller mindre obskyra arter, där det är osannolikt att en mänsklig skribent skulle ta tag i ämnet. Några tappra själar i humanoid tappning har sedan gått igenom så många artiklar de har hunnit för att fixa till eventuella språkfel eller andra konstigheter. Automatiseringen har inte bara nått industrin och telesvarstjänsterna, utan även kunskapsproduktionen.

Nu är det förstås osannolikt att särskilt många skall hitta till artiklarna Anthocoris amplicollis eller Betacallis odaiensis, eftersom de artiklar som Lsj tagit sig an närmast per definition är så obskyra att det finns en risk att många av dem aldrig kommer att få någon läsare. De innehåller betydligt mindre relevant information än artiklar som skapats av mänskliga skribenter, och är inte tänkta att ersätta dem. Snarare är de ett temporärt komplement, någonting att ha tills vidare i väntan på den lyckliga dag då en kunnig och engagerad mänsklig skribent sätter sig ned för att ta tag i artikeln Juncobia leegei, en insektsart i familjen långrörsbladlöss eller borstbladlöss, beroende på vilken taxonomisk databas man vill lyssna på. Å andra sidan innehåller de förmodligen, som en erfaren skribent på Wikipedia lite beskt påpekade, även betydligt färre misstag.