Wikipediabloggen

bakom kulisserna

Svenskaspråkiga Wikipedia näst störst? Nja

Johan

Under gårdagen rapporterade diverse medier om det faktum att svenskspråkiga Wikipedia nu har näst flest artiklar av alla språkversioner, färre än enbart engelskspråkiga Wikipedia. Det är förvisso tekniskt sett sant. Som påpekas beror det på att majoriteten av dessa artiklar är robotskapade texter om insekter, sjöar och så vidare, enkla artiklar skapade utifrån en mall som hämtar mycket grundläggande information ur en eller ett par databaser och sedan skapar artiklar utifrån dem. Vad innebär det egentligen? Att svenskspråkiga Wikipedia är en av de mest heltäckande språkversionerna? Att vi är en av de sämsta, eftersom majoriteten av våra artiklar är robotskapade? Ingetdera, skulle jag vilja hävda.

Det man måste komma ihåg är att det här inte bara är artiklar som förmodligen aldrig hade skapats annars (de handlar ofta till exempel om arter som kanske bara har latinska namn) utan sannolikt är artiklar som aldrig kommer att bli lästa. De brukar, mig veterligen, vara korrekta i det lilla de försöker säga. De är källbelagda. De är bara, de allra flesta, om ämnen som ingen någonsin söker information om. De ligger lite vid sidan om de mänskligt skrivna artiklarna, huvudsakligen på grund av att någon i de sistnämnda fallen aktivt måste ha bestämt sig för att ja, det här, det här skall jag lägga min tid på att skriva om.

De robotskapade artiklarna säger helt enkelt inte så mycket om svenskspråkiga Wikipedia.

Länkar
Wikipediabloggen: Den automatiserade kunskapsproduktionen
En typisk robotartikel: Actophylla.
SVT: Svenskspråkiga Wikipedia nu näst störst i världen
SvD/TT: Svenska Wikipedia nu tvåa i världen