Lögn, Förbannad lögn och statistik!
När man läser IDG's artikel Apache är favoriten hos virusspridarna, kan man få uppfattningen att Apache är den mest sårbara och angripna plattformen. Detta kommer i sig ganska direkt från Sopos rapport, "More than 50 percent of web-based threats in January to June 2007 have affected Apache servers." Men för att få lite perspektiv hur set det ut idag på nätet? Netcraft bygger sedan länge statistik på vilka servrar som kör webbsajter. Mer 52% är idag Apache, och 51% av de som sprider malware är apache servrar. För mig låter det som om problemen inte hänger samman med vilken server som finns utan något annat. När man ser statistik använt i nyheter kan man nästan alltid vara säker på att det är en lögn, att det är fel och någon vill ha ut ett personligt budskap som ligger bakom. Detta nästan oavsett media, och statistik insamlare.
Att smala statistik speciellt om människor är inte enkelt, man kan tro att t.ex. sif eller cf lönestatistik över sina medlemmar fördelat på kön är ofta fel då grunddatat inte är så jämt fördelar som man kan tro. T.ex. Sveriges Ingenjörer som borde vare en ganska homogen grupp kom nyss med en pressrelease om att Ingånglöneklyftan har minskat. Statistiken baserar si så klart på alla medlemmar den statistiska fel marinalen blir förmodligen för stor annars. Ett uppenbart problem som inte tittas på är skillnaden mellan jobb och branscher. Jag säger inte att det inte finns skillnader, och att det kan mycket väl finnas oskäliga skillnader mellan mäns och kvinnors löner. Man skall dock vara mycket försiktig med att dra några slutsatser hur man skall komma vida och ändra på omvärlden baserat på statistik. Genom att sätta ihop sådan kan man nämligen visa precis vad som helst.
Andra bloggar om: jornalism, löner, statistik, jämställdhet, säkerhet, idg
Popularity: 1% [?]
Additional comments powered by BackType