tirsdag den 1. november 2016

Ti enkle regler til at bruge statistik effektivt

Ti enkle regler til at bruge statistik effektivt

Artiklen fortæller, hvordan et team af statistikere, herunder Robert E. Kass fra Carnegie Mellon University har skrevet ”Ten Simple Rules for Effective Statistical Practice.”
Det er retningslinjer som er designet til at hjælpe forskningsmiljøet - især forskere, der ikke er statistiske eksperter eller mangler en dedikeret statistiker i deres team, hvordan man undgår velmenende, men upræcise statiske data.

"A central and common task for us as research investigators is to decipher what data are able to say about the problems we are trying to solve," skriver Kass, som også er professor i statistik og maskine læring, og midlertidig direktør for Center for the Neural Basis of Cognition.

Michael J. Tarr, leder af CMU Institut for Psykologi fortæller, at han mener at det er nogle ligetil og forståelige retningslinjer som Kass har formuleret, og det vil hjælpe gevaldigt, når studerende og fakultet forstår sig på vigtigheden af statistisk velbegrundet forskning. Deres retningslinjer er et ’must-read- for alle som ønsker gode og reproducerbar videnskab.

De 10 regler:

#1 - Statistiske metoder skal gøre det muligt for data at besvare videnskabelige spørgsmål

Det er behjælpsomt at samarbejde med statistikere tidligt i en undersøgelse, da uerfarne statistikere ofte fokuserer på, hvilken type teknik de skal bruge til at analysere deres data, i stedet for at overveje alle måder, hvorpå dataene kan besvare det underliggende videnskabelige spørgsmål.

#2 - Signaler kommer altid med støj

Variabilitet kommer i mange former, men det er afgørende at forstå, hvornår det er godt, og hvornår det bare er støj for at udtrykke usikkerhed. Det hjælper også at identificere sandsynlige kilder til systematiske fejl.

#3 - Planlæg fremad, virkelig fremad

Det at stille spørgsmål i projekteringsfasen kan spare flere hovedpiner når det kommer til analyse fasen. Omhyggelig dataindsamling kan også i høj grad forenkle analysen og gøre den mere stringent.

#4 - Bekymring omkring dataenes kvalitet..

.. når det kommer til dataanalyse, ”affald ind producerer affald ud.” Kompleksiteten af moderne dataindsamling kræver mange antagelser om funktionen af teknologi, ofte data pre-teknologi, hvilket kan have dybtgående virkninger der nemt kan gå ubemærket hen.

#5 - Statistisk analyse er mere end et sæt beregninger

Statistiske softwares giver værktøjer til at assistere analyser - ikke en definition af dem. Den videnskabelige kontekst er kritisk, og nøglen til principiel statistisk analyse er at bringe analysemetoder i tæt korrespondance med videnskabelige spørgsmål.

#6 - Hold det simpelt

Enkelthed overtrumfer kompleksitet. Et stort antal målinger, samspil mellem forklarende variabler, ikke-lineære virkningsmekanismer, manglende data, forvirring og andre faktorer kan kræve en stigning i model kompleksiteten.
Husk på, et godt design, som er gennemført godt, kan ofte tillade simple metoder til analysen og til at producere stærke resultater.

#7 - Giv vurderinger af variabiliteten

Et grundlæggende formål med statistisk analyse er at hjælpe med at vurdere usikkerhed, ofte i form af en standard fejl eller konfidensinterval, og en af de store successer i statistisk modellering, er at det kan give et skøn over standardafvigelser fra de samme data, der producerer skøn over mængden af interesse. Ved rapportering af resultater er det vigtigt at levere end forestilling om statistisk usikkerhed.

#8 - Tjek dine forudsætninger

Bredt tilgængelig statistiske softwares gør det nemt at udføre analyser uden omhyggelig opmærksomhed på iboende antagelser, og dette risikerer unøjagtige eller vildledende resultater. Det er derfor vigtigt at forstå de forudsætninger der er indhold af de metoder, og at gøre hvad som helst muligt at forstå og vurdere disse antagelser.

#9 - Når det er muligt, repliker!

Ideelt er replikation udført af en selvstændig forsker. De videnskabelige resultater der består ved tiden, er dem som er blevet bekræftet på tværs af varierende forskellige, men nært beslægtede, situationer.
I mange sammenhænge er komplet replikering meget vanskelig eller umulig, som i storskalaforsøg såsom multi-center kliniske prøvelser. I de tilfælde vil en minimumsstandard være at følge regel 10:

#10 - Gør din analyse reproducerbar

I betragtning af det samme sæt af data, sammen med en fuldstændig beskrivelse af analysen, bør det være muligt at gengive de tabeller, figurer og statistiske inferens. Dramatisk forbedre evnen til at reproducere resultater ved at være meget systematisk om de skridt i analysen, ved at dele data og kode, der bruges til at producere de resultater, og ved at følge accepterede statistikkers bedste praksis.

Kass fortæller: ”Jeg er en stor tilhænger af værdien i at identificere store ideer i statistikker og i at angive dem klart og kortfattet. De 10 simple regler er fantastisk, at have bevist sit værd som et format for højt niveau videnskabelige begreber. Denne artikel var temmelig hårdt arbejde, men vi havde et godt hold og jeg var meget tilfreds med resultatet."

Carnegie Mellon University. (2016, June 20). Ten simple rules to use statistics effectively. ScienceDaily. Hentet 1. November 2016 fra


Ingen kommentarer:

Send en kommentar