Teorien bag p- værdier og nulhypotesen kan virke kompliceret i starten, men at forstå begreberne vil hjælpe dig med at navigere i statistikens verden. Desværre misbruges disse udtryk ofte i populærvidenskaben, så det ville være nyttigt for alle at forstå det grundlæggende.
Se også vores artikel Sådan slettes alle andre rækker i Excel
At beregne p- værdien af en model og bevise / modbevise nulhypotesen er overraskende enkelt med MS Excel. Der er to måder at gøre det på, og vi dækker begge. Lad os grave os ind.
Nul hypotese og p-værdi
Nullhypotesen er en erklæring, også omtalt som en standardposition, der hævder, at forholdet mellem de observerede fænomener ikke eksisterer. Det kan også anvendes på foreninger mellem to observerede grupper. Under forskningen tester du denne hypotese og prøver at modbevise den.
For eksempel, siger, at du ønsker at observere, om en bestemt tæppe diæt har betydelige resultater. Nullhypotesen er i dette tilfælde, at der ikke er nogen signifikant forskel i testpersoners vægt før og efter diæt. Den alternative hypotese er, at kosten gjorde en forskel. Dette er, hvad forskere ville prøve at bevise.
P- værdien repræsenterer chancen for, at det statistiske resume ville være lig med eller større end den observerede værdi, når nulhypotesen er sand for en bestemt statistisk model. Selvom det ofte udtrykkes som et decimaltal, er det generelt bedre at udtrykke det som en procentdel. For eksempel skal p- værdien på 0, 1 repræsenteres som 10%.
En lav p- værdi betyder, at beviset mod nulhypotesen er stærkt. Dette betyder yderligere, at dine data er betydningsfulde. På den anden side betyder en høj p- værdi, at der ikke er nogen stærk bevis for hypotesen. For at bevise, at fad-diet fungerer, er forskere nødt til at finde en lav p- værdi.
Et statistisk signifikant resultat er det, der meget usandsynligt vil ske, hvis nulhypotesen er sand. Betydningsniveauet er angivet med den græske bogstav alfa, og det skal være større end p- værdien for at resultatet skal være statistisk signifikant.
Mange forskere inden for en lang række felter bruger p- værdien for at få en bedre og dybere indsigt i de data, de arbejder med. Nogle af de fremtrædende felter inkluderer sociologi, strafferetspleje, psykologi, finans og økonomi.
Find p- værdien i Excel
Du kan finde p- værdien af et datasæt i MS Excel via T-Test-funktionen eller ved hjælp af dataanalyseværktøjet. Først skal vi undersøge T-Test-funktionen. Vi undersøger fem universitetsstuderende, der gik på en 30-dages diæt. Vi sammenligner deres vægt før og efter kosten.
BEMÆRK: Med henblik på denne artikel bruger vi MS Excel 2010. Selvom det ikke er den nyeste, skal trinene generelt også gælde for de nyere versioner.
T-testfunktion
Følg disse trin for at beregne p- værdien med T-Test-funktionen.
- Opret og udfyld tabellen. Vores bord ser sådan ud:

- Klik på en hvilken som helst celle uden for dit bord.
- Indtast: = T.Test (.
- Skriv det første argument efter det åbne beslag. I dette eksempel er det kolonnen Før diæt. Intervallet skal være B2: B6. Indtil videre ser funktionen sådan ud: T.Test (B2: B6.
- Dernæst indtaster vi det andet argument. Kolonnen After Diet og dens resultater er vores andet argument, og det interval, vi har brug for, er C2: C6. Lad os tilføje det til formlen: T.Test (B2: B6, C2: C6.
- Indtast et komma efter det andet argument, og fordelingen med en-halet distribution og to-haler vises automatisk i en rullemenu. Lad os vælge den første - en-halede distribution. Dobbeltklik på det.
- Indtast et andet komma.
- Dobbeltklik på indstillingen Parret i den næste rullemenu.
- Nu hvor du har alle de elementer, du har brug for, skal du lukke beslaget. Formlen til dette eksempel ser sådan ud: = T.Test (B2: B6, C2: C6, 1, 1)

- Tryk på Enter. Cellen viser p- værdien med det samme. I vores tilfælde er værdien 0, 133906 eller 13, 3906%.
Da den er højere end 5%, giver denne p- værdi ikke stærke bevis mod nulhypotesen. I vores eksempel beviser forskningen ikke, at slankekure hjalp testpersonerne med at miste en betydelig vægt. Dette betyder ikke nødvendigvis, at nulhypotesen er korrekt, kun at den ikke er blevet modbevist endnu.
Dataanalyserute
Værktøjet Data-analyse giver dig mulighed for at gøre mange seje ting, inklusive beregninger på p- værdi. For at gøre tingene enklere bruger vi den samme tabel som i den foregående metode.
Sådan gøres det.
- Da vi allerede har vægtforskelle i D-kolonnen, springer vi forskelleberegningen over. I de fremtidige tabeller skal du bruge denne formel: = ”Cell 1” - “Cell 2”.
- Klik derefter på fanen Data i hovedmenuen.
- Vælg værktøjet Dataanalyse.
- Rul ned på listen, og klik på indstillingen t-Test: Paired Two Sample for Means.
- Klik på OK.
- Et pop op-vindue vises. Det ser sådan ud:

- Indtast det første interval / argument. I vores eksempel er det B2: B6.
- Indtast det andet interval / argument. I dette tilfælde er det C2: C6.
- Efterlad standardværdien i tekstfeltet Alpha (det er 0, 05).
- Klik på alternativknappen Output Range og vælg, hvor du vil have resultatet. Hvis det er A8-cellen, skal du indtaste: $ A $ 8.
- Klik på OK.
- Excel beregner p- værdien og flere andre parametre. Den endelige tabel kan se sådan ud:

Som du kan se, er p- værdien med en hale den samme som i første tilfælde - 0.133905569. Da den er over 0, 05, gælder nulhypotesen for denne tabel, og beviset mod den er svag.
Ting at vide om p- værdien
Her er nogle nyttige tip om beregninger af p- værdi i Excel.
- Hvis p- værdien er lig med 0, 05 (5%), er dataene i din tabel betydelige. Hvis det er mindre end 0, 05 (5%), er de data, du har, meget signifikante.
- I tilfælde af at p- værdien er mere end 0, 1 (10%), er dataene i din tabel ubetydelige. Hvis det er inden for området 0, 05-0, 10, har du marginalt signifikante data.
- Du kan ændre alfaværdien, skønt de mest almindelige indstillinger er 0, 05 (5%) og 0, 10 (10%).
- At vælge to-halet test kan være det bedre valg, afhængigt af din hypotese. I eksemplet ovenfor betyder test med én haler, at vi undersøger, om testpersonerne tabte vægt efter slankekure, og det er nøjagtigt, hvad vi havde brug for for at finde ud af. Men en to-halet test ville også undersøge, om de fik statistisk signifikante mængder af vægt.
- P- værdien kan ikke identificere variabler. Med andre ord, hvis den identificerer en sammenhæng, kan den ikke identificere årsagerne bag.
P- værdien afmystificeret
Enhver statistiker, der er værd at have sit salt, skal kende ins og outs ved test af nulhypotese, og hvad p- værdien betyder. Denne viden vil også være praktisk for forskere på mange andre områder.
Har du nogensinde brugt Excel til at beregne p- værdien af en statistisk model? Hvilken metode brugte du? Foretrækker du en anden måde at beregne det på? Fortæl os det i kommentarfeltet.






