Standardavvik - Excel og Google Sheets

Denne opplæringen viser hvordan du bruker Excel standardavviksfunksjon i Excel for å beregne standardavvik for en hel populasjon.

STANDARD DEVIATION Funksjonsoversikt

STANDARD DEVIATION Funksjonen Beregner beregner standardavvik for en hel populasjon.

For å bruke STANDARD DEVIATION Excel -regnearkfunksjonen, velg en celle og skriv:

(Legg merke til hvordan formelinngangene vises)

STANDARD DEVIATION -funksjon Syntaks og innganger:

1 = STDEV (nummer1, [nummer2], …)

tall- Verdier for å få Standard Variance

Hvordan beregne standardavviket i Excel

Når du arbeider med data, vil du kjøre noen grunnleggende tester for å hjelpe deg å forstå det. Du vil vanligvis begynne med å beregne gjennomsnittet, ved hjelp av Excel -gjennomsnittsfunksjonen <>.

Dette gir deg en ide om hvor "midten" av dataene er. Og derfra vil du se på hvor spredt dataene er rundt dette midtpunktet. Det er her standardavviket kommer inn.

Excel gir deg en rekke funksjoner for å beregne standardavviket - STDEV, STDEV.P, STDEV.S og DSTDEV. Vi kommer til dem alle, men først, la oss lære hva standardavviket er er, nøyaktig.

Hva er standardavviket?

Standardavviket gir deg en ide om hvor langt datapunktene dine er fra gjennomsnittet. Ta følgende datasett med testresultater av 100:

1 48,49,50,51,52

Gjennomsnittet for dette datasettet er 50 (legg sammen alle tallene, og del med n, hvor n er antall verdier i området).

Se nå på det neste settet med data:

1 10,25,50,75,90

Gjennomsnittet for dette datasettet er også 50 - men de to områdene forteller en veldig forskjellig historie. Hvis du bare brukte gjennomsnittet, tror du kanskje at de to gruppene var omtrent like i sin evne - og i gjennomsnitt er de det.

Men i den første gruppen har vi 5 personer som fikk veldig like, veldig middelmådige poeng. Og i den andre gruppen balanserte vi et par high-flyers ut av et par dårlig-scorere, med en person i midten. De spre av poengsummene er veldig forskjellige, noe som gjør tolkningen av dataene veldig forskjellige også.

Standardavviket er et mål på denne spredningen.

Hvordan standardavviket beregnes

For å forstå hva standardavviket er og hvordan det fungerer, kan det hjelpe å arbeide gjennom et eksempel for hånd. På den måten vet du hva som skjer "under hetten" når vi kommer til Excel-funksjonene du kan bruke.

For å beregne standardavviket, arbeider du gjennom denne prosessen:

1) Beregn gjennomsnittet

La oss ta vårt første datasett ovenfor: 48,49,50,51,52

Vi vet allerede gjennomsnittet (50), som jeg har bekreftet her med Excel AVERAGE -funksjonen <>:

1 = GJENNOMSNITT (C4: C8)

2) Trekk gjennomsnittet fra hver verdi i datasettet

Jeg har gjort dette med følgende formel:

1 = C4- $ H $ 4

Gjennomsnittet vårt er i H4, og jeg har "låst" cellereferansen ved å sette dollartegnene foran kolonnen og raden (ved å trykke F4). Dette betyr at jeg kan kopiere formelen nedover kolonnen uten at cellereferansen oppdateres.

Resultatet:

La oss stoppe her et øyeblikk. Hvis du tar en titt på den nye kolonnen - vil du se at tallene her summerer seg til null. Gjennomsnittet av disse tallene er også null.

Selvfølgelig kan spredningen av dataene våre ikke være null - vi vet at det er en viss variasjon der. Vi trenger en måte å representere denne variasjonen på, uten at gjennomsnittet viser seg å være null.

3) Kvadrer forskjellene

Vi kan oppnå dette ved å kvadrere forskjellene. Så la oss legge til en ny kolonne og kvadrere tallene i D -kolonnen:

1 = D4*D4

Dette ser bedre ut. Nå har vi litt variasjon, og mengden variasjon er relatert til hvor langt hver poengsum er fra gjennomsnittet.

4) Beregn variansen - gjennomsnittet av de kvadrerte forskjellene

Det neste trinnet er å få gjennomsnittet av de kvadratiske forskjellene. Det er faktisk to måter å gjøre dette på når man beregner standardavviket.

  • Hvis du bruker befolkningsdata, du tar bare gjennomsnittet (oppsummer verdiene og dividerer med n)
  • Hvis du bruker eksempeldata, du tar summen av verdiene og deler med n-1

Befolkningsdata betyr at du har "hele settet" med dataene dine, for eksempel har du data om hver elev i en gitt klasse.

Eksempeldata betyr at du ikke har alle dataene dine, bare et utvalg tatt fra en større befolkning. Vanligvis er målet ditt med eksempeldata å gjøre et estimat av hva verdien er i den større befolkningen.

En politisk meningsmåling er et godt eksempel på eksempeldata - forskere undersøker, for eksempel, 1000 mennesker for å få en ide om hva et helt land eller stat tenker.

Her har vi ikke et utvalg. Vi har bare fem statistisk innstilte familiemedlemmer som ønsker å beregne standardavviket til en test de alle tok. Vi har alle datapunkter, og vi gjør ikke et estimat av en større gruppe mennesker. Dette er befolkningsdata - så vi kan bare ta gjennomsnittet her:

1 = GJENNOMSNITT (E4: E8)

OK, så vi har 2. Denne poengsummen er kjent som "variansen", og det er grunnlaget for mange statistiske tester, inkludert standardavviket. Du kan lese mer om variansen på hovedsiden: hvordan beregne varians i Excel <>.

5) Få Square Root of Variance

Vi kvadrerte tallene våre tidligere, noe som åpenbart blåser opp verdiene litt. Så for å bringe figuren tilbake i tråd med de faktiske forskjellene i poengsummene fra gjennomsnittet, må vi kvadratrot resultatet av trinn 4:

1 = SQRT (H4)

Og vi har vårt resultat: standardavviket er 1.414

Fordi vi har kvadratroten våre tidligere kvadrerte tall, er standardavviket gitt i de samme enhetene som de opprinnelige dataene. Så ut standardavvik her er 1.414 testpunkter.

Standardavvik når dataene er mer spredt

Tidligere hadde vi et annet eksempel på dataområde: 10,25,50,75,90

Bare for moro skyld, la oss se hva som skjer når vi beregner standardavviket på disse dataene:

Alle formlene er nøyaktig de samme som før (merk at det gjennomsnittlige gjennomsnittet fortsatt er 50).

Det eneste som endret seg var spredningen av poengsummene i kolonne C. Men nå er standardavviket vårt mye høyere, med 29.832 testpunkter.

Selvfølgelig, siden vi bare har 5 datapunkter, er det veldig lett å se at spredningen av poengsummene er forskjellig mellom de to settene. Men når du har 100- eller 1000 -talls datapunkter, kan du ikke fortelle det ved å skanne dataene raskt. Og det er nettopp derfor vi bruker standardavviket.

Excel -funksjonene for å beregne standardavviket

Nå som du vet hvordan standardavviket fungerer, trenger du ikke å gå gjennom hele prosessen for å komme til standardavviket. Du kan bare bruke en av Excels innebygde funksjoner.

Excel har flere funksjoner for dette formålet:

  • P beregner standardavviket for populasjonsdata (ved å bruke den nøyaktige metoden vi brukte i eksemplet ovenfor)
  • S beregner standardavviket for eksempeldata (ved bruk av n-1-metoden vi berørte tidligere)
  • STDEV er nøyaktig det samme som STDEV.S. Dette er en eldre funksjon som er erstattet av STDEV.S og STDEV.P.
  • STDEVA er veldig lik STDEV.S, bortsett fra at den inkluderer tekstceller og boolske (TRUE/FALSE) celler når beregningen foretas.
  • STDEVPA er veldig lik STDEV.P, bortsett fra at den inkluderer tekstceller og boolske (TRUE/FALSE) celler ved beregningen.

Wow, mange alternativer her! Ikke la deg skremme - i de aller fleste tilfellene bruker du enten STDEV.P eller STDEV.S.

La oss gå igjennom hver av disse i sin tur, med start med STDEV.P, siden det er metoden vi nettopp har jobbet med.

Excel STDEV.P -funksjonen

STDEV.P beregner standardavviket for populasjonsdata. Du bruker det slik:

1 = STDEV.P (C4: C8)

Du definerer ett argument i STDEV.P: dataområdet du vil beregne standardavviket for.

Dette er det samme eksemplet vi gikk gjennom trinn for trinn ovenfor da vi beregnet standardavviket for hånd. Og som du kan se ovenfor, får vi nøyaktig det samme resultatet - 1.414.

Merk STDEV.P ignorerer alle celler som inneholder tekst eller boolske (TRUE/FALSE) verdier. Hvis du trenger å inkludere disse, bruk STDEVPA.

Excel STDEV.S -funksjonen

STDEV.S beregner standardavviket for eksempeldata. Bruk den slik:

1 = STDEV.S (C4: C8)

Igjen, det tar ett argument - dataområdet du vil vite standardavviket for.

Før vi går inn på et eksempel, la oss diskutere forskjellen mellom STDEV.S og STDEV.P.

Som vi allerede har diskutert, bør STDEV.S brukes på eksempeldata - når dataene dine er en del av et større sett. Så la oss anta at flere i vårt eksempel ovenfor hadde tatt testen. Vi ønsker å estimere standardavviket til alle som tok testen, ved å bruke bare disse fem poengsummene. Nå bruker vi eksempeldata.

Nå er beregningen forskjellig fra trinn (4) ovenfor, når vi beregner variansen - gjennomsnittet av kvadratforskjellen for hver poengsum fra det gjennomsnittlige gjennomsnittet.

I stedet for å bruke den vanlige metoden - summer opp alle verdiene, og divider med n, vil vi oppsummere alle verdiene og dele med n-1:

1 = SUM (E4: E8) / (COUNT (E4: E8) -1)

I denne formelen:

  • SUM får summen av de kvadrerte forskjellene
  • COUNT returnerer n, som vi trekker 1 fra
  • Vi deler deretter summen vår med vår n-1

Denne gangen er gjennomsnittet av kvadratiske forskjeller 2,5 (du husker kanskje at det var 2 tidligere, så det er litt høyere).

Så hvorfor deler vi med n-1 i stedet for n når vi arbeider med eksempeldata?

Svaret er ganske komplekst, og hvis du bare prøver å kjøre tallene dine for å forstå dataene dine, er det ikke noe du virkelig trenger å bekymre deg for. Bare sørg for at du bruker STDEV.S for eksempeldata, og STDEV.P for populasjonsdata, så går det bra.

Hvis du virkelig er nysgjerrig på å vite hvorfor, kan du se hovedsiden om hvordan du beregner varians i Excel <>.

OK, så vi har variansen for prøven nå, så for å få standardavviket for prøven, får vi bare kvadratroten til variansen:

1 = SQRT (H4)

Vi får 1.581.

STDEV.S gjør alle de ovennevnte beregningene for oss, og returnerer prøvens standardavvik i bare en celle. Så la oss se hva det kommer opp med …

1 = STDEV.S (C4: C8)

Jepp, 1.581 igjen.

Excel STDEV -funksjonen

Excels STDEV -funksjon fungerer på nøyaktig samme måte som STDEV.S - det vil si at den beregner standardavviket for et utvalg av data.

Du bruker det på samme måte:

1 = STDEV (C4: C8)

Igjen får vi det samme resultatet.

Viktig notat: STDEV er en "kompatibilitetsfunksjon", som i utgangspunktet betyr at Microsoft blir kvitt den. Det fungerer fortsatt for nå, så alle eldre regneark vil fortsette å fungere som normalt. Men i fremtidige versjoner av Excel kan Microsoft slippe det helt, så du bør bruke STDEV.S i stedet for STDEV der det er mulig.

Excel STDEVA -funksjonen

STDEVA brukes også til å beregne standardavviket for en prøve, men den har et par viktige forskjeller du trenger å vite om:

  • Sanne verdier regnes som 1
  • FALSE verdier regnes som 0
  • Tekststrenger telles som 0

Bruk den som følger:

1 = STDEVA (C4: C8)

Ytterligere fire venner og familiemedlemmer har gitt i sine testresultater. Disse er vist i kolonne C, og kolonne D angir hvordan STDEVA tolker disse dataene.

Fordi disse cellene tolkes som så lave verdier, skaper dette en mye større spredning blant dataene våre enn vi så før, noe som har økt standardavviket sterkt, nå på 26.246.

Excel STDEVPA -funksjonen

STDEVPA beregner standardavviket for en populasjon på samme måte som STDEV.P. Imidlertid inkluderer den også boolske verdier og tekststrenger i beregningen, som tolkes som følger:

  • Sanne verdier regnes som 1
  • FALSE verdier regnes som 0
  • Tekststrenger telles som 0

Du bruker det slik:

1 = STDEVPA (C4: C12)

Filtrere data før du beregner standardavviket

I den virkelige verden vil du ikke alltid ha de nøyaktige dataene du trenger i et pent og ryddig bord. Ofte har du et stort regneark fullt av data, som du må filtrere før du beregner standardavviket.

Du kan gjøre dette veldig enkelt med Excel -databasefunksjonene: DSTDEV (for prøver) og DSTDEVP (for populasjoner).

Disse funksjonene lar deg lage en kriterietabell der du kan definere alle filtrene du trenger. Funksjonene bruker disse filtrene bak kulissene før standardavviket returneres. På denne måten trenger du ikke å berøre et autofilter eller trekke data ut i et eget ark - DSTDEV og SDTDEVP kan gjøre alt det for deg.

Lær mer på hovedsiden for Excel DSTDEV- og DSTDEVP -funksjonene <>.

STANDARD DEVIATION Funksjon i Google Sheets

STANDARD DEVIATION -funksjonen fungerer nøyaktig det samme i Google Sheets som i Excel:

Du vil bidra til utvikling av området, dele siden med vennene dine

wave wave wave wave wave