Excel CORREL -funksjon - Beregn statistisk korrelasjon

Last ned eksempel på arbeidsbok

Last ned eksemplet på arbeidsbok

Denne opplæringen viser hvordan du bruker Excel CORREL -funksjon i Excel for å beregne korrelasjonen.

CORREL Funksjon Oversikt

CORREL -funksjonen Beregner korrelasjonen mellom to tallserier.

For å bruke funksjonen CORREL Excel -regneark, velg en celle og skriv inn:

(Legg merke til hvordan formelinngangene vises)

CORREL -funksjon Syntaks og innganger:

1 = CORREL (array1, array2)

matrise1 - Matriser med tall.

Hva er CORREL -funksjonen?

Excel CORREL -funksjonen returnerer korrelasjonskoeffisienten (Pearson's r) av to dataområder.

Hva er korrelasjonskoeffisienten?

Korrelasjonskoeffisienten, vanligvis referert til som Pearsons r (oppkalt etter Karl Pearson, personen som utviklet den), er en statistikk som forteller deg hvor sterkt to variabler er relatert.

Pearson's r er et tall mellom -1 og 1, som kan føre til tre mulige tolkninger: en positiv korrelasjon, en negativ korrelasjon og ingen korrelasjon.

Positiv korrelasjon

En positiv sammenheng (r > 0) betyr at når de to variablene er i takt - når du observerer en høy score i den ene variabelen, har du en tendens til også å observere en høy score i den andre. På samme måte, når den ene variabelen er lav, har den andre en tendens til å være lav også.

For eksempel har høyde og vekt en positiv sammenheng. Se diagrammet nedenfor, som viser høyden og vekten til et lite utvalg av baseballspillere:

De r av denne lille prøven er 0,73 - en veldig sterk positiv korrelasjon. Dette er logisk logisk - høyere mennesker pleier å være tyngre i gjennomsnitt, siden den ekstra høyden består av bein og muskler og annet vev som alle veier noe.

Men korrelasjonen er ikke perfekt (i en perfekt korrelasjon med en r av 1 vil alle poeng falle på trendlinjen). Noen kortere mennesker kan være tyngre - kanskje de har på seg litt ekstra fett, eller trener på treningsstudioet. På samme måte kan noen høye mennesker være veldig tynne og veie faktisk mindre enn mange kortere mennesker.

Korrelasjonen her er sannsynligvis så høy fordi vi har å gjøre med idrettsutøvere, den ville være lavere i den totale befolkningen. Husk å huske på dette når du bruker CORREL - the r du får er ikke definitivt - du må tenke på hva dataene dine er og hvordan du fikk det når du tolket.

Negativ korrelasjon

En negativ korrelasjon (r <0) betyr at når du observerer en høy score i en variabel, har du en tendens til å observere en lav score i den andre variabelen, og omvendt.

For eksempel er studentenes testresultater og antall fravær de hadde fra skolen negativt korrelert. Det vil si at jo flere dager de savner, desto lavere pleier score å være. Jo færre dager de savner, desto høyere er poengsummen:

Igjen er korrelasjonen ikke perfekt (slik de nesten aldri er). Vi har en student her som savnet 5 dager, men likevel klarte å score 85%. Vi har også en som scoret 52%, til tross for at vi bare mangler to dager.

Vi har fortsatt en klar negativ trend. Men det er fortsatt mye variasjon i testresultater som ikke kan forklares med fravær alene. Dette kan skyldes andre variabler, som evne, motivasjon, helse og mange andre potensielle faktorer.

Så når du bruker CORREL, må du huske på at det er et større bilde som dataene dine kanskje ikke forklarer fullt ut.

Ingen sammenheng

Ingen sammenheng (r = 0 eller er nær 0) betyr at du ikke kan forutsi poengsummen til en variabel basert på en annen. Hvis du plotter dataene, ser du ingen merkbar trend, og trendlinjen vil være flat eller nesten flat.

Her er noen data om ringfingerenes lengde og IQ:

Som du kan se, er det ingen sammenheng mellom disse to variablene i denne prøven, så vi kan anta at de ikke er relatert.

I praksis er det lite sannsynlig at du får en r på nøyaktig 0. Husk at når du samler inn data, er det ofte en viss variasjon på grunn av feil, kanskje i måling eller rapportering. Så bare fordi din r er ikke akkurat 0, betyr ikke at du har funnet noe.

Korrelasjon er ikke årsakssammenheng

Det er viktig å huske på at CORREL ikke kan fortelle deg hvilken variabel som påvirker den andre - eller selv om det er noen årsakssammenheng mellom variabler i det hele tatt. For eksempel er det funnet en sammenheng mellom følgende variabler:

  • Mengden iskrem som selges, og mengden voldelig kriminalitet
  • Hvor glad du er og hvor vellykket du er i karrieren din
  • Antall mennesker som druknet i et basseng og antall filmer Nicolas Cage dukket opp i per år

Det første eksemplet er tredje variabelproblem. Selvfølgelig gjør is ikke folk voldelige, og det å utøve vold utløser heller ikke suget etter frossen melk og sukker. Den tredje variabelen er været. I varmt vær går folk rett og slett mer ut - det er mer kontakt mellom mennesker, og det er større sjanse for at det oppstår en konflikt. I varmt vær kjøper folk også mer is. Så iskrem og voldskriminalitet korrelerer bare fordi de begge er knyttet til en tredje variabel.

Det andre kan være et eksempel på dobbel kausalitet. Å være vellykket på jobben kan være bra for din lykke - du tjener mer penger og vil generelt ha mer kontroll over hvilket arbeid du gjør og hvem du gjør det med. Men lykke kan også være gunstig for suksess, kanskje lykkeligere mennesker er lettere å komme i kontakt med og utvikle sterkere arbeidsforhold, eller kanskje de er mer mentalt motstandsdyktige mot tilbakeslag. I dette tilfellet påvirker begge variablene hverandre.

Den tredje er ganske enkelt a falsk korrelasjon. Bare fordi to variabler korrelerer i dataene dine, betyr det ikke at de samhandler uansett i det virkelige liv.

Poenget er at en korrelasjon ikke kan fortelle deg om to variabler er årsakssammenhengende.

Hvordan bruke CORREL

Bruk Excel CORREL -funksjonen slik:

1 = CORREL (B3: B15, C3: C15)

Med CORREL definerer du to argumenter - de to dataområdene du vil korrelere.

Her er noen viktige punkter du må huske på med CORREL:

  • Tekst, boolsk (TRUE/FALSE) og tomme celler ignoreres.
  • Begge dataområder må ha like mange datapunkter, ellers får du en #N/A -feil
  • Hvis et av dataområdene er tomt, hvis det ikke er noen variasjon i det hele tatt i dataene (dvs. hvis alle datapunkter er det samme tallet), får du en #DIV/0! Feil

CORREL -funksjon i Google Sheets

CORREL -funksjonen fungerer nøyaktig det samme i Google Sheets som i Excel:

Ytterligere merknader

CORREL Eksempler i VBA

Du kan også bruke CORREL -funksjonen i VBA. Type:
application.worksheetfunction.correl (array1, array2)
For funksjonsargumentene (array1, etc.) kan du enten skrive dem inn direkte i funksjonen, eller definere variabler som skal brukes i stedet.

Gå tilbake til listen over alle funksjoner i Excel

wave wave wave wave wave