Numpy Corcoef

Numpy Corcoef

“Den numpy pakken fra Python tilbyr en funksjon som heter“ Corcoef ”; Denne funksjonen brukes når vi må beregne korrelasjonskoeffisientene for “Pearson Product-Moment”. Korrelasjonskoeffisientene som vi beregnet for Pearson produkt-øyeblikk-snakk om omfanget av korrelasjonen mellom de to variablene. Disse korrelasjonskoeffisientene beregnes ofte når de to grafene er plottet på det spredte plottet, og vi forventer at forholdet mellom disse variablene er mer tilbøyelig til det lineære forholdet, så ved å bruke korrelasjonskoeffisienten, estimerer vi den lineære tilknytningen mellom variablene og Disse korrelasjonskoeffisientene er representert som “R”.

Numpy er kjent for å være det mest gjenkjennelige biblioteket fra Python, og alle operasjoner (matematisk og algebraisk) kan brukes på ND-arrays ved hjelp av funksjonene som denne bibliotekpakken tilbyr.”

Fremgangsmåte

Denne artikkelen vil vise metoden for å estimere korrelasjonen mellom de to variablene ved å bruke funksjonen Numpy Corcoef (). Vi lærer metoden for å skrive programmet i Python -skriptet for denne funksjonen ved å praktisk talt kjøre programmet på Python -kompilatoren for forskjellige eksempler.

Syntaks

Funksjonene vil ta variablene eller matriser, og korrelasjonene mellom disse matriser vil deretter beregnes av funksjonen og vil bli returnert som funksjonsutgangen.

numpy. corrcoef (x, y = ingen, rowvar = true, skjevhet =, ddof =, dtype)


“X” og “y” er matriser som vi må spesifisere for å beregne korrelasjonskoeffisientene til variabelen. “Row VAR” er en valgfri parameter; Hvis verdien er satt til True, som også er standardverdien, vurderer funksjonen at hver rad er en variabel ellers for tilfelle av falsk hver kolonne representerer en variabel. “DType” er datatypen som standard er “Float” for utdataene, og de andre to parametrene “skjevhet” og “DDOF” er enten valgfrie eller ikke blir vurdert, så vi ikke gidder å bruke dem.

Returverdi

Returverdien for Numpy Corrcoef () -metoden vil være korrelasjonskoeffisientene som vil avdekke korrelasjonen mellom variablene.

Eksempel nr. 01

Når vi jobber med statistikk og datavitenskap, blir vi kjent med at disse to feltene er mer opptatt av å kjenne forholdet mellom variablene i datasettet. Hvert datapunkt i et datasett er observasjonen, og egenskapene til hver observasjon er representert som en funksjon, og disse funksjonene er variablene i datasettet. Og hvilket datasett vi bruker avtaler med funksjonen eller variablene og observasjonene.

For å forstå sammenhengen mellom funksjonene, tenk på et eksempel på "hvordan nøyaktigheten i å skyte basketball til målet fra spilleren påvirkes av spillerens høyde". Vi har nå lært hva funksjonen er og hvor mye det er viktig å vite om korrelasjonen deres. Så med det, la oss utforske denne Corrcoef () -funksjonen ved å implementere den på ND-arrays for å finne sammenhengen mellom funksjonene i matriser. Programvaren som vi skal bruke til å implementere eksemplet er “Spyder”, som har installert bibliotekpakker i det.

Vi begynner med å skrive programmet og vil importere Numpy -modulen fra Numpy Library; Dette er obligatorisk å jobbe med ND-arrays. Vi vil gå videre til neste trinn og vil lage to matriser (en-dimensjonal) ved å ringe “NP. Array () ”-metode og vil navngi arraysene“ Arr_1 ”og“ Arr_2 ”. Vi kan initialisere matriser med tilfeldige elementer, så for eksemplet vil vi spesifisere dem som "[3, 6, 9]" for ARR_1 og "[4, 7, 8]" for ARR_2. Nå vil vi vite om sammenhengen mellom disse to matriser, så vi vil videresende disse matriser til inngangsargumentet til funksjonen “NP. corrcoef (arr_1, arr_2) ”og deretter vist resultatene fra denne funksjonen. Koden for dette eksemplet blir skrevet om på programmeringsspråket “Python” som følger:



Funksjonen returnerte en 2D-array av korrelasjonskoeffisientene med standard datatype “Float”. Med disse korrelasjonskoeffisientene kan vi nå estimere lineariteten i forholdet mellom to eller til og med mer enn to variabler. For dette eksemplet, hvis vi observerer 2D-matrixen, er de øvre diagonale verdiene “1” dette er fordi disse verdiene er korrelasjonen mellom ARR_1 og ARR_1 og ARR_2 med ARR_2, mens de nedre til venstre og øvre høyre verdier er de Korrelasjon mellom ARR_1 og ARR_2 og de er samme og har verdien “0.96 ”, og dette representerer Pearson produkt-øyeblikk korrelasjonskoeffisienter.

Eksempel # 02

Dette eksemplet vil ta corrCoef () for de to-dimensjonale matriser, og vi vil definere disse to matriser etter metoden “NP. Array () ”. Elementene for begge disse matriser vil være “([3, 6, 9], [4, 7, 8])” og “([6, 3, 8], [2, 5, 12])”, henholdsvis. Vi vil navngi disse to 2D-arrays “ARR_1” og “ARR_2”, og så vil vi sende disse matriser til Numpy Corrcoef () -metoden og lagre resultatene fra denne funksjonen og vil vise dem ved hjelp av metodeutskriften (). Koden for dette eksemplet vises på figuren som er vedlagt nedenfor. Vi kopierer den koden og får den til å kjøre på kompilatoren "Spyder".



Utgangen har vist den firedimensjonale matrisen med korrelasjonskoeffisientene som elementer med datatypen float. Disse koeffisientene representerer forholdet mellom de 2-dimensjonale matriser som vi hadde erklært i eksemplet. Fra artikkelen, observer at den øvre diagonalen har samme verdi på 1, som viser at de er korrelasjonskoeffisientene for de samme variablene, og verdiene andre steder varierer; Dette er fordi disse verdiene viser sammenhengen mellom de forskjellige variablene.

Konklusjon

Denne guiden dekker korrelasjonskoeffisientfunksjonen for “Pearson Product-Moment”. Vi har demonstrert i artikkelen hvordan vi kan bruke denne funksjonen på den endimensjonale og flerdimensjonale matriser og i hvilken form funksjonen vil returnere utgangen for ND-arrays. Vi har videre analysert utgangene fra funksjonen for de to forskjellige eksemplene.