Scipy Stats Pearsonr

Scipy Stats Pearsonr
Denne artikkelen handler om Scipy.statistikk.Pearsonr funksjon brukt i Python. Scipy er som en skattekasse i Python, hvor du enkelt kan finne alle funksjoner for å løse problemer. Scipy er en lett pakke med Python. Scipy står for vitenskapelig Python, som er full av viktige verktøy for optimalisering, bildebehandling, signalbehandling, statistiske beregninger osv. Nedenfor vil vi diskutere Scipy.statistikk.Pearsonr Ved hjelp av forskjellige eksempler for bedre forståelse.

Hva er Scipy Stats Pearsonr på Python -språk?

Scipy.statistikk er en pakke med Scipy-bibliotekene som brukes til statistisk problemløsing i Python-applikasjoner. Scipy.statistikk inneholder flere funksjoner, hvorav den ene er Pearsonr, som brukes til å beregne det lineære korrelasjonsforholdet mellom to matriser med tall. Returverdien til Pearsonr Koeffisient er i området [-1,1]. En verdi på 0 er ikke korrelert og verdier nærmere -1 eller 1 viser negativ og positiv korrelasjon av matriser.

Syntaks av Scipy Stats Pearsonr

Syntaksen til scipy.statistikk.Pearsonr -funksjonen er gitt nedenfor:

Scipy.statistikk.Pearsonr (x, y, [alternativ = 'tosidig'])

La oss forklare parametrene til funksjonen. X og y er matrise-lignende innganger som skal måles for korrelasjon. Den tredje valgfrie parameteren er standard for 'tosidig', men kan også ha denne listen over mulige verdier: ['tosidig', 'større', 'mindre'].

Returverdien inneholder to flytende punkttall, den første avkastningsverdien 'Statistikken' indikerer den negative, positive korrelasjonen med et tall fra -1 til 1, med 0 som betyr ingen korrelasjon. Det andre flytende punktet representerer p-verdi for denne beregningen.

Nedenfor er noen eksempler på Pearsonr For å demonstrere dets arbeid:

Eksempel 1

Det første eksemplet på Scipy.statistikk.Pearsonr er veldig enkelt og enkelt. Som vi vet, Scipy.statistikk.Pearsonr brukes til å finne det lineære forholdet mellom to forskjellige datasett.

Importer scipy.statistikk
fra scipy importstatistikk
Fra scipy.Statistikk importerer Pearsonr
Importer numpy som NP
y = [1,3,5,7,9,11]
G = [10,15,20,25,30,35]
Resultat = Scipy.statistikk.Pearsonr (y, g)
trykk ('Utgang er:', resultat)

Først importerte vi Scipy -biblioteket med statistikk.Pearsonr Funksjon, sammen med Numpy Library for Array Handling. Vi initialiserte to matriser eller datasett som vi implementerte funksjonen. I neste linje kaller vi funksjonen Scipy.statistikk.Pearsonr og passere matriser til funksjonen, som returnerer verdier til en variabel kalt 'resultat'. Endelig passerer vi "Resultat" -variabelen i en utskriftserklæring. Etter å ha kjørt programmet i Python -miljøet, vises følgende utgang på konsollskjermen:

linuxhint@u22: ~ $ python ex1.py
Utgang er: PearsonRresult (Statistic = 0.99999999999999999, pvalue = 1.8488927466117464E-32)
linuxhint@u22: ~ $

Denne utgangen viser det lineære forholdet mellom to matriser, y og g. Denne funksjonen returnerer to verdier i flottøren; Den første er en statistikkverdi lik 0.99999999, og den andre er en pvalue lik 1.84889… E-32

Eksempel 2

Tidligere så vi et enkelt eksempel på Pearson -funksjonen. Her vil vi diskutere hvordan du finner Pearsons R -koeffisient i Python. Gå gjennom følgende referansekode for mer avklaring:

Importer scipy.statistikk
fra scipy importstatistikk
Fra scipy.Statistikk importerer Pearsonr
Importer numpy som NP
arra = np.Array ([1,1,6,6,0,0])
arrb = np.Array ([0,1,2,5,4,0])
find_coefficient = scipy.statistikk.Pearsonr (Arra, Arrb)
Print ('Koeffisienten er:', find_coefficient)

I dette eksemplet importerte vi statistikkmodulen fra Scipy -biblioteket, og sammen med den, Pearsonr -funksjonen. Vi importerte Numpy -biblioteket til programmet på grunn av det involverte matrisen. I den følgende linjen opprettet vi to Numpy -matriser som en del av et datasett kalt 'Arra' og 'Arrb'. Etter dette kalte vi krydret.statistikk.Pearsonr funksjon, som tar numpy matriser som argumenter og returnerer verdien som er koeffisienten til to datasett. Denne koeffisienten lagres i variabelen 'Find_coefficient'.

Til slutt viser vi utdataene på konsollen ved å bruke en utskriftsuttalelse. Husk at hvis verdien av koeffisienten er omtrent lik -1, betyr det at koeffisienten er svært negativ. Hvis verdien er omtrent lik 1, er koeffisienten svært positiv. Utgangen fra programmet er gitt nedenfor:

linuxhint@u22: ~ $ python ex2.py
Koeffisienten er: PearsonRresult (Statistic = 0.4974273993210546, pvalue = 0.3153991309564151)
linuxhint@u22: ~ $

Her ser vi at PearsonRresult -verdiene både er positive og flytende tall. Det betyr at koeffisienten til disse to datasettene er svært positiv.

Eksempel 3

Nå tar vi et annet eksempel relatert til Scipy.statistikk.Pearsonr funksjon, der vi vil diskutere å finne koeffisienten til to forskjellige datasett ved indeks 0. Referansekoden for dette programmet er nevnt nedenfor:

Importer scipy.statistikk
fra scipy importstatistikk
Fra scipy.Statistikk importerer Pearsonr
Importer numpy som NP
k = np.Array ([12,18,16,26,10,21])
m = np.Array ([9,2,7,4,9,0])
Q = Scipy.statistikk.Pearsonr (k, m) [0]
trykk ('Statistikkverdien er:', q)

Som før importerte vi alle relaterte biblioteker som Scipy, Numpy og deres statistikk.Pearsonr -funksjon i programmet fordi vi ikke kan bruke Pearson -funksjonen uten disse bibliotekene. Vi tok to datasett med forskjellige verdier og kalte dem Numpy Library. Vi inkluderte også '[0]' I funksjonen for å finne koeffisienten ved 0 -indeksen. Den returnerte funksjonsverdien lagres i variabelen 'Q'. Nå ønsker vi å vise utdata på konsollskjermen, så vi viser utdata på skjermen ved hjelp av utskriftserklæringen. Etter å ha kjørt programmet med hell, fant vi resultatet på konsollskjermen. Følgende er utdataene fra programmet i en Python -applikasjon:

linuxhint@u22: ~ $ python ex3.py
Statistikkverdien er: -0.7426139036107966
linuxhint@u22: ~ $

Fordi utgangen er negativ, indikerer dette at koeffisienten ved indeksen [0] er ekstremt negativ. Den svært negative verdien av koeffisienten betyr at hvis verdien i ett datasett økes, vil det redusere verdiene til andre datasett.

Konklusjon

La oss raskt oppsummere denne artikkelen, Scipy er biblioteket, og statistikk er en pakke med dette biblioteket med funksjonen Pearsonr pleide å finne det lineære forholdet mellom to forskjellige datasett. Python er et veldig fremvoksende språk som vil hjelpe deg i alle arbeidsfelt. I denne artikkelen diskuterte vi Pearsonr -funksjonen i detalj ved hjelp av de tidligere eksemplene. Pearsonr -funksjonen brukes i Python for å finne. Forhåpentligvis hjalp disse eksemplene deg med å lære om Scipy.statistikk.Pearsonr funksjon, og du kan også implementere modifikasjoner av disse eksemplene i Python -miljøet ditt.