Scipy Zscore

Scipy Zscore
Når du vil utføre noen statistisk beregning i Python, er det første biblioteket du refererer til Scipy. Python -programmeringsspråk har flere verdifulle biblioteker som du kan bruke i enhver situasjon etter ditt behov. Scipy er imidlertid et av de vanligste bibliotekene du kan henvende deg til for hvert problem. Du kan utføre enhver form for statistisk beregning, vitenskapelig arbeid, matematisk beregning osv. med scipy. I denne artikkelen vil du se en av de statistiske metodene levert av Scipy, som er Zscore. Vi tar sikte på å utforske og forstå Zscore -funksjonen levert av Scipy -biblioteket i denne artikkelen ved hjelp av eksempler. La oss starte!

Hva er Zscore?

I statistikk er Z-poengsum forskjellen mellom middel- og standardavviket. Du tar et poeng fra dataene dine, trekker gjennomsnittet fra det og deler dem deretter med standardavviket. Med andre ord, zscore er målet for spredning av dataene, så den forteller hvor mange verdier gjennomsnittet av dataene er borte fra standardavviket for dataene. Den negative zscore viser at standardavviket er under gjennomsnittet, 0 zscore viser at middel- og standardavviket er det samme, og den positive zscore viser at standardavviket er over gjennomsnittet.

Hva er scipy zscore?

Zscore er en metode som er gitt i Scipy Library of Python. Det brukes til å beregne Zscore automatisk på Python -programmeringsspråket. Alt du trenger å gjøre er å gi dataene dine og la Zscore -funksjonen gjøre arbeidet. Syntaksen til Zscore -funksjonen er gitt i følgende illustrasjon for din forståelse:

Zscore tar en påkrevd og to valgfrie parametere. Array -parameteren representerer input -matrisen eller objektdataene, og den må gis siden Zscore skal beregnes. Aksenparameteren er aksen som middelet skal beregnes. Det er en valgfri parameter, så hvis du ikke eksplisitt nevner den, bruker Zscore -funksjonen standardverdien på 0. DOF -parameteren er en annen valgfri parameter som representerer graden av frihet som brukes til å korrigere standardavviket. Zscore -funksjonen returnerer zscore for de gitte dataene. La oss nå lære ved hjelp av eksempler på hvordan du beregner Zscore i et Python -program. Tenk på følgende eksempler.

Eksempel 1:

Som diskutert tidligere, finner Zscore forskjellen mellom middel- og standardavviket. Så vi må ha en liste over data først vi trenger å beregne Zscore. Dette eksemplet forklarer trinnvis prosess for hvordan du beregner zscore for de oppgitte dataene. Vurder prøvekoden gitt i følgende kodebit:

Importer numpy som NP
fra scipy importstatistikk
Array1 = [5, 10, 15, 20, 25]
Array2 = [2, 4, 6, 8, 10]
Print ("\ Narray 1 inneholder:", Array1)
Print ("\ Narray 2 inneholder:", Array2)
Print ("\ Narray 1 Z-Score: \ n", Statistikk.Zscore (Array1))
Print ("\ Narray 2 Z-Score: \ n", Statistikk.zscore (array2))

Når vi trenger å bruke en funksjon eller metode fra et bestemt bibliotek, må vi importere biblioteket til programmet før vi bruker noen av dets funksjoner for å unngå feil. Så som du kan legge merke til, importerer vi først Numpy -biblioteket som NP og Scipy -biblioteket for å importere statistikkpakken. Etter å ha importert de nødvendige bibliotekene, gir vi to matriser med forskjellige data slik at vi kan se de forskjellige resultatene fra Zscore -funksjonen. Begge matriser vises på skjermen ved hjelp av PRINT () -kommandoen. Arraysene sendes til Zscore -funksjonen for å beregne Zscore. Og PRINT () -kommandoen brukes igjen for å vise resultatet. La oss nå se følgende resultat:

Eksempel 2:

Som vi lærte om syntaksen til Zscore -funksjonen, vet vi at den tar en valgfri parameteraks som er 0 som standard. I dette eksemplet gir vi eksplisitt akseverdien 1 til å utforske og forstå hvordan Zscore -funksjonen endrer beregningen. Tenk på følgende prøvekode:

Importer numpy som NP
fra scipy importstatistikk
Array1 = [[5, 10, 15, 20, 25], [4, 8, 2, 6, 10]]
Array2 = [[2, 4, 6, 8, 10], [1, 2, 5, 3, 9]]
Print ("\ Narray 1 inneholder:", Array1)
Print ("\ Narray 2 inneholder:", Array2)
PRINT ("\ Narray 1 Z-Score langs Axis 1: \ n", statistikk.Zscore (Array1, Axis = 1))
PRINT ("\ Narray 2 Z-Score langs Axis 1: \ n", statistikk.Zscore (Array2, Axis = 1))

Igjen importeres Numpy og Scipy -bibliotekene når vi trenger dem til å bruke statistikkpakken og Numpy -matrisen sammen med Zscore -funksjonen. Som du kan legge merke til, ga vi to todimensjonale matriser. Axis-parameteren kan brukes med flerdimensjonale matriser, så vi brukte todimensjonale matriser i dette eksemplet. Aksen = 1 indikerer at den beregnede zscore for hvert datapunkt i matriser er relativt til matrisen som de er i. Hvis du sammenligner resultatet av begge matriser med resultatet som er beregnet i forrige eksempel, kan du merke at resultatet av den første dimensjonen er det samme siden dataene er de samme og aksen = 1. La oss nå se følgende resultat:

Eksempel 3:

I de foregående eksemplene brukte vi de enkle array -dataene og definerte spesifikt dataene i matriser. Vi kan også definere en DataFrame for Zscore -funksjonen for å beregne zscore av dataene i DataFrame. I dette eksemplet vil vi forklare hvordan vi skal erklære en dataaframe og deretter sende den til Zscore -funksjonen for å beregne zscore for de gitte dataene. Tenk på følgende prøveeksempel for din forståelse:

Importer pandaer som PD
fra scipy importstatistikk
Data = PD.DataFrame (NP.tilfeldig.Randint (1, 10,
størrelse = (3, 3)), kolonner = ['x', 'y', 'z'])
data.Bruk (statistikk.zscore)

Pandas -biblioteket importeres til programmet som PD siden DataFrame () -funksjonen er levert av Pandas Library. Scipy -biblioteket importeres som vanlig når vi bruker Zscore -funksjonen. DataFrame () er erklært med tilfeldige verdier ved bruk av tilfeldige.randint () funksjon. Størrelsen på DataFrame er gitt 3 x 3 som betyr 3 rader og 3 kolonner. Navnene for hver kolonne er “X”, “Y” og “Z”. DataFrame () sendes til Zscore -funksjonen for å beregne zscore for hvert datapunkt. Se følgende resultat:

Konklusjon

Denne artikkelen er en rask oversikt over Zscore -funksjonen levert av Scipy Library. I Python er Zscore en funksjon levert av Scipy -biblioteket som brukes til å beregne zscore av de gitte dataene automatisk. Denne guiden ga noen eksempler for å forklare hvordan du bruker Zscore -funksjonen i et Python -program.