Scipy statistikk skjev

Scipy statistikk skjev
I dagens epoke med nyskapende teknologier har etterspørselen etter programmeringsspråket for høy ytelse økt. Python viser seg å være den beste av alle programmeringsspråk, da det har mye å gi for de enkle og nybegynnervennlige funksjonene fra listen over bibliotekpakkene for implementeringen og utførelsen av programvarene. Python er det beste programmeringsverktøyet for analyse av store og store datasett, for beregningsformål og objektorienterte strukturer. Python har et bibliotek som heter "Scipy" for å håndtere distribusjonen av Deep Learning -modellene, opplæringen av modellen for maskinlæringsapplikasjoner, de matematiske operasjonene og optimalisatorene.

Scipy -statistikk “skjev” er metoden som brukes til å se etter asymmetrien i fordelingen av variablene i datasettet. Skewness definerer hvordan variabelen er distribuert i topp.

Fremgangsmåte

Prosedyren til artikkelen vil bestå av sekvensielle trinn. Så for det første vil syntaks bli forklart for Scipy Stat Skew -funksjonen. Deretter vises utførelsesprosessen for denne funksjonen i Python -koden i artikkelen. Til slutt vil vi avslutte artikkelen ved å diskutere resultatene av implementeringen av funksjonen. Alle programmene vil bli skrevet på nettplattformen for Python I.e. “Google Collab”. For å komme i gang med denne plattformen, må vi navigere til nettadressen https: // colab.forskning.Google.com/.

Syntaks

Funksjonen "$ scipy.statistikk.Skew (Array, Axis = 0, Bias = True)”Brukes til å beregne skjevheten for den tilfeldige variabelen i et datasett

Parameteren “Array” i argumentlisten over statistikk -skews -funksjonen erstattes med en hvilken som helst input -matrise eller datasettet hvis skjevhet vi ønsker å bestemme. "Axis" er den aksen der eller langs hvilken skjevhet skal beregnes og standardverdien er "0". Skjevheten er alltid satt til boolsk type "sann" som dens statistiske verdi.

Returverdi

Funksjonen vil returnere en verdi som vil gi oss beskjed om distribusjonen er positivt, negativt eller null skjev i henhold til normalfordelingen.

Eksempel nr. 01

Skewness er tiltaket for å analysere asymmetrien i distribusjonen av dataene. La oss bare utforske denne funksjonen og utføre et praktisk eksempel på denne funksjonen ved å anta og deretter definere noen hypotetiske data og deretter distribuere den for å sjekke for dens skjevhet. For å initialisere eksemplet, omdirigere til Google Collab og lage en ny notisbok der for å skrive et Python -program om det for eksemplet. For å importere bibliotekene som vil bli brukt til å bruke attributtet eller modulen “Stats skew ()”, vil vi skrive den aller første linjen i Python -skriptet som “fra Scipy. Statistikk importerer skjevheten ”og for å opprette array-importen“ Numpy ”-biblioteket siden dette biblioteket jobber med det flerdimensjonale matrisen og dets operasjoner.

Så importer "Numpy som prefiks NP". Det siste biblioteket som importerer vil være "pylab", og så får vi tilgang til pylab som "PLT" for å plotte distribusjonen langs en eller annen akse for å identifisere skeivheten i den distribusjonen visuelt i den distribusjonen. Nå vil vi lage en todimensjonal matrise og deretter beregne skjevheten for matrisen basert på aksen siden 2D-arrayen har to akser totalt. Den ene er satt til standard som "null" og den andres verdi vi må definere som "1", ". Så vi vil først beregne skjevheten for 2D -array med aksen satt til null og deretter til at vi vil sette aksen til "1" for å beregne skjevheten for den aksen. Definer en 2D-array med Numpys “NP. Array ([]) ”-metode og passere elementene som“ ([3, 4, 6, 8, 9], [1, 2, 5, 7,4], [9, 10, 4, 5, 6]) ”, Lagre verdien av denne matrisen i variabelen som“ Array_Skew ”. Deretter, fra statistikkmodulen, ring funksjonen skew () og gi array -navnet som "array_skew" i argumentene til skjevfunksjonen. Aksverdien i en slik samtale er standard satt til verdien “null” og sjekk for resultatene.

Vi kan igjen bruke den samme matrisen og sende den til skew () -funksjonen, men denne gangen med Axis -parameteren satt til å verdsette “1” og atskilt med komma i argumentlisten over skew () -funksjonen. Koden og utgangen for dette programmet er gitt nedenfor.

Funksjonen vil beregne for den første samtalen til skjevfunksjonen Noen verdier av skjevheten langs Axis “0”, og den andre funksjonsanropet til skjevmetoden vil returnere verdien av skjevheten for hele matrisen langs Axis “1”.

Eksempel # 02

De forrige eksadataene returnerte bare de skjeve verdiene for matrisen, men ved hjelp av dette eksemplet vil vi plotte distribusjonen og vil deretter visuelt identifisere skjevheten i distribusjonen av dataene. Importere “fra scipy. Statistikk Skew -modulen ”,“ NP ”danner numpy for å definere matrisen, og“ Pylab som PLT ”for å plotte distribusjonen på de to aksene.

Etter importen av disse bibliotekene vil vi definere Axis “0” som matrisen med verdien “NP. Linspace (-4, 8.5, 1000) ”. Deretter vil vi definere en annen akse som "Axis1" og vil gi verdien av Axis0 til aksen 1 som "1./(NP. SQRT (2.*NP.pi)) * np. exp ( -.4*(Axis0) ** 2) ”. Nå vil vi bruke både disse aksene og ved hjelp av Pylabs PLT -modul, vil vi plotte resultatene av skjevhet ved å sende Axis1 og Axis0 til argumentlisten over plottfunksjonen som “PLT. plot (Axis0, Axis1,*) ”og viser deretter resultatene som en" trykk ("skew_value:", skew (axis1)) ". Verdien for skjevfunksjonen returneres som et positivt tall som betyr at distribusjonen er positivt skjev.

Konklusjon

Implementeringen av “scipy .Stats skew () ”vises i artikkelen. Artikkelen forklarer begrepet skjevhet ved å gi en introduksjon om rollen som skjevhet i distribusjonen av dataene. Deretter forklarer det syntaksen for det i Python -skriptet og demonstrerer to eksempler for å la leserne grundig ta tak i begrepet emnet.