For eksempel vil statistisk testing og datavisualisering være mulighetene til å bruke standardavvik. Denne artikkelen inneholder demonstrasjoner for hver metode brukere kan bruke for å bestemme standardavviket til et sett med data i Python.
Eksempel nr. 1:
For å beregne standardavviket, vil vi enten lage en metode eller bruke forhåndsbygde pandaer eller numpy teknikker. La oss lage en naturlig Python -versjon av å bestemme standardavvik uten å importere noen eksterne rammer.
I begynnelsen av programmet vil vi definere funksjonen til standardavvik. Vi gir parameteren til listen innen denne funksjonen. I neste trinn finner vi lengden på den nødvendige listen ved å bruke Len () -metoden. Lengden på listen blir lagret i en variabel 'A'. Nå finner vi gjennomsnittet av den nødvendige listen. For å bestemme gjennomsnittet av listen, må vi først skaffe summen av listen, og deretter vil den beregnede summen bli delt på lengden på listen. Gjennomsnittet av listen vil nå bli lagret i variabelen 'M'. La oss finne variansen på den definerte listen.
Her bruker vi formler av variansen. Vi har ansatt 'for' -løkken innenfor variansformlene. Videre vil vi bruke formlene for å finne standardavviket. Variansen vil bli multiplisert med 1.5. Ved å gjøre det returnerer dette standardavviket for den spesifiserte listen. Vi erklærer en variabel 'liste'.
Her setter vi forskjellige tilfeldige verdier. For å skildre standardavviket for listen, har vi brukt get_s_dev () -metoden. Denne funksjonen inneholder listen som parametere.
I denne illustrasjonen konstruerte vi en metode som returnerer standardavvik for et sett med heltall. Du vil se at vi beregnet summen for gjennomsnitt og varians ved hjelp av Python -språkets innebygde sum () -metode. Denne metoden brukes til å beregne summeringen av den definerte sekvensen.
Det er flere måter bortsett fra den som er nevnt ovenfor for å bestemme standardavviket til et sett med data. Vi kan bruke de grunnleggende en-linjeløsningene for å beregne standardavvik ved å bruke modulene og lagre dataene som en numpy matrise eller et Pandas-rammeverk.
Eksempel nr. 2:
Standardavviket kan bestemmes øyeblikkelig ved å lagre settet med elementer som en numpy matrise og bruke Numpy Ndarray STD () -metoden. La oss se på en forekomst.
Først vil vi innlemme biblioteket 'Numpy' som NP. Videre definerer vi elementer i datasettet. Disse elementene lagres i en variabel 'liste'. Neste, vi kaller array () -metoden til Numpy -modulen. Denne metoden inneholder listen over elementer som argument. I det siste trinnet i koden vil metoden Print () bli påberopt for å vise standardavviket for listen.
Eksempel nr. 3:
Datasettet kan alternativt lagres som en pandaspakke som vi senere kan beregne standardavviket ved å bruke metode STD (). Denne metoden er sannsynligvis sammenlignbar med Numpy Array -tilnærmingen. Mange Pandas -funksjoner er containere for numpy funksjoner. La oss i dette øyeblikket bruke Pandas -modulen til å beregne settet med elements standardavvik.
Her må vi importere den nødvendige headerfilen 'Pandas' som PD. Vi spesifiserer datasettets komponenter i en form for en liste. Disse verdiene lagres i variabelen “l.”Pandas 'modulens metodeserie () ville da bli påkalt. Parameteren for denne metoden er det settet med elementer. Listeverdier vil bli konstruert i en Pandas -pakke. Print () -funksjonen kan brukes i den endelige kodelinjen for å vise listens standardavvik. Vi kaller STD () -metoden for å bestemme listens standardavvik.
Eksempel nr. 4:
I dette eksemplet vil vi bestemme standardavviket for datasett med forskjellige datatyper.
Vi kommer til å integrere Stdev -biblioteket fra statistikkmodulen og brøkdelen som 'FR' fra fraksjonsrammen. Nå vil vi lage fire forskjellige datasett med forskjellige datatyper. Elementene i det første datasettet vil bli lagret i en variabel 'set_1'. Dette settet inneholder alle positive tall. Det andre datasettet vil bli lagret i en variabel 'set_2'. Dette settet består av alle negative verdier. Deretter erklærer vi en variabel 'set_3'.
Her definerer vi elementene i det tredje datasettet. Denne listen har en blanding av positive og negative verdier. For å lagre verdiene til det siste datasettet, vil vi initialisere en variabel 'set_4'. Dette settet har alle flytende punktverdier. La oss skrive ut standardavviket for disse datasettene. For å oppnå dette, må vi bruke funksjonsutskriften () for alle datasettene henholdsvis. Standardavviket for alle settene vil bli beregnet ved å bruke metoden STDEV ().
Konklusjon
I denne artikkelen så vi på forskjellige metoder for å beregne standardavviket. I den første illustrasjonen har vi beregnet datasettets standardavvik ved å beregne summen og variansen. For å oppnå standardavviket for den forhåndsdefinerte listen over elementer, bruker vi pandaene og numpy modulene i de to neste tilfellene. I den siste demonstrasjonen oppnår vi standardavviket for sett med forskjellige datatyper.