Python Statistics Standard Deviation

Python Statistics Standard Deviation
Spredningen av dataene bestemmes ved å bruke standardavviket, en avgjørende måling. Dette innebærer at dataene er mer sentraliserte når standardavviket er mindre og mer spredt ut når standardavviket er betydelig større. Variansens kvadratrot brukes til å beregne den. Selv om varians og standardavvik er målinger av spredning, vil standardavviket bli brukt oftere på grunn av standardavvikets utnyttelse av nesten de samme tiltakene som dataene.

For eksempel vil statistisk testing og datavisualisering være mulighetene til å bruke standardavvik. Denne artikkelen inneholder demonstrasjoner for hver metode brukere kan bruke for å bestemme standardavviket til et sett med data i Python.

Eksempel nr. 1:
For å beregne standardavviket, vil vi enten lage en metode eller bruke forhåndsbygde pandaer eller numpy teknikker. La oss lage en naturlig Python -versjon av å bestemme standardavvik uten å importere noen eksterne rammer.

def get_std_dev (liste):
a = len (liste)
m = sum (liste) / a
v = sum ((x - m) ** 4 for x i listen) / a
s_dev = v ** 1.5
Returner S_DEV
Liste = [17, 22, 44, 13, 29, 72, 60, 27]
get_s_dev (liste)

I begynnelsen av programmet vil vi definere funksjonen til standardavvik. Vi gir parameteren til listen innen denne funksjonen. I neste trinn finner vi lengden på den nødvendige listen ved å bruke Len () -metoden. Lengden på listen blir lagret i en variabel 'A'. Nå finner vi gjennomsnittet av den nødvendige listen. For å bestemme gjennomsnittet av listen, må vi først skaffe summen av listen, og deretter vil den beregnede summen bli delt på lengden på listen. Gjennomsnittet av listen vil nå bli lagret i variabelen 'M'. La oss finne variansen på den definerte listen.

Her bruker vi formler av variansen. Vi har ansatt 'for' -løkken innenfor variansformlene. Videre vil vi bruke formlene for å finne standardavviket. Variansen vil bli multiplisert med 1.5. Ved å gjøre det returnerer dette standardavviket for den spesifiserte listen. Vi erklærer en variabel 'liste'.

Her setter vi forskjellige tilfeldige verdier. For å skildre standardavviket for listen, har vi brukt get_s_dev () -metoden. Denne funksjonen inneholder listen som parametere.

I denne illustrasjonen konstruerte vi en metode som returnerer standardavvik for et sett med heltall. Du vil se at vi beregnet summen for gjennomsnitt og varians ved hjelp av Python -språkets innebygde sum () -metode. Denne metoden brukes til å beregne summeringen av den definerte sekvensen.

Det er flere måter bortsett fra den som er nevnt ovenfor for å bestemme standardavviket til et sett med data. Vi kan bruke de grunnleggende en-linjeløsningene for å beregne standardavvik ved å bruke modulene og lagre dataene som en numpy matrise eller et Pandas-rammeverk.

Eksempel nr. 2:
Standardavviket kan bestemmes øyeblikkelig ved å lagre settet med elementer som en numpy matrise og bruke Numpy Ndarray STD () -metoden. La oss se på en forekomst.

Importer numpy som NP
Liste = [17, 23, 14, 33, 19, 10, 40, 62]
x = np.Array (liste)
trykk (x.std ())

Først vil vi innlemme biblioteket 'Numpy' som NP. Videre definerer vi elementer i datasettet. Disse elementene lagres i en variabel 'liste'. Neste, vi kaller array () -metoden til Numpy -modulen. Denne metoden inneholder listen over elementer som argument. I det siste trinnet i koden vil metoden Print () bli påberopt for å vise standardavviket for listen.

Eksempel nr. 3:
Datasettet kan alternativt lagres som en pandaspakke som vi senere kan beregne standardavviket ved å bruke metode STD (). Denne metoden er sannsynligvis sammenlignbar med Numpy Array -tilnærmingen. Mange Pandas -funksjoner er containere for numpy funksjoner. La oss i dette øyeblikket bruke Pandas -modulen til å beregne settet med elements standardavvik.

Importer pandaer som PD
L = [34, 22, 74, 23, 19, 16, 40, 62]
C = PD.Serie (l)
trykk (c.std ())

Her må vi importere den nødvendige headerfilen 'Pandas' som PD. Vi spesifiserer datasettets komponenter i en form for en liste. Disse verdiene lagres i variabelen “l.”Pandas 'modulens metodeserie () ville da bli påkalt. Parameteren for denne metoden er det settet med elementer. Listeverdier vil bli konstruert i en Pandas -pakke. Print () -funksjonen kan brukes i den endelige kodelinjen for å vise listens standardavvik. Vi kaller STD () -metoden for å bestemme listens standardavvik.

Eksempel nr. 4:
I dette eksemplet vil vi bestemme standardavviket for datasett med forskjellige datatyper.

Fra statistikk importerer Stdev
fra brøkdeler importerer brøkdel som FR
set_1 = (11, 22, 15, 41, 78, 59, 90)
set_2 = (-21, -14, -33, -51, -35, -26)
set_3 = (-59, -71, -20, 12, 15, 33, 74, 69)
set_4 = (5.13, 4.40, 3.31, 8.5, 7.2)
Print ("Det beregnede standardavviket for sett 1: % s"
%(stdev (set_1)))
Print ("Det beregnede standardavviket for sett 2: % s"
%(stdev (set_2)))
Print ("Det beregnede standardavviket for sett 3: % s"
%(stdev (set_3)))
Print ("Det beregnede standardavviket for sett 4: % s"
%(stdev (set_4)))

Vi kommer til å integrere Stdev -biblioteket fra statistikkmodulen og brøkdelen som 'FR' fra fraksjonsrammen. Nå vil vi lage fire forskjellige datasett med forskjellige datatyper. Elementene i det første datasettet vil bli lagret i en variabel 'set_1'. Dette settet inneholder alle positive tall. Det andre datasettet vil bli lagret i en variabel 'set_2'. Dette settet består av alle negative verdier. Deretter erklærer vi en variabel 'set_3'.

Her definerer vi elementene i det tredje datasettet. Denne listen har en blanding av positive og negative verdier. For å lagre verdiene til det siste datasettet, vil vi initialisere en variabel 'set_4'. Dette settet har alle flytende punktverdier. La oss skrive ut standardavviket for disse datasettene. For å oppnå dette, må vi bruke funksjonsutskriften () for alle datasettene henholdsvis. Standardavviket for alle settene vil bli beregnet ved å bruke metoden STDEV ().

Konklusjon

I denne artikkelen så vi på forskjellige metoder for å beregne standardavviket. I den første illustrasjonen har vi beregnet datasettets standardavvik ved å beregne summen og variansen. For å oppnå standardavviket for den forhåndsdefinerte listen over elementer, bruker vi pandaene og numpy modulene i de to neste tilfellene. I den siste demonstrasjonen oppnår vi standardavviket for sett med forskjellige datatyper.