Pandas standardavvik

Martin Berge

"" Pandaene "er et flott språk for å utføre analysen av data på grunn av det store økosystemet av datasentriske Python-pakker. Det gjør analysen og importen av begge faktorene enklere. Standardavviket er et "typisk" avvik hentet fra gjennomsnittet. Det brukes mye, da den returnerer de originale enhetene for å måle DataFrame. Pandaene brukte std () for beregning av standardavviket. Standardavviket kan beregnes ut fra de gitte verdiene som kan være i DataFrame i form av en rad eller kolonne. Vi vil implementere alle mulige måter Pandas Standard Deviation brukes på. For implementering av koden vil vi bruke verktøyet "Spyder" som det er skrevet i et pytonvennlig miljø.”

Syntaks

“DF.std () ”

Følgende syntaks brukes til å beregne standardavviket i DataFrame. "DF" i DataFrame er forkortelsen av "DataFrame". Hva gjør standardavviket? Den måler hvor utvidet de nødvendige dataene er. Jo mer utvidede høye verdier, jo høyere skal standardavviket skje.

Komme tilbake

Pandas standardavvik returnerer DataFrame hvis nivået er spesifisert basert på kravet.

Merk at funksjonen “STD ()” automatisk vil ignorere “NAN” -verdiene i “DF” mens du beregner Pandas standardavvik. "Nan" kan forklares som "ikke et tall", noe som betyr at det ikke er noen verdi tilordnet et bestemt.

Følgende er metodene som vil bli utført med eksempler på Pandas standardavvik:

- Pandas standardavvikberegning i en enkelt kolonne.
- Pandas standardavvikberegning i flere kolonner.
- Pandas standardavvikberegning av alle numeriske kolonner.
- Pandas standardavvik ved bruk av aksen = 1.
- Pandas standardavvik ved bruk av aksen = 0.

Opprette DataFrame for beregning av standardavvik i pandaer

Åpne først "Spyder" -programvaren. Importer nå Pandas -biblioteket som PD. Vi vil lage et dataaframe som består av en resultattavle som har begrep som "x", "y" og "z" med poengene sine som "22", "10", "11", "16", "12", "45 ”,“ 36 ”, og“ 40 ”. Vi har deres assists verdier som "8", "9", "13", "7", "22", "24", "4" og "6", og har også verdien av returer som "17", " 14 ”,“ 3 ”, 5”, “9”, “8”, “7” og “4”.

Displayene viser den opprettede DataFrame i henhold til verdiene som er tilordnet i koden:

Eksempel # 01: Pandas standardavvikberegning i en enkelt kolonne

I dette eksemplet vil vi beregne standardavviket til en enkelt kolonne i Pandas dataaframe. Dataframe har verdiene til teamet som “U”, “V” og “B” med poengene sine som “44”, “33”, “22”, “44”, “45”, “88”, “96 ”Og“ 78 ”. Verdiene av assists er som “7”, ”8”, “9”, “10”, “11”, “14”, “18” og “17” som også har verdiene på returer som “11”, ” 9 ”,“ 8 ”,“ 7 ”,“ 6 ”,“ 5 ”,“ 4 ”og“ 3 ”. Kolonnen "Poeng" er valgt fra DataFrame for å beregne standardavviket for enkeltkolonner.

Utgangen viser standardavviket beregnet for kolonnen “Poeng”:

Eksempel # 02: Pandas standardavvikberegning i flere kolonner

I dette eksemplet vil vi utføre Pandas standardavvikberegninger i flere kolonner. I denne DataFrame er dataene igjen av sportsresultatene som har verdiene til teamet som "N", "W" og "T" med poengsummen som "33", "22", "66", "55", “44”, “88”, “99” og “77”. Hjelpene som “9”, “7”, “8”, “11”, “16”, “14”, “12” og “13” og rebounds som “5”, “8”, “1”, ” 2 ”,“ 3 ”,“ 4 ”,“ 6 ”og“ 7 ”. Her vil vi beregne standardavviket for de to kolonnene “Points” og “Rebounds” ved å bruke funksjonen STD () brukt på DataFrame.

Som vi ser, viser utgangen at standardavviket kom opp som 26.944387 i punktens kolonne og 2.449490 i henholdsvis rebound -kolonnen.

Eksempel # 03: Pandas standardavvikberegning av alle numeriske kolonner

Nå har vi lært hvordan vi beregner standardavviket for enkelt- og flere rader. Hva om vi ikke vil spesifisere alle kolonnenavnene i DataFrame og beregne hele DataFrame? Dette er mulig med bare en enkel funksjonsimplementering av Pandas standardavvik for beregning av hele DataFrame helt i resultatene. Dataframe her består av “L”, “M” og “O” med scoringsverdiene “33”, “36”, “79”, “78”, “58”, “55” og to lag scorer det samme det er "25". Hjelpene er som “1”, “2”, “3”, “4”, “6”, “9”, “5” og “7” og deres returer som “14”, “10”, “2” , “5”, “8”, “3”, “6” og “9”. Vi kan beregne alle standard kolonneavvikene med pandaer i DataFrame ved å bruke Pandas “STD ()” -funksjonen.

Displayet har det beregnede standardavviket for hele "DF" vist nedenfor; Vi kan også merke at pandaene ikke har beregnet standardavviket til den første kolonnen, som er "team", fordi det ikke er en numerisk kolonne.

Eksempel # 04: Pandas standardavvik ved hjelp av aksen = 0

I dette eksemplet har Dataframes lagene i idretten som "G", "H" og "K" med ytterligere data. Her vil vi beregne standardavviket ved å bruke aksen som "0", en parameter som brukes i Pandas standardavvik. Dette argumentet beregner standardavvikskolonnen til DataFrame.

Følgende utgang viser resultatene i kolonner i standardavviket beregnet. Poengkolonnen har det beregnede standardavviket som “24.0313062 ”, assist -kolonnen har det beregnede standardavviket som“ 2.669270 ”og rebound -kolonnens beregnede standardavvik vises som“ 3.943802 ”.

Eksempel # 05: Pandas standardavvik ved hjelp av aksen = 1

Her vil vi bruke Axis -parameteren tildelt som “1” for å beregne standardavviket i pandaer. Hvilken forskjell kan akse “1” gjøre? Argumentet “1” Axis beregner det radmessig standardavvik for de numeriske verdiene i DataFrame. Dataframe har de tre lagene som “S”, “D” og “E”, med tillegg av datakolonner opprettet som poeng for teamet, assists av teamet og returene til teamet. Veibeskrivelse alle er tildelt med forskjellige verdier i dataaframe. Denne akseparameteren er en slik spillveksler som vi må jobbe med dataene der vi ønsker at den skal være i et kolonne pluss punkt beregnet for utført standardavvik.

Følgende utgang viser standardavviket beregnet på en rad i dataaframet:

Konklusjon

Pandas standardavvik er en veldig teknisk funksjon, som er en veldig gunstig funksjon da den finner standardavviket for entusiasmepakten til Pandas dataframes. I denne redaksjonen har vi studert metodene for å beregne standardavviket i pandaer. Vi har gjort beregninger av enkeltkolonner av standardavvik og flere kolonner og beregnet også standardavviket for hele DataFrame sammen. Alle strategiene fungerer godt så lenge de brukes konsekvent og med de ønskede resultatene.

Python

Python OS Mkdir

“OS.mkdir () ”-metode for“ OS ”-modulen brukes til å lage en enkelt katalog, flere kataloger og nest...

Daniel Johnsen

Python

Python Ikke alle argumenter som er konvertert under strengformatering

Denne feilen kan fikses ved å korrigere syntaksen til % operatøren, ved å bruke format () -funksjone...

Simen Ødegård

Docker

Hva er forskjellen mellom Docker og Podman?

Docker bruker en klient-serverarkitektur, mens Podman er en demon mindre containermotor. Podman er s...

Daniel Johnsen