Pandas rullende middel

Pandas rullende middel

“Rolling Window Computation Functionality er gitt av Pandas“ DataFrame.Rulling ().Mean () ”-metode. Gjennomsnittet av et spesifisert antall tidligere intervaller i en tidsserie er kjent som et rullende middel.”

Følgende syntaks kan brukes til å bestemme det rullende gjennomsnittet for enkelt- eller flere kolonner i en Pandas dataaframe:

Vi vil utforske forskjellige teknikker for å bruke denne metoden i denne leksjonen.

Eksempel 1

I denne illustrasjonen vil vi bruke pandaene “DF.Rulling ().Mean () ”-metode for å beregne det rullende gjennomsnittet av en enkelt kolonne.

Vi må først ta tak i kravene til sammenstilling av koden. Vi trenger litt programvare som gir oss et Python -støttet miljø for å kompilere Python -skriptet vårt. Vi har installert "Spyder" -verktøyet i systemet vårt. Etter å ha lansert verktøyet, kan vi få tilgang til grensesnittet.

Fra og med programmet trenger vi først å laste inn det essensielle biblioteket. "Rolling ()" -metoden som artikkelen vår er basert på er Pandas -funksjonen. Så for å bruke denne metoden i programmet vårt, må vi importere “Pandas” -biblioteket og lage “PD” som aliaset for “Pandas”.

Etter at forutsetningen er oppnådd, må vi generere en pandas dataaframe ved å bruke “PD.DataFrame () ”-modul levert av Pandas Toolkit. “PD.DataFrame () ”-metoden påberopes med 4 kolonner som vi spesifiserte som“ Summer ”,“ Winter ”,“ Autumn ”og“ Spring ”. Hver kolonne lagrer 8 verdier. De identifiserte verdiene for "Summer" -kolonnen er "200", "130", "280", "100", "270", "360", "120" og "311". "Vinter" -kolonnen har disse verdiene "12", "34", "54", "67", "98", "45", "78" og "43". Den tredje kolonnen, “Høst”, har verdier som “12”, “13”, “42”, “32”, “71”, “61”, “77” og “89”. For "Spring" -kolonnen er verdiene "10", "29", "78", "44", "76", "55", "32" og "22".

“PD.DataFrame () ”, når de påberopes, konstruerer en DataFrame ved å bruke disse medfølgende verdiene. Den trenger da et lagringsplass der den kan sette denne dataaframmen for senere bruk. Den nyopprettede DataFrame er nå tilgjengelig ved å nevne objektets "sesong". Det neste kravet er å vise denne dataaframmen på skjermen slik at vi kan se det ordentlig. For dette har vi brukt Pythons “print ()” -metode. Mellom parentesene leverer vi inngangen som må vises. Her har vi gitt "sesong" -objektet som en inngang til "print ()" -metoden for å vise innholdet.

For å utføre ovennevnte skript, må vi treffe alternativet "Run File"; Alternativt kan du også trykke på “Shift+Enter” -tastene sammen for å kjøre koden. Dette gir oss en dataaframe med 4 kolonner og 8 rader. Indekslisten starter fra “0” som standard og slutter på “7”.

Nå skal vi utøve Pandas “Rolling ()” -metoden for å beregne estimert rulling av en enkelt kolonne i den medfølgende DataFrame. La oss lære å få dette.

Vi har påkalt “DF.Rolling () ”-metode. DataFrame -navnet "sesong" med ".Rolling () ”-metoden er skrevet. Siden vi ønsker å få det rullende vinduet for beregning av det rullende gjennomsnittet av en enkelt kolonne, må vi spesifisere kolonnenavnet med DataFrame -navnet. Kolonnen vi har valgt her er "Summer" -søylen fra "sesongen" DataFrame. Mellom de runde parentesene til "Rolling ()" -metoden har vi definert verdi "3". Det betyr at vi ønsker å beregne rullingen av "sommer" -kolonnen.

“.Mean () ”-funksjonen vil beregne gjennomsnittet for 3-dagers rulling av" sommeren ". Vi ønsker å lagre dette estimerte rullende gjennomsnittet av "sommer" -kolonnen i en ny kolonne. Så for å opprette en ny kolonne, skrev vi DataFrame -navnet, abonnementsoperatøren, og deretter det nye kolonnenavnet som "Summer_Rolling". Vi tildelte det resultatet av “Season [“ Summer ”].Rulling (3).Mean () ”-funksjon. Derfor vil det rullende gjennomsnittet i 3 dager av "Summer" -kolonens verdier bli lagret i kolonnen "Summer_Rolling". Til slutt, skriv ut DataFrame ved å påkalle metoden “Print ()”.

I det avkastede øyeblikksbildet kan vi se at de to første oppføringene vi får er nullverdier. Dette er fordi vi ikke kan estimere det rullende gjennomsnittet, da det bare kan beregnes når vi har et 3-dagers vindu, men for de to første postene har vi ingen foregående verdier for å fullføre de spesifiserte vinduene; Derfor returneres NAN -verdier. I 3Rd Rad, vi får en verdi “203.333333 ”, som er gjennomsnittlig rulling i de tre dagene.

Eksempel nr. 2

Vi har lært å finne det rullende gjennomsnittet av en kolonne i en Pandas dataaframe. Det rullende gjennomsnittet kan også beregnes for flere kolonner. For flere kolonner må vi påkalle den rullende gjennomsnittlige metoden separat for hver kolonne.

Vi vil utøve den rullende metoden på den tidligere genererte DataFrame for å estimere det rullende gjennomsnittet av flere kolonner. “DF.Rulling ().Mean () ”-metoden påkalles. Vi har påkalt denne metoden to ganger fordi vi ønsker å beregne det rullende gjennomsnittet for to kolonner. Den første “Rulling ().Mean () ”-metoden kalles DataFrame og kolonnens navn som“ Season ['Summer'] ”, og verdien for rulledager er spesifisert“ 4 ”.

For å lagre det beregnede rullegjennomsnittet i en annen kolonne, har vi initialisert en kolonne “Summer_rolling”. Dette betyr at vi ønsker å beregne det rullende middelverdien for et 4-dagers vindu i "Summer" -kolonnen og lagre resultatet i kolonnen "Summer_Rolling". Så sysselsatte vi 2nd “DF.Rulling ().Mean () ”-metode. Kolonnen vi har valgt her er "Høst", og det rullende vinduet er spesifisert som "4". For å lagre beregningene har vi opprettet en kolonne “Autumn_rolling” i den eksisterende DataFrame “Season”. "Print ()" -metoden vil vise den endelige utgangen på Python -konsollen.

I utgangsskjermen kan det undersøkes at to nye kolonner er lagt til DataFrame. Kolonnene "Summer_Rolling" og "Autumn_rolling" har et estimert rullende middel for henholdsvis "Summer" og "Autumn" -kolonnene. De tre første verdiene i begge kolonnene er NAN fordi de ikke har nok oppføringer til å fullføre det 4-dagers vinduet til å beregne det rullende gjennomsnittet. Fra 4th Inngang, det får sin første rullende middelverdi.

Eksempel nr. 3

Det rullende gjennomsnittet av hele kolonnene i DataFrame beregnes ved å bruke pandaene “DF.Rulling ().Mean () ”-metode som det siste trinnet.

For å beregne det rullende gjennomsnittet av alle kolonnene, trenger vi ikke å nevne kolonnens navn spesifikt. Vi har påkalt “DF.Rulling ().Mean () ”-funksjonen ved å bare levere DataFrames navn som" sesong "og verdien for det rullende vinduet som" 5 ". For å bevare utfallet har vi laget et variabelt “resultat”. “Rulling ().Mean () ”-metoden vil beregne det rullende gjennomsnittet av DataFrame“ Season ”ved å ta et 5-dagers vindu og lagre resultatet i DataFrame-kopien ved å bruke" Resultat "-variabelen. Vi har brukt "print ()" -metoden til Python for å stille ut den nye DataFrame.

Dette gir oss DataFrame med et estimert rullende middel for et 5-dagers vindu.

Konklusjon

Beregning av det rullende gjennomsnittet for det spesifiserte vinduet i en DataFrame er en enkel tilnærming. Vi har brukt pandaene “DF.Rulling ().Mean () ”-metode for å estimere det rullende gjennomsnittet i denne opplæringen. Tre forskjellige strategier har blitt diskutert for å finne det rullende middelverdien i en dataaframe. Den første illustrasjonen er basert på beregning av det rullende gjennomsnittet av en enkelt kolonne, 2nd Eksempel gir ideen om å beregne det rullende gjennomsnittet for flere kolonner, og den siste forekomsten gikk kort gjennom å finne det rullende gjennomsnittet av alle kolonnene som er til stede i DataFrame. Alle teknikkene er praktisk talt implementert på Spyder -verktøyet.