Pandas bevegelige gjennomsnitt

Pandas bevegelige gjennomsnitt

"" Pandas ", som er biblioteket" Python ", gir mange innebygde funksjoner som hjelper oss med å gjøre forskjellige oppgaver enkelt ved å bruke disse funksjonene. Det gir forskjellige metoder som vi har brukt til å beregne de bevegelige gjennomsnittet. Den brukes til å analysere tidsserieinformasjonen ved å generere gjennomsnittet av forskjellige undergrupper av hele datasettet. Vi kan også bruke det rullende gjennomsnittlige navnet i stedet for det bevegelige gjennomsnittet. Med tidsserieinformasjon brukes det bevegelige gjennomsnittet typisk for å fange kortsiktige variasjoner mens de konsentrerer seg om lengre trender. Vi vil diskutere alle metodene i denne guiden og vil forklare hvordan den fungerer i "Pandas".”

Metoder for å flytte gjennomsnittet

"Pandas" letter oss med tre forskjellige metoder for denne "Pandas Moving Average" -metoden. Vi vil også diskutere i detalj alle tre metodene i denne guiden. Disse metodene er:

    • Enkelt glidende gjennomsnitt.
    • Eksponentielt glidende gjennomsnitt.
    • Kumulativt glidende gjennomsnitt.

La oss gå mot den praktiske demonstrasjonen av alle disse metodene i "Pandas" -koden her.

Eksempel nr. 01

Når vi bruker "Spyder" -verktøyet for å bruke disse metodene i "Pandas" i "Pandas". For å anvende metoden "Moving Average", må vi opprette DataFrame i "Pandas". For dette genererer vi først ordboken her, som heter "group_data", og vi setter inn "group_leader", der "Olive, Rowan, Julian, Howard, Novah, Juliet, Ella og Ava" er lagt inn. Deretter har vi "veileder", som inneholder “Amina, Asher, Felix, William, Bromley, Nora, Collins og Freya”. Deretter legger vi "presentasjon", som inneholder merkene av presentasjonen som er "15, 18, 16, 10, 19, 11, 15 og 14". Vi har også "oppgaver", der vi har lagt til merkene til oppgavene, og disse merkene er "29, 26, 25, 27, 28, 28, 25 og 26".

Etter tildelingsmerkene har vi lagt til de interne merkene i "Internt", som er "5, 6, 9, 8, 5, 7, 2 og 6" ". Da må vi konvertere denne "group_data" -ordboken til "group_df" dataaframe. For dette har vi brukt “Pandas” -metoden, som hjelper oss med å konvertere ordboken til DataFrame. Denne metoden er “PD.DataFrame () ”her, og vi oppgir navnet på ordboken i den som en parameter. Etter dette skriver vi ut “group_df” ved å bruke “print ()” -metoden.


Vi kjører denne koden i “Spyder” -verktøyet ved å treffe “Shift+Enter”. Etter utførelse av koden ovenfor, vises DataFrame på terminalen. Nå vil vi gå videre og anvende den glidende gjennomsnittlige metoden på kolonnene i denne dataaframe.


Vi bruker "enkelt glidende gjennomsnitt" her, og vi har brukt dette enkle glidende gjennomsnittet på to kolonner av DataFrame. Vi lagrer verdiene i "group_df1" -variabelen, som vi får etter å ha brukt det rullende gjennomsnittet på to kolonner. Disse to kolonnene blir lagt til etter å ha lagt navnet på dataaframmen i to firkantede parenteser. Disse to kolonnene er “Presentasjon og oppgaver” her. Så plasserer vi det rullende vinduet, som er “2” her og bruker deretter “Mean ()” -metoden. Dette rullende vinduet brukes for å ta gjennomsnittet av det forhåndsbestemte antallet av tidsintervallene. Etter dette legges "group_df1" til i "print ()" -metoden for utskrift på terminalen.


Verdiene vi får etter å ha brukt den bevegelige eller rullende gjennomsnittlige metoden til kolonnene "Presentasjon" og "oppgaver" vises nedenfor. Verdiene som vises her er de bevegelige gjennomsnittsverdiene for begge kolonnene.

Eksempel # 02

Vi bruker "group_df" igjen, og denne gangen bruker vi "Exponential Moving Average". Når vi ønsker å bruke det eksponentielle glidende gjennomsnittet, bruker vi “EWM ()” -metoden. I denne "ewm ()" -metoden må vi passere "spenn" -verdien. Vi bruker denne metoden på kolonnen "Intervaller" og lagrer de nye verdiene i kolonnen "EWM_30", som også legges til denne "group_df" DataFrame etter anvendelse av "EWM ()" -metoden. "Span" -verdien vi angir her er "30", og vi plasserer også "Mean ()" -metoden med denne "EWM ()" -metoden.


DataFrame før du bruker "EWM ()" -metoden og etter å ha brukt “EWM ()” -metoden vises her. Kolonnen “EWM_30” legges til i DataFrame nedenfor, som er opprettet her for lagring av de bevegelige gjennomsnittsverdiene for "Intervall" -kolonnen etter å ha brukt "EWM ()" -metoden på denne kolonnen.

Eksempel # 03

"Pandas" og "numpy" bibliotekene importeres her fordi vi må bruke metodene til begge bibliotekene i "Pandas". DataFrame vi opprettet her inneholder fire kolonner. Den første kolonnen, “Cola,” inneholder “0, 1, 2, 3, 4, NP.Nan, 7, NP.Nan, og 9 ”. "Colb" er her vi har lagt til "7, 8, 9, 10, 4, 17, 14, 12 og 22". Så har vi “COLC”, der vi setter “10, 21, 12, NP.Nan, 14, 15, 17, 11 og 33 ”. Den "kulde" er nå lagt til der vi har satt inn “20, 31, 2, 14, 11, NP.Nan, 24, 10 og NP.Nan ”.

Så bruker vi “Print (DF)” som vil skrive ut denne DataFrame. Vi vil bruke det bevegelige gjennomsnittet, men først vil vi vise denne DataFrame her.


Dataframe før du bruker en glidende gjennomsnittlig metode er gjengitt nedenfor. Du kan enkelt merke at alle kolonnene vises her. Nå vil vi bruke det bevegelige gjennomsnittet på alle disse kolonnene og vise resultatet.


Vi bruker det enkle flyttings- eller rullegjennomsnittet her, og vi vet at vi må passere rullende vindusverdien i denne rullende metoden. Så vi passerer “2” her, og så bruker vi “Sum ()” -metoden med denne glidende gjennomsnittlige metoden. Vi har lagret verdiene som vi får etter å ha anvendt metoden “Rolling ()” på kolonnene; "Cola" -verdiene lagres i "Sum A", "Colb" -verdier i "Sum B" og "Colc" -verdier i "Sum C" og også "Cold" -verdier i "Sum D" -variable.

Vi har også brukt metoden “Fillna ()” her og passerer “0” som parameter, som vil endre alle nullverdiene som vi får etter å ha brukt rullemetoden i “0” og lagre den nye DataFrame i “DF2” og viser også “DF2”. La oss kjøre denne koden og vil se resultatet etter å ha påført disse bevegelige gjennomsnitt på alle kolonnene separat.


Her er resultatet av denne koden, der verdiene vises, som vi får etter å ha brukt metoden “Rolling ()” på alle kolonnene og viser de bevegelige gjennomsnittsverdiene i den nye kolonnen. Etter dette erstatter den alle nullverdier med “0” og viser også den nye DataFrame nedenfor, som inneholder “0” i stedet for “Nan”, som er nullverdier.

Eksempel nr. 04

Vi kan også beregne de bevegelige gjennomsnittet av CSV -filen etter å ha lest dataene til filen. Her leser vi “kursene.CSV ”-filen ved å legge“ PD.read_csv () ”-metode og lagrer deretter dataene som DataFrame i“ Courses_df ”. Vi bruker metoden "kumulativ bevegelse" her. I denne metoden trenger vi ikke å legge til den faste vindusstørrelsen fordi vinduets størrelse endres med tiden. For å bruke dette, må vi sette metoden “utvidelse ()”, og etter dette plasserer vi “Mean ()”. Vi har brukt denne metoden på kolonnen "Rabatt", som er til stede i CSV -filen og lagret resultatet i "Average_cma" -kolonnen.


Dataframe som vi har oppnådd etter å ha lest “kursene.CSV ”-filen gjengis først. Deretter brukes den kumulative glidende gjennomsnittlige metoden her, og resultatet som vi får etter å ha brukt denne metoden vises også nedenfor i kolonnen "Average_cma".

Konklusjon

Det "bevegelige gjennomsnittlige" konseptet "pandas" blir diskutert i detalj i denne guiden. Vi har diskutert tre forskjellige metoder som vi har brukt i "pandaer" for å beregne "bevegelige gjennomsnitt". Vi har brukt alle tre metodene separat i eksemplene våre og har forklart hvordan disse metodene fungerer og hvordan du bruker disse metodene i “Pandas”. Vi har brukt disse metodene på kolonnene etter å ha opprettet DataFrame her, og vi har også brukt denne metoden på dataene til CSV -filen etter å ha lest CSV -filen. Vi har forklart alle metodene i detalj her.