Pandas bfill

Pandas bfill
"I Pandas DataFrame er datasettets manglende verdier fylt ut bakover ved hjelp av DataFrame.bfill () -funksjon. I Pandas DataFrame, hvis det eksisterer manglende verdier, vil den bakover fylle alle NAN -verdiene til vår dataaframe. En endimensjonal matrise med Axis-etiketter er Pandas-serien. Etikettene må være en hashbar type; De trenger ikke å være særegne. Objektet har et bredt spekter av metoder for å utføre operasjoner som krever indeksen og støtter både etikettbasert og heltallindeksering. Den bakoverfylte teknikken brukes til å befolke NAN -verdiene i serieobjektet ved hjelp av serien.bfill () -funksjon i pandaer.”

Syntaks for bruk av bfill () -metode?

Syntaksen for Bfill () -funksjonen for DataFrame er følgende.

Syntaks:


Syntaksen for bruk av Bfill () -funksjonen i serie er ganske den samme som med DataFrame. Forskjellen er at serienavnet vil bli brukt, etterfulgt av Bfill () -metoden.

Syntaks:

Parametere

Akser: 0 eller indeks

1 og kolonner støttes ikke. Axis = 1 i serie

På plass: boolsk, falsk som standard.

Gjøre endringer i samme objekt.

Grense: int, ingen som standard

Maksimalt antall påfølgende NAN-verdier til fremover- eller bakoverfylling hvis metoden er gitt. Med andre ord, gapet vil bli fylt delvis hvis det er mer enn dette mange påfølgende NANS. Dette er den høyeste mengden oppføringer langs den komplette aksen der null eller manglende oppføringer vil bli fylt hvis metoden ikke er gitt. Den har 0 eller mer hvis ingen.

Returnerer: Dataframe eller serier. NA -oppføringer fylt med DataFrame eller Series.

Hvordan bruke Pandas Bfill () -metoden?

Vi vil vise hvordan vi bruker BFill () -funksjonen i Pandas DataFrames og Series i eksemplene som følger.

Eksempel 1: Fyll opp DataFrames manglende verdier ved hjelp av BFill () -funksjonen

Som vi allerede vet, for å fylle NA -verdiene i en dataaframe, DataFrame.bfill () -metoden brukes. I motsatt retning fyller den NAN -verdiene som finnes i DataFrame.

Først vil vi opprette DataFrame etter import av Pandas -modulene. For å lage DataFrame i Pandas, bruker vi PD.DataFrame () -funksjon. Følgende parametere vil bli passert i PD.DataFrame () -funksjonen for å lage den nødvendige DataFrame.


Som det kan sees, har vi laget 3 kolonner X, Y og Z. I hver av våre DF DataFrames kolonner er manglende verdier til stede. For å visualisere DataFrame, vil vi passere DataFrame i Print () -funksjonen som et argument.


Nå vil vi bruke Bfill () -metoden for å befolke NA -cellene i DataFrame. Verdien i de nåværende Na -celler er befolket fra den tilsvarende verdien i følgende rad når Axis = “Rader”. Følgende rad vil ikke bli fylt ut hvis følgende rad også har en NA -verdi.

Som du kan se, i 4th rad, 1st Cellen er fortsatt nan. Dette er fordi den tilsvarende verdien i neste rad 5 også er NAN. 5th Verdien er NAN fordi det ikke er noen tilsvarende verdi i den nederste raden som BFill () -funksjonen kan befolke NA -cellen.

Hva om vi bruker Axis = “kolonner”? BFILL () -funksjonen vil fylle nullcellene med de tilsvarende verdiene fra neste kolonne (høyre kolonne). Samme som i tilfelle av Axis = “Rader”, vil følgende kolonne ikke bli fylt ut hvis neste kolonne også har en NA -verdi.


I ovennevnte DataFrame, etter bruk av BFill () -funksjonen, er alle verdiene som har en tilsvarende verdi i neste kolonne blitt endret.

Eksempel nr. 2: Fyll opp den boolske DataFrames manglende verdier ved hjelp av BFill () -funksjonen

I dette eksemplet vil vi opprette en dataaframe med boolske data og NAN -verdier for å sjekke hvordan Bfill () -funksjonen vil fungere på en boolsk DataFrame.


Vi har opprettet DataFrame med boolske verdier. Nå vil B -Fill () -funksjonen bli brukt til å fylle NA -verdiene.


NA -cellene fylles der de tilsvarende verdiene i neste rad i dataaframet eksisterer og ikke er nullverdier. Vi kan også spesifisere Axis = “Kolonner” som vi har gjort i eksempel nr. 1 for å fylle den tomme cellen med verdien i den tilsvarende kolonnen til NA -cellen.

Eksempel nr. 3: Fyll opp de manglende verdiene i serieobjekt ved hjelp av BFill () -funksjonen

Vi har sett hvordan bfillet () fungerer i Dataframes. Nå vil vi bruke Bfill () -funksjonen i et serieobjekt med en eller flere nullverdier. Først vil vi lage en serie av en person og spesifisere indeksnavnet på hver verdi i serien.


Vi vil bruke PRINT () -funksjonen for å demonstrere serien “S”.


Som det kan sees, er det en NA -celle ved indeks D. Å fylle den NA -cellen; Vi vil bruke b -fill () -metoden i serien vår.


Som du kan se, er NA -cellen fylt av neste tilsvarende verdi i serien. Siden det bare er en enkelt akse i serien, vil den alltid fylle de manglende verdiene med neste verdi til den manglende cellen.

Eksempel 4: Fyll opp de manglende verdiene i serieobjekt med numeriske verdier ved bruk av Bfill () -funksjonen

Etter å ha importert Pandas -modulene, vil vi nå bruke BFill () -funksjonen på et serieobjekt med numeriske verdier og ha en eller flere nullverdier. Først oppretter vi en numerisk serie og spesifiserer indeksen for hver verdi i serien.


Vi har opprettet den nødvendige serien og spesifisert indeksen for hver verdi ved hjelp av PD.date_range () funksjon. For å få en DateTimeIndex med en fast frekvens, brukes Date_Range () -metoden. Mens Freq = “M” indikerer at serien må opprettes basert på måneden. La oss visualisere serien vår ved hjelp av print () -funksjonen.


Som du ser, er det flere NA -verdier i serien vår. Nå vil vi fylle disse nullcellene ved hjelp av BFill () -funksjonen.


Den bakoverfyllingsteknikken brukes i Bfill () -funksjonen for å fylle nullcellene med neste tilstøtende verdi i serien.

Eksempel 5: Spesifiser grensen for Bfill () -funksjonen i serieobjektet

I dette eksemplet vil vi lage en serie med mer enn en påfølgende verdi for å vise deg hvordan grenseparameteren fungerer i Bfill () -funksjonen.


La oss bruke Bfill () -funksjonen på serien med grenseparameteren.


Serien i det nevnte eksemplet har to og tre påfølgende manglende verdier, men fordi grensen er satt til 2, “serien.BFILL () ”-metoden fylte bare to påfølgende nullceller; Den tredje forble null. Hvis vi setter grensen til 3, vil den fylle tre påfølgende nullceller i serien.

La oss i tillegg spesifisere "inplace = true" -argumentet for serien.bfill () -funksjon. Seriene.bfill () -metoden fyller de manglende verdiene uten å generere et nytt objekt så lenge dette alternativet er sant og det returnerer ingen.


Som du kan se, har den fylt alle NA -cellene fra serien vår.

Konklusjon

Vi lærte hvordan vi bruker Python Pandas -serien.bfill () ”-funksjon i denne opplæringen. Vi studerte syntaks og parametere for Bfill () -funksjonen før vi brukte den på en serie og dataframmer bestående av NAN -verdier for å forstå hvordan DataFrame.bfill () og serier.bfill () funksjon på nytt fyller nullverdiene som finnes i henholdsvis pandas dataaframe og serie.