Pandas interpolat

Pandas interpolat
Interpolasjon er en måte å estimere de ukjente dataene mellom de to kjente verdiene til dataene. Pandas “Interpolate” -metode brukes til å fylle ut de manglende egenskapene i DataFrame. Det er ikke den beste versjonen av å finne de manglende eller ukjente dataene, da det til tider kan påvirke nøyaktigheten av dataene og kan ha kortsiktige feil. Men det er et "polynom", som er en type pandasinterpolering, som brukes på mange måter. Pandas 'Python er et veldig nyttig språk for informasjonsdatarelatert arbeid. Vi vil bruke "Spyder" -verktøyet for implementering av kodene, som er en Python-språkbasert vennlig programvare. Pandas -interpolasjonen kan gjøres på forskjellige metoder, vi må vite hvilket arbeid vi må gjøre. Med den kunnskapen vil vi implementere metoden deretter, som vi vil diskutere med komplette eksempler og forklaringer.

Typer pandas interpolate

Følgende er de tre måtene Pandas -interpolasjonen kan gjøres:

  • Lineær pandas interpolasjon (fremover, bakover, begge, enkeltsøyler, akse, polstring og polynom).
  • Polynom Pandas interpolasjon.
  • Pandas interpolasjon gjennom polstringen.

Det er noen parametere som er som følger:

limit_direksjon

“Forward”, “Backward”, “Begge”

Grenseretningen er som standard, satt ned som "fremover", noe som betyr at hvis vi ikke har spesifisert metoden, vil den gå med fremover interpolasjonsmetoden.

Opprette DataFrame for metodeimplementering av Pandas interpolate

Først vil vi fokusere på å lage DataFrame “DF”. Vi har importert Pandas -biblioteket som "PD", som er et open source -bibliotek for å manipulere dataene. Deretter vil vi begynne å lage "DF" ved å bruke programvaren "Spyder", der vi har dataene som i fire variabler som heter "W", "X", "Y" og "Z". Alle av dem har separate verdier tildelt som "W" som har verdiene "18", "5", "9", "3", "Ingen". “X” har verdiene “Ingen”, “89”, “4”, “8” og “None”. “Y” har verdiene “30”, “Ingen”, “7”, “9”, “12”. Tilsvarende "Z" med verdiene "11", "Ingen", "66", "5" og "8".

Her opprettes i koden ovenfor, DataFrame som kan skrives som "DF". I den første kodelinjen importeres Pandas -biblioteket som "PD". Deretter opprettes DataFrame der vi har tildelt variablene “W”, “X”, “Y” og “Z”, gitt hver og en av dem fem verdier tildelt. "Nan" i koden står for "ikke et tall".

Utgangen viser DataFrame -verdiene når vi tildelte dem i koden. Det er serienumre, deretter variablene, slipper ned verdiene som tilordnede.

Eksempel 01: Frem lineær pandas interpolasjonsmetode

I lineær interpolasjon fungerer interpolat () -metoden som punktene nær venstre og høyre, etter at estimeringen er gjort. Disse punktene antas å ligge på det ukjente møtepunktet. Som nevnt ovenfor i parametrene, hvis vi ikke spesifiserer parameteren, kjøres den som standard som den fremover interpolatmetoden. Koden nedenfor er et tydelig eksempel på standard. Her har vi tatt variablene som "S", "T", "U" og "V" med verdiene deres tildelt for DataFrame. Likevel, hvis vi vil spesifisere på egen hånd, kan vi gå med samme kode. Bare legg til, etter den siste kodelinjen, DF. Interpolate () kan skrives med grense retningen som spesifiserer den som "fremover", så det vil se ut som: "DF.interpolate (limit_direction = 'fremover') ”.

Utgangen nedenfor viser den fremre interpolasjonen av koden ovenfor. Når det gjelder detaljene som er gitt, fungerer standard som "fremover interpolasjon", og det er grunnen til at t (0) viser nullverdien.

Eksempel 02: Bakoverlinjet Pandas interpolasjonsmetode

Hvis vi ønsker å gjøre den lineære bakoverinterpolasjonen, kan vi gjøre det på samme måte som vi har gjort ovenfor i den fremre interpolasjonen. Vi må gi grensen retning som "bakover", denne gangen, som vist i koden. Her er variablene vi skal jobbe med for DF: “D”, ”Q”, ”B” og ”J” med verdiene deres tildelt.

Utgangen fra metoden bakover interpolasjon (), Q (4) er null på grunn av den bakover.

Eksempel 03: Begge lineære pandasinterpolasjonsmetoder

Nå her, hva om vi vil gjøre fremover og bakover både på samme kode? Det er mulig, og vi kan gjøre det bare ved å bruke "begge" interpolasjonsmetoden. Her, for "DF", har vi variablene "P", "U", "O" og "M" med deres tilsvarende verdier tildelt.

Følgende utgang består av begge, fremover og bakoverinterpolasjonsmetode.

Eksempel 04: Enkelt kolonne Pandas interpolasjonsmetode

Vi kan også bruke interpolatmetoden på en enkelt kolonne som ønsket. For DataFrame -opprettelsen har vi brukt “N”, “M”, “O” og “P” -variablene med de tildelte verdiene. Kolonnen “N” er valgt fra “DF” for å vises med Interpolate () -metoden.

Utgangen her viser enkeltkolonne Pandas interpolasjon.

Eksempel 05: Axis Pandas interpolasjonsmetode

Noen ganger, ifølge behovet, ønsker vi å interpolere etter kolonne og noen ganger med rader slik at "aksen" -attributtet fungerer på sitt beste. Denne funksjonen er standard satt som kolonne en, mens vi vil at radene skal interpolere, må vi eksplisitt følge aksen som 1. “L”, “F”, “I” og “T” er variabler tilordnet i denne “DF” med deres verdier tilsvarende.

Utgangen fra Axis Interpolate ():

Eksempel 06: Polynom Pandas interpolasjonsmetode

I matematikk er et polynom et uttrykk som består av ubestemmelser, som også kalles variabler og koeffisienter som utfører de aritmetiske operasjonene. I interpolasjonen er det noen sjanser for feil som kan oppstå her og der noen ganger. Mens polynominterpolasjon er den beste praksis som gjøres med seriedata. Dataene som er tatt her er i serie: “4”, “5”, “6”, “NP. Nan ”,“ 8 ”og“ 9 ”følg opp med interpolatmetoden til polynomet. Np.NAN er definert som NP fra Panda Library og "Nan" er oppgitt som "ikke et tall".

Resultatet viser den polynomiske pandas interpolatmetoden:

Eksempel 07: Pandas interpolasjon med polstring

Panda -interpolasjonen med polstring er definert som henholdsvis "å skrive eller kopiere en verdi før et manglende punkt". I denne metoden må spesifikasjonen av grensen tilnærmes. Grensen skal være det maksimale antallet “NANS”, da den vil fylle det kontinuerlig. Denne metoden fungerer kun i fremtidens retning og også i seriedata. "DF" for denne metoden er i serien som "2", "3", "NP. Nan ”,“ 5 ”,“ 6 ”,“ 7 ”og“ 8 ”følger opp med metoden 'Pad' for polstring.

Utgangsresultatene viser Pandas interpolasjon gjennom "polstring".

Konklusjon

Pandas Interpolate -metoden er en veldig praktisk metode for å fylle ut “Nan” eller verdiene som mangler. I denne artikkelen har vi lært forskjellige typer interpolasjon i Pandas dataaframe- enten det er fremover, bakover eller begge av dem, med akse, polynom- og til slutt polstringsmetoden. Alle av dem brukes til et bestemt formål og brukervennligheten av brukerne som jobber med enorme datamengder.