Pandas smelter sammen

Pandas smelter sammen

Når du bruker Python, trenger ikke den variable datatypen. En variabel mottar minnetildeling ved kjøretid når den får en verdi. Python Panda -modulen brukes til å endre datasett. Pandaer brukes først og fremst til dataanalysebiblioteker. Det gir en rekke verktøy og strategier for å øke analysen av fakta. Mange av de tidkrevende, kjedelige aktivitetene som er involvert i å jobbe med dataene, blir gjort enkle av pandaer. I denne artikkelen bruker vi Merge_asof () -funksjonen.

Pandas Merge_asof () metode

Denne funksjonen implementerer sammenslåing av nøkkelavstand. Bortsett fra å matche på den nærmeste nøkkelen i stedet for like nøkler, er dette sammenlignbart med en "venstre-join". Den har to hovedfunksjoner, som er "fremover" og "bakover". Et "fremover" -søk brukes til å velge den første raden i den relevante datarammen der nøkkelen er større enn eller tilsvarer nøkkelen til venstre. Et "bakover" -søk brukes til å velge den aller siste raden i riktig dataramme hvis nøkkel er lavere eller sammenlignbar med nøkkelen til venstre.

Det er mange ting vi kanskje vil gjøre etter at vi har konstruert eller importert datarammen vår i pandaer. For øyeblikket må vi lære å gjennomføre en "venstre sammenføyning" på to datarammer der sammenkoblingstastene ikke stemmer overens. Forbindelsesnøkkelen må brukes til å bestille både venstre og høyre datarammer. Ved hjelp av sammenføyningstasten må venstre og høyre datarammer bestilles. De to viktigste parametrene vi har brukt i denne artikkelen er "venstre" og "høyre.”

Syntaksen for pandaene smelter sammen ASOF

Eksempel 1: Vise sammenslåing av to datarammer ved å bruke Pandas smelte sammen flere ganger

Nå vil vi diskutere sammenslåing av to datarammer. De tre mest avgjørende metodene for å integrere data i pandaer har nå blitt lært oss, som er "fusjonerer ()", "bli med ()" eller "concat ()". I denne artikkelen vil vi bruke "Merge_asof ()". Som du kan se i koden, har vi først importert Pandas open source. To datarammer som vi har kalt “venstre” og “høyre”. Datarammen "Venstre" er opprettet av kilden til pandaer av "Import Pandas". Verdien for datarammen "Venstre" lagres i "M" med verdier på "2", "6" og "8". Vi har erklært dem med "venstre_verdier", der den første verdien er lagret i “M”, den andre verdien i “N” og den tredje verdien i “O”.

Den identiske omstendigheten gjelder for den "riktige" dataaframe. Variabelen “M” har lagret verdier på “2”, “4”, “6”, “8” og “9”. Det er erklært som "right_values". Etter å ha opprettet DataFrames, viste vi dem ved å bruke "print (venstre)" -funksjonen for "venstre" dataramme og "print (høyre)" -funksjonen for "høyre" dataramme. Her er våre datarammer blitt opprettet.

Nå kommer vi til vår viktigste funksjon av "Merge_asof ()". Denne funksjonen vil bli brukt til å slå sammen eller vise to datarammer sammen. “Pandas.Merge_asof () ”vil bli brukt med utskriftsfunksjonen for å vise datarammer på enten venstre eller høyre side. I den siste delen av koden vår brukte vi den ordinære falske tilstanden bare for å begrense den fra å matche verdiene med hverandre.

Hvis vi diskuterer utdataene på toppen, har vi vist "M" med navnet på verdien av "venstre" dataramme med navnet "venstre_verdier", og alle verdiene vises sammen med de variable verdenavnene for " 2 ”som“ M ”,“ 6 ”som“ N ”og“ 8 ”som“ O ”. Deretter viser du dataene fra den "høyre" datarammen som navnet "Right_Values". Rett etter "venstre" dataframe er verdiene for indeksnummer "2" for "2", "4" for "4", "6" for "6", "8" for "8" og "9" for “9”.

Når begge datarammene vises, bruker vi “Pandaene.Merge_asof () ”for å slå sammen både datarammeverdiene og vise dem ved å bruke" print () "-funksjonen. Den viser verdiene til datarammen "Venstre" og den "høyre" datarammen i to separate kolonner som har de samme verdiene på "2", "6" og "8" i "venstre_values" og "høyre_values". Den "falske" verbose vil ikke vise verdiene som ikke er vanlige i begge datarammer.

Eksempel 2: Vise sammenslåing av to datarammer ved å bruke Pandas Merge Asof () -funksjon en gang

I dette eksemplet vil vi diskutere hvordan vi bruker "Merge_asof ()" -funksjon i to datarammer samtidig. I eksemplet ovenfor har vi brukt "Merge_asof ()" -funksjonen separat for hver dataramme. Nå ser vi hvordan vi kan kombinere to datarammer i kolonner ved å bruke "Merge_asof ()" -funksjonen bare en gang. Først opprettet vi dataene våre og gitt navnene på DataFrames som "MD1" og "MD2" ved å bruke Pandas. For "MD1" DataFrame erklærte vi navnet på kolonnen som "venstre_side_value". Dataene fra datarammen "MD1" inkluderer tre navn, som er "Michael", "Shawn" og "Herry". Indeksen som er gitt til dataene til “MD1” er “20”, “40” og “60”. Det samme som “MD2” DataFrame IT lagrer data som er “20”, “30”, “50”, “55” og “59”. Indeksen gitt til dataene er også gitt det samme som data som "20", "30", "50", "55" og "59".

Etter å ha opprettet dataene våre, viste vi dataene våre ved å bruke “Print (MD1)” og “Print (MD2)”. Nå vil vi diskutere hovedfunksjonen vår, "Merge_asof ()" -funksjonen. Etter å ha vist dataene i begge datarammer, brukte vi hovedfunksjonen vår for å slå sammen begge datarammene. Med "Merge_asof ()" -funksjonen har vi brukt ordre av "sann" med "venstre_index = true" og "høyre_index = sant" bare for å sikre at det kan være sammenlignbart med en "venstre-join" med unntak av at vi Match på den nærmeste nøkkelen i stedet for like nøkler. Nøkkelen må brukes til å bestille begge DataFrames.

Nå vil vi se på utdataene våre. På toppen vises våre første databeskjemme “MD1” -data med “venstre_side_value” med de tre indeksnumrene på venstre hjørne, og de tre datanavnene på motsatt side av indeksnumrene er “Michael”, “Shawn”, og “Herry”. Neste neste "right_side_value" av "MD2" datarammer vises sammen med de fem indeksnumrene og dataene. Deretter, etter å ha brukt vårt “trykk (pandaer.Merge_asof (md1, md2, venstre_index = true, right_index = true)) ”hovedfunksjon, den viste de sammenslåtte dataene til våre to datarammer . “MD1” dataramme på venstre hjørne og “MD2” dataramme på høyre hjørne, sammen med kampen til den nærmeste tasten.

Konklusjon

Pandas lar oss utføre en sammenslåing av nøkkelavstand ved å bruke "Merge_asof ()" -funksjonen. For å utføre denne funksjonen har vi brukt "Spyder" -verktøyet for å kjøre våre respektive koder. La oss forklare artikkelen vår med noen få ord. Det første eksemplet bruker to datarammer merket “Venstre” og “Høyre”. Først separat anvendt funksjon med datarammen "venstre" og deretter i den "høyre" datarammen. Som et resultat fusjonerer det de nært beslektede dataene fra begge datarammer. For dette har vi også brukt den "falske" uttalelsen i funksjonen for å forhindre at den blir en eksakt samsvar. Hvis vi diskuterer det andre eksemplet, har vi brukt "Merge_asof ()" -funksjonen for å kombinere begge datarammer til bare en funksjonsanrop. Vi hadde to datarammer som var "MD1" og "MD2".