“Pandas er en av pakkene med Python -språk, noe som gjør dataanalysen enklere og fleksibel å jobbe med og behandle bedre. Mange ganger, i det virkelige liv, står vi overfor situasjonen der vi har gjort arbeidet vårt i flere forskjellige filer, og til tider må vi se alle dataene sammen i en "DataFrame" for å analysere data i stedet for å ha dataene på forskjellige steder. Så pandaer gir oss denne tingen mulig ved å legge til rette for oss. Det er forskjellige måter å utføre denne metoden på; Vi vil implementere "Join" -metoden til pandaer på alle forskjellige måter mulige måter. Join () -metoden brukes først og fremst og blir med i DataFrames basert på "indeks". Vi vil bruke "Spyder" -verktøyet for implementering av kodene; Det er Python-orientert programvare som vil gi oss fordeler for kodeimplementeringen av Pandas Join-metoden ().”
Syntaks
"Dataramme. bli med"Syntaksen ovenfor brukes til å bli sammen med de to Dataframes sammen. Det fungerer alltid ved å bruke den andre indeksen til sammenføyningsformålet. DataFrame kan skrives som “DF '. "Dot Join" er for metodesamtalen. Ettersom den bruker indeksen, men det er ingen skade eller endringer utført i den virkelige. Den virkelige dataindeksen er bevart som originalen.
Parameter
Senere vil vi bruke en parameter som en "annen" Dataframe. Det hjelper med å bli sammen med de to Dataframes sammen; Den kombinerte tingen gjøres med denne parameteren. Også indeksen for en av de to "DF" skal være lik å bli med dem. Det betyr at lignende typer data eller data som brukes til samme formål kan være sammen for behandling.
Følgende er de forskjellige måtene vi skal gjøre eksemplene for implementering av Join () -metoden i en "DF".
Opprette DataFrame for metodeimplementering av Join ()
Her, først, må vi importere Pandas -biblioteket som "PD", så skal vi lage DataFrame som består av to kolonner, en er av "nøkkelen" som "T0", "T1", "T2", "T3 ”,“ T4 ”og“ T5 ”, og den andre er av“ N ”-verdier som“ N0 ”,“ N1 ”,“ N2 ”,“ N3 ”,“ N4 ”og“ N5 ”. "DF" representerer DataFrame i koden.
Utgangen viser dataene som er lagt inn i DataFrame; Vi kan se "nøkkelen" og "n" kolonnene skrives ut.
Opprette en annen DataFrame for Panda Join () -metoden
Vi oppretter en annen DataFrame fordi vi vil ha DataFrames separate, og så vil vi kombinere dem ved hjelp av Pandas Join () -metoden. Dataframe består av to kolonner; Når vi oppretter den siste "DF", har "Key" -kolonnen verdier som "T0", "T1", "T2" og "T3"; På den annen side har den andre kolonnen verdiene “M” som “M0”, “M1”, “M2”, “M3”.
Her er utdataene som viser den enkle DataFrame -opprettelsen i henhold til koden.
Du kan se at det er to DataFrames, og vi vil ha begge sammen i samme DataFrame, så vi vil gjøre eksemplene nå for å se hvordan det vil skje.
Eksempel # 01: Panda Join () -metode ved hjelp av indeksene
Åpne “Spyder” -verktøyet. For å bli med de to Dataframes sammen, bør vi lage de to Dataframes først for å bli med dem. Her består dataframene av variablene “x” og “y” med verdier tildelt som “x” med “x0”, “x1”, “x2”, “x3”, “x4” og “x5” mens “y” har færre verdier, som er "y0", "y1", "y2" og "y3". "Key" -verdiene er fra "K0" til "K5", og i andre "DF" er "nøkkel" -verdiene fra "K0" til "K2". Da vil DataFrame med "Dot Join" -metoden kombinere de to "DF". "Suffikset" som brukes i koden skyldes at det i DataFrame er to kolonner som har samme navn, i.e., "nøkkel". Som ikke overlapper dataene.
Utgangen viser de to “df” i en. Som vi kan se at det er noen verdier som "nan", noe som betyr at det er "ikke et tall". "DF" en har flere verdier enn den andre "DF", så der det ikke er tilordnet verdi, viser den som "Nan".
Eksempel nr. 02: Panda Join -metoden ved hjelp av (nøkkel) kolonner
Som vi vet nå hvordan du blir med i to dataframmer sammen, her vil vi nå gjøre det ved å bruke "Key" kolonne -metoden. Nøkkelkolonne -metoden ordner dataene som kolonner om deres indeks. Her består Dataframe av variablene “N” og “W”. “N” har verdier som “N0”, “N1”, “N2”, “N3”, “N4,” og “N5”. Mens “W” har verdiene “W0”, “W1” og “W2”. DF med ".Set Index ”viser med“ nøkkelen ”og med anropsforbindelsesmetoden som“.Bli med ", med den andre" DF "-indeksen vedlagt. Denne sammenføyningsmetoden vil kombinere begge “DF” ved hjelp av indeksen. Dette er en veldig effektiv metode for at pandaer blir sammen med et stort sett i et stort datamiljø.
Utgangen ved bruk av indeksforbindelse () kolonne -metode for Pandas viser kolonnene med nøkkelverdier og variablene “n” og “w”.
Eksempel # 03: Panda Join -metoden som bevarer den opprinnelige DataFrame -indeksen
I dette eksemplet vil vi se og bevise det vi skrev over at dataene er bevart til sin opprinnelige tilstand. Her har DataFrames variablene “P” og “W”. “P” med verdiene “P0”, “P1”, “P2”, “P3”, “P4” og “P5”. “W” med verdiene “Q0”, “Q1” og “Q2”. “.Bli med "implementering i" DF "er satt med" indeksen "(tasten). Denne metoden vil vise de oppbevarte dataene med indeksen “de opprinnelige dataene”.
Displayet representerer de virkelige dataene uten å ta originaliteten tatt.
Eksempel nr. 04: Panda Join-metoden ved hjelp av ikke-unik (nøkkel)
Nå skal vi gjøre et eksempel for å forstå en unik metode. I forrige eksempel lærte vi hvordan de opprinnelige dataene holdes. Som ble gjort ved å vise de to DataFrames tilgjengelig på koden. Vi vil nå gjøre det samme for å sjekke den opprinnelige tilstanden og også delta i metoden med den andre "DF" som ikke er der. "DF" her har "P" og "nøkkelen". “P” har verdiene fra “P0” til “P5” kontinuerlige og “nøkkel” -verdiene fra henholdsvis "K0" til "K5". "Dot Join" -metoden ringer med den andre "Set Index" som induserer "Key".
Utgangen ligner på det siste eksemplets utgang. Dataene er fanget fra de oppbevarte dataene som var originale.
Konklusjon
Metoden for at pandaer som blir med to dataaframe er effektiv og praktisk. Denne metoden bruker “.Bli med "-funksjonen for å betjene dataene og for å bli sammen med DataFrames sammen. Denne metoden er en flott måte å presentere dataene på, spesielt når vi jobber med en enorm mengde data i katalogen hvor som helst der dataanalysen blir utført. Vi har diskutert hvordan Panda -sammenføyningsmetoden kan implementeres for en bedre forståelse av funksjonen. Vi har gjort "indeks" -måten "kolonnen" og den "nøkkel" måten å bringe de to forskjellige dataframene inn i en enkelt.