Pandas blir med vs fusjon

Pandas blir med vs fusjon

“Pandas” er et verktøy med høy ytelse for Python-miljøet. Det er en "åpen" kildekode for analyse av data. Pandas sammenføyning og Pandas Merge -metoden brukes til sammenføyning av de to DataFrames sammen til en enkelt DataFrame. I begge metodene for pandaer er forskjellen at Pandas “Join” -funksjonen blir med DataFrame ved å bruke en indeks. Mens Pandas “Merge” -funksjonen blir med DataFrame ved å bruke indeksen og kolonnemetoden der vi kan velge ønsket kolonne selv. Merge -metoden til pandaer brukes mest sammenlignet med sammenkoblingsmetoden til Pandas. Programvaren vi skal bruke til implementeringen er "Spyder" -programvaren, som er i Python -miljøet som vil gi oss fordeler for kodeimplementeringen av Pandas Join -metoden () og Pandas Merge () -metodefunksjonen.

Syntaks av Pandas Join () -metoden

“DF1.Bli med (DF2) ”

"DF" i syntaks ovenfor er forkortelsen av "DataFrame". Det er to dataframmer i syntaks med "dot join" -funksjonen, som er for å kalle metoden. Det er Pandas -metoden for å bli med i to dataframmer. Det fungerer ved å bruke indeksen for å kombinere dataframene i en enkelt.

Syntaks av Pandas Merge () -metode

“DF1.Merge (DF2, ON = 'Column_name') ”

Pandas Merge Method Syntax har to Dataframes som “DF1” og “DF2”. "Dot Merge" -funksjonen kaller frem metoden for å bli med begge dataframene med utseendet til kolonner omvendt.

Vi vil dekke følgende måter å kombinere to Dataframes for å bruke metodene til Panda Merge og Pandas Join:

  • Pandas blir med på metoden overlapping.
  • Pandas blir med i metoden ved hjelp av en tilbakestilling av indeksen.
  • Pandas Merge Method (kolonne “Venstre og høyre”).
  • Pandas Merge -metoden eksplisitt.

Opprette DataFrames for implementering av Pandas Merge og Pandas Join -metoden

Først må vi lage en dataramme. For det bruker vi “Spyder” -verktøyet. Etter å ha åpnet den, begynn å skrive koden. Importer Pandas som "PD" for Pandas Library Association. Vi har dataaframvariablene som "x", "y", "p" og "q tilsvarende og" a "med verdier" 1 "og" b "med verdien tildelt som" 2 ".

Utgangen er en "DF" opprettet med de tilordnede verdiene. Vi kan gjøre det så stort som dataene er.

Opprette en annen DataFrame

Vi må lage en annen Dataframe, for å forstå metodene for at pandaer blir sammen og pandas sammen. Her har vi “DF” skapt det samme som ovennevnte “DF”, bare verdiene er variabler som er tildelt er forskjellige. Vi har “H”, “J”, “S” og “D”, mens tilordner verdier “B” med verdien “8” og “Y” med verdien “3”.

Utgangen viser en enkel "DF" opprettet.

Eksempel # 01: Pandas Join Method (Overlapping)

Nå vil vi se hvordan du kan bli med i to dataframmer med Pandas sammenføyningsmetoden. For denne metoden kan vi velge kolonnen etter ditt valg vi vil jobbe med fra DataFrame. Vi har tatt eksemplet med den overlappende kolonnen "venstre" fra "DF", slik at vi kan fikse dette med "suffikset" for å overvinne overlappingen av data. Her er variablene som brukes “x”, “z”, “v”, “d”. “P”, “O”, “L” og “Y” med verdiene tildelt som “3”, “6”, “7” og “9”. “.Bli med "kaller metoden, med Align Set til venstre sammen med høyre" DF "-suffiks. ”. "Suffikset" som brukes i koden skyldes at i DataFrame er det to kolonner som har samme navn som er "nøkkel" og som ikke vil overlappe dataene.

Utgangen viser ingen overlappede data med metoden for å bli med to “DF” ved hjelp av Pandas Join -metoden.

Eksempel # 02: Pandas Join -metoden ved hjelp av en tilbakestilling av indeksen

I dette eksemplet vil vi separat spesifisere kolonnen med parameteren "ON" for å bruke som "nøkkelen" i metoden som hjelper til med å bli med i de to DataFrames. Den kombinerte tingen gjøres med denne parameteren. Også indeksen for en av de to "DF" skal være lik å bli med dem. Lignende typer data eller data som brukes til samme formål kan være sammen for behandling. Dette vil bruke indeksen fremdeles, ved å bruke fra høyre. Variablene er “S”, “T”, “U”, “V”, “N”, 'W ”,“ K ”og“ Q ”. Verdiene som er tilordnet er “3”, “6”, “7” og “9”. "Reset Dot Index" er en metode for pandaer for å tilbakestille indeksen for "DF". Tilbakestillingsindeksen angir alle heltallene i DataFrame -oppføringen fra 0 til DataFrame -dataene er forlenget.

Her vises utdata med indeksen "Key" sammenføyningsmetode for Pandas.

Eksempel # 03: Pandas Merge Method (kolonne “Venstre og høyre”)

Merge -metoden utfører en lignende operasjon som Pandas sammenføyningsmetoden. Begge metodene er for å kombinere data på en lignende dataaframe. Merge -metoden er mer allsidig som krever å spesifisere nøkkelen. Vi kan også spesifisere det på venstre og høyre kolonner, avhengig av arbeidet med DataFrame. Variablene i koden er “S”, “D”, “G”, “F”, “K”, “J”, “B” og “Q”. Verdiene som er tilordnet er “9”, “5”, “6” og “7”. Den ytre "Join" -implementeringen gjøres på både “DF” ved å bruke parameteren “Hvordan” for Pandas Merge Method -funksjonen.

Utgangen vi ser viser de sammenslåtte dataene fra de to DataFrames. "Nan" representerer "ikke et tall" som betyr at der det ikke er tilordnet noe tall i dataene "nan" viser der.

Eksempel # 04: Merge -metoden eksplisitt

Her, i dette eksemplet, er sammenslåingsmetoden ødeleggelse av indeksen, og indeksverdien antas ikke på DataFrame. Vi vil gjøre denne metoden i henhold til arbeid som må gjøres, hvor den spesifiserende eksplisitte er å følge opp. Den vil slå sammen dataene basert på en venstre indeks eller høyre indeks med parameteren. Variablene i denne dataaframe er “t”, “r”, “i”, “u”, “h”, “o”, “e” og “e”. De tildelte verdiene er “2”, “4”, “6” og “4”. Ovennevnte eksempel på Pandas Merge -metoden med kolonnevalget i henhold til behovet er den mest presentable og verdifulle metoden for å bli sammen med de to DataFrames. Sjekk på slutten av kodelinjen om at Merge -tasten er unik i datasettet.

I utdataene nedenfor vises ikke indeksen uten indeksen, men funksjonen utføres basert på høyre og venstre indeks.

Konklusjon

Merge () og Join () -metodene er begge metodene som er veldig praktiske og effektive. Begge disse funksjonene brukes til å bli med i de to separate dataaframe på samme dataaframe, men har forskjellig bruk avhengig av saken. I denne artikkelen har vi lært de viktigste forskjellene mellom Pandas Join and Merge Method. Etter å ha gjort eksemplene og forstå panda -sammenføyningsmetoden, vil vi konkludere med det med kunnskapen om at hvis vi ønsker mer fleksibel og databasestil sammen med, er det å foretrekke å gå med Pandas Merge -metoden. På den annen side, hvis vi ønsker å gjøre DataFrame som kombineres med indeksen mye, kan vi gå med Pandas Join () -metodefunksjonen.