Pandas Merge () -metode
“PD.Merge () ”kan brukes ved følgende gitt syntaks:
Her er noen nødvendige parametere "venstre" som betyr at venstre dataframe, "høyre" som betyr høyre dataaframe, "hvordan" på hvordan du kan bli med i DataFrames, "ON" som refererer til kolonnen vi brukte til å bli med i To dataframes., og "venstre_on" og "høyre_on" som hjelper til med å spesifisere venstre eller høyre kolonne for å bli med.
Vi vil utføre noen praktiske eksempler for å implementere denne metoden i denne læringen for å finne en kryssforbindelse mellom to Dataframes.
Eksempel 1: Bruke Pandas PD.Merge () -metode for å få et kryss sammenføyning mellom to DataFrames med en enkelt kolonne
Fra og med den første illustrasjonen for den praktiske implementeringen av Python -koden for å utføre en kryss -sammenføyning på Pandas Dataframes, må vi se etter et verktøy eller programvare som kan kjøre Python -kodene våre. Mange verktøy støtter Python -språket. Blant disse forskjellige valgene velger vi “Spyder” -verktøyet. Vi må først installere oppsettet av "Spyder" -verktøyet. Når det er gjort, lanserer vi verktøyet. Åpne en ny fil ved å klikke på "Fil" -knappen, trykke på filsymbolet eller treffe “Ctrl+N” -tastene.
Vår nye fil med ".py ”utvidelse som refererer til“ Python ”er klar til å begynne å jobbe. La oss nå fokusere på koden. Du kan observerte at det første ordet i artikkelen vår er "Pandas", noe som betyr at noe kommer til å bli gjort ved å bruke "Pandas" -biblioteket. Vi forstår at vår forutsetning for å implementere denne koden er å importere Pandas -biblioteket til Python -filen. Vi skrev en kodelinje “Importer Pandas som PD”. Dette importerer alle funksjonene i Pandas -biblioteket. Vi brukte også "som PD" som betyr at uansett hvor vi trenger å få tilgang til en hvilken som helst Pandas -metode i denne koden, må vi skrive "PD" i stedet for å skrive hele skjemaet "Pandas".
Når vi utfører Cross Join, er vi pålagt å ha to Pandas dataframmer der vi utøver denne metoden. Du lærer her hvordan du konstruerer en brukerdefinert DataFrame. For å lage en dataaframe gir Pandas oss en "PD.DataFrame () ”-funksjon der“ PD ”er“ Pandas ”. Så vi får tilgang til en Pandas -metode. "DataFrame ()" er nøkkelordet til denne funksjonen som, når den påkalles, genererer en DataFrame. Vi lager en dataaframe ved å bruke denne “PD.DataFrame () ”-metode og initialiser den med en enkelt kolonne“ Num ”. Denne kolonnen har to verdier som er “4” og “5”. Ringer “PD.DataFrame () ”-metode genererer en DataFrame med disse medfølgende verdier.
Nå, for å lagre denne DataFrame, oppretter vi et DataFrame -objekt "V1". Den nylig genererte DataFrame er nå tilgjengelig med denne variabelen “V1”. For å se denne DataFrame på terminalen, bruker vi “Print ()” -metoden. Deretter oppretter vi vår andre DataFrame ved å følge de samme trinnene som er nevnt mens vi oppretter den første DataFrame “V1”. Påkalle “PD.DataFrame () ”for å lage et dataaFrame som har blitt initialisert av en kolonne med tre verdier“ R ”,“ S ”og“ T ”. For å lagre denne DataFrame, lager vi en variabel “V2”. For å vise “V2” DataFrame, bruker vi igjen metoden “Print ()”.
Hvis du er ny på "Spyder" -verktøyet, lurer du kanskje på hvordan du kjører koden. For å utføre denne Python -filen, klikker du på "Kjør filen" -knappen eller trykker på "Shift+Enter" -tastene. Nå kan du se to dataframmer vi nettopp opprettet som vises på terminalen til "Spyder" -verktøyet.
Hovedoppgaven starter herfra. Vi må nå bruke korsets sammenføyning på begge disse dataframene. For å utføre et kryss med på to Dataframes, må det være noen "nøkkel" -kolonne som er til stede i begge DataFrames for å lage en kobling mellom dem slik at vi kan slå dem sammen ved å bruke den. Som vi kan se, er det ikke noe av det, så vi legger til en i både Dataframes “V1” og “V2”, som er en vanlig kolonne. Vi legger til den samme "Key" -kolonnen til begge dataframene som "V1 [" Key] = 0 "og" V2 ['Key'] = 0 ". Nå kan vi slå dem sammen på denne "nøkkelen" -kolonnen.
For å slå sammen dem, bruker vi “PD.Merge () ”-metode. Mellom parentesene gir vi både Dataframes “V1” og “V2”. "ON" -parameteren ber oss om å gi det vanlige kolonnenavnet basert på som vi kan slå sammen dem. Så det ser ut som "på =" nøkkel "". Med denne funksjonen bruker vi “.slipp () ”-metoden for å slippe" nøkkel "-kolonnen når sammenslåingen er utført. "Drop ()" -funksjonen har to parametere - navnet på kolonnen "Key" og "Axis = 1", noe som betyr at dråpen er kolonnemessig. Vi lager en variabel "butikk" for å holde utgangen til “PD.Merge () ”-funksjon. Vi kaller metoden “Print ()” for å se utdataene.
Utførelsen av det gitte program.
Eksempel 2: Bruke Pandas PD.Merge () -metode for å få et kryss med mellom to dataframmer med flere kolonner
Vi vil utføre et annet eksempel her om det samme emnet, Pandas Cross Join. For dette lanserer vi “Spyder” -verktøyet vårt og åpner en ny fil ved å trykke på “Ctrl+N”. Det viktigste kravet til koden er å importere de nødvendige bibliotekene. Vi bruker en Pandas -metode, så vi importerer Pandas -biblioteket som PD. Nå konstruerer vi vår første DataFrame ved å bruke “PD.DataFrame () ”-metode.
Vi initialiserer denne DataFrame med to kolonner - “Farge” og “Num”. Kolonnen "Color" har tre verdier som er "rød", "grønn" og "blå". Mens "Num" -kolonnen har samme lengde på verdier som er "101", "110" og "100". Vi lager en variabel “P1” for å lagre utgangen ved å ringe “PD.DataFrame () ”-metode. Nå kan vi få DataFrame ved å bruke denne variabelen. Vi bruker "print ()" -funksjonen for å vise den første dataaframe på terminalen.
Vår første DataFrame er opprettet med hell. Vi genererer det andre DataFrame nå. Igjen bruker vi “PD.DataFrame () ”-metode og lag en kolonne i parentesene. Denne kolonnen "seriell" lagrer fire verdier. Disse verdiene er “C1”, “C2”, “C3” og “C4”. For å lagre denne Dataframe, lager vi en variabel “P2”. Deretter påkaller vi “print ()” -funksjonen for å vise “P2” DataFrame.
Å kjøre forrige Python -kode gir oss følgende utgang som viser 2 dataframmer:
Vi genererer en "nøkkel" -kolonne i hver DataFrame der vi kan slå sammen dem. Her bruker vi verdien “2” for både “P1 ['Key']” og “P2 ['Key']” -kolonnene. Til slutt påkaller vi “PD.Merge () ”-funksjon for å slå sammen dataframene på basene i" nøkkelen "-kolonnen. og ".slipp () ”-metoden for å fjerne" nøkkel "-kolonnen etter å ha slått sammen begge dataframene. Vi lager en "maling" -variabel for å lagre den sammenslåtte DataFrame. “Print ()” brukes til å vise den endelige krysset med DataFrame som er lagret i “Paint”.
Dette får oss til følgende vist enkelt tverrbukket dataFrame generert fra å slå sammen to DataFrames.
Konklusjon
Å slå sammen to dataaframes til en enkelt kryssbedraget DataFrame er en veldig enkel og viktig teknikk å lære. Denne artikkelen la vekt på og forklarte konseptet med korset med Pandas Dataframe. Vi utdypet alle mindre detaljer fra å laste ned det nødvendige verktøyet til oppnåelse av ønsket utgang. Gjennom praktiske eksempler på Python-koder implementert og utført på "Spyder" -verktøyet, gjorde vi en forsettlig innsats for å gi deg et fruktbart lærings- og lettfattelige konsept av Pythons Pandas.