Pandas Union

Pandas Union

Pandas funksjon “Indeks.Union () ”brukes til å skaffe indeksen i en unionsrekkefølge som i det faste kapittelet i matematikk, hvor vi brukte unionsfunksjonen. Vi kan også finne foreningen av indeksen ved å bruke "concat ()" -funksjonen, som kombinerer DataFrame og angir indeksrekkefølgen på en sekvens måte.

Syntaks for concat () -metoden


Syntaks for “indeksen.Union ”-metode


Eksempel 1: Foreningen av to dataframindekser ved bruk av concat () -metoden

I dette eksemplet bruker vi "concat ()" -funksjonen til "forening" indeksene til to dataaframe. Concatenating Two Dataframes sammen er en enkel prosess. Selv om "union" -funksjonen i pandaer ligner en union, eliminerer den også duplikater. Concat og Drop Duplicates fungerer i pandaer begge bruker unionen. Denne fagforeningen fungerer på samme måte som hvordan unionen fungerer i matematikk -kapittelet “SETS” fungerer, og kombinerer alle tallene sekvensielt; I pandaer blir det gjentatte tallet imidlertid droppet.

Vi bruker "Spyder" -verktøyet for å implementere koden i artikkelenes første eksempel. Det første trinnet i hver Python Pandas -kode er å importere Pandas bibliotek som "PD".


Vi vil nå generere en dataaframe. For å sammenkoble Dataframes og anvende union på indeksene sine, vil det bli opprettet to dataframmer. Den første DataFrame vi har heter "Tabell1". Den inneholder to kolonner, "kurs" og "gebyr", hver har noen verdier angitt i seg. I den første kolonnen viser vi navnene på noen få programmeringskurs, inkludert "OOP", "Python", "Java" og "Android Studio". Vi nevnte kursavgiftene i den andre kolonnen, "Fee", og de er "30000", "35000", "32000" og "25000". For å generere vår første DataFrame “Table1”, bruker vi nå “PD.DataFrame ”, som du kan se i følgende bilde:


Opprettelsen av det andre DataFrame “Tabell2” er følgende trinn. Kolonnenavnene i denne dataaframmen er de samme som i forrige DataFrame, men verdiene deres er forskjellige. Vi har "grafisk design", "PHP", "SQL" og "Swift" i "Courses" -kolonnen, og vi har "34000", "32000", "22000" og "24000" i "avgiften" kolonne. For generering av det andre dataaframet, tabell2, bruker vi nok en gang “PD.dataaframe ”som demonstrert.


Nå, i dette avsnittet, vil vi implementere hovedfunksjonen til eksemplene våre, som kombinerer to dataframmer ved å bruke “Concat ()” -funksjonen og anvende “Union” -funksjonen på indeksene deres. "Concat ()" -metoden sammenkobler pandaselementer på tvers av en viss akse med valgfri settlogikk, som kan være kryss eller union sammen med de andre aksene. Her har vi brukt “PD.concat (tabell1, tabell2) ”for å kombinere DataFrame. Vi har også bestått parameteren “Ignit_index = True” fordi vi ikke vil at indeksen ikke skal gjentas. I stedet ønsker vi indeksen i trinnvis form når vi kombinerer dataframene. Til slutt lagret vi resultatet i unionsvariabelen og trykket den ved hjelp av "print ()" -funksjonen. Følgelig vil "concat ()" -metoden i det vesentlige bruke indeksen for å finne foreningen av DataFrame.


La oss vende oss til utdataene, som vises på følgende bilde. Som vi kan se, å kombinere våre DataFrames fungerte vellykket ved å bruke "Concat ()" -funksjonen. De to kolonnene, "kurs" og "gebyr", vises. Siden indeksen vår ikke gjentas, vises den i Unionens skum, som det kan sees, fordi vi har passert parameteren til "Concat ()" -funksjonen, som er "ignorere_index = sant". Indeksstørrelsen som vi for øyeblikket har er “8”, noe som betyr at den spenner over et område på “0 til 7”.

Eksempel 2: Kombinere indeksen ved å bruke indeksen.Union () Metode

Dette er et enkelt og kompakt eksempel. Før vi slo sammen de to indeksene i dette eksemplet, benyttet vi oss.Union () ”-metode. Som alltid må vi importere Pandas bibliotek som "PD" før vi kjører denne koden. I dette eksemplet bygger vi ganske enkelt en indeks i stedet for en dataaframe. Så for å lage den første “indeks1”, brukte vi “PD.Indeks "med tallene“ 4 ”,“ 5 ”,“ 6 ”og“ 7 ”, og vi fulgte den samme prosedyren som du kan se for“ Index2 ”. "Indeks2" -verdiene er "8", "9", "10" og "11".


Som du ser, bruker vi for øyeblikket “Index1.Union (indeks2) ”. Det vil skape en unionsordre ved å kombinere begge indeksene. Vi bruker deretter "print ()" -metoden for å vise det genererte resultatet.


Utgangsresultatet viser at den kombinerte indeksen starter på nummer fire og avsluttes med nummer elleve. Denne gangen vises en enkelt rad i indeksen. Det indikerer også at datatypen er "INT64".

Eksempel 3: En forening av tre dataframindekser ved bruk av concat () -metoden

Dette eksemplet ligner på det første eksemplet, men dette vil kombinere tre dataframmer og bestille indeksene deres sekvensielt. Generelt returnerer Pythons indeks plasseringen av det medfølgende elementet i en liste eller tegnene i en streng. Indeks definerer i hovedsak elementets plassering for å si det enkelt.

Vi må importere Pandas -biblioteket som "PD" før vi kan begynne å skrive koden for dette eksemplet. I dette scenariet skal det opprettes tre dataframmer. Den første DataFrame vi har heter “Data1”, og den har tre kolonner “Student_name”, “Marks” og “Merknader”. Noen verdier er lagt til disse kolonnene. Vi har “Noah”, “Emma”, “Enna” og “George” i den første kolonnen, “Student_name”, og i den andre kolonnen “Marks”, har vi en liste over studentens merker “450”, “490 ”,“ 482 ”og“ 209 ”og den endelige kolonnen inneholder studentens“ Merknader ”enten et“ pass ”eller en“ Fail ”. Nå oppretter vi denne dataaFrame som vist ved å bruke “PD.Dataramme".


Det er på tide å konstruere en andre dataaframe med tre kolonner, som vil være identisk med den første, men verdiene på kolonnene endres. DataFrame heter “Data2”. Vi har tre kolonner “Student_name”, “Marks” og “Merknader”. I den første kolonnen, "Student_name", har vi "Watson", "Henry", "James" og "Oliver" verdiene i den andre kolonnen, "Marks", vi har "499", "390", "290 ”Og“ 400 ”og i den siste kolonnen har vi kommentarene“ pass ”eller“ mislykkes ”. Denne "data2" dataaframe er fullført, så vi bruker den samme “PD.dataaframe ”for å produsere dette.


Det er på tide å lage den tredje DataFrame “Data3”, som har tre kolonner med de samme navnene som den siste DataFrame, men med forskjellige verdier. Verdiene vi har i den første kolonnen er "Archie", "Ethan", "Michael" og "Samuel". Vi har “230”, “498”, “290” og “403” i den andre kolonnen, og i den tredje har vi “Fail”, “Pass”, “Fail” og “Pass”. For å generere den tredje DataFrame “Data3”, bruker vi igjen “PD.Dataramme".


Her kombinerer vi våre tre Dataframes og tildeler indeksene deres en sekvensforeningsmessig ved å bruke "Concat ()" -funksjonen med dens parameter. Her bruker vi “PD.Concat (DF1, DF2, DF3) ”brukes til å kombinere DataFrames, som er“ Data1 ”,“ Data2 ”og“ Data3 ”. Som du ser, benyttet vi også “ignor_index = true”, som vil utelate den gjentatte indeksen og gi dem en ny indeks som er nøyaktig og i riktig rekkefølge fordi vi ønsker en unionsordre for vår indeks. Angi alternativet “Ignore_index = True” for å instruere sammenkoblingen til å se bort fra eventuelle brukte indekser. Da vil den sette indeksen fra '0 ”for å fortsette i resultatene. For å lagre resultatet produsert av denne funksjonen, initialiserer vi variabelen “Union”. Etterpå påkaller vi "print ()" -funksjonen for å vise innholdet som er lagret i denne "unionen":


Dataframene er kombinert og vist som en enkelt datafram i utgangen, som det kan sees. De tre dataframene kombineres ved å bruke "concat ()" -funksjonen og dens forening av indeksene ved å bruke parameteren "ignorere_index = true". På grunn av samme antall kolonner og de samme navnene på kolonnene i hvert av disse tre dataframene, ble det ikke vist noen ekstra kolonner i resultatet. "Student_name", "Marks" og "Merknader" er de tre kolonnene som vises etter sammenkobling. Indeksens unionsmessige representasjon er synlig; Det starter fra “0” og avsluttes på “11”, noe som indikerer at indeksstørrelsen er “12”.

Konklusjon

I denne artikkelen sammenkoblet vi DataFrame for å få unionsindeksen ved å bruke "concat ()" -funksjonen. Vi bruker i tillegg konkatfunksjonens parameter “Ignit_index = true” fordi vi ikke vil ha den gjentatte indeksen. I det andre eksemplet på artikkelen, som er kort og enkel, brukte vi “Indeks.Union () ”-funksjon for å kombinere indeksene og vise indeksens datatype. Vi tror at disse metodene vil forenkle oppgaven din.