Pandas Vlookup

Simen Stensrud

“Pandas” er et flott språk for å utføre analysen av data på grunn av dets store økosystem av datasentriske Python-pakker. Det gjør analysen og importen av begge faktorene enklere. "Vlookup" står for "Vertical Lookup". Det brukes til å slå sammen de to forskjellige tabellene i DataFrame der det skal være noen vanlige attributter mellom dem (de to tabellene). Som en utgang vil vi få en enkelt tabell som består av dataene fra begge vanlige tabellene. Dette ligner den ene oppslagsfunksjonen som brukes i "Excel". Vi vil implementere alle mulige metoder som Pandas Vlookup brukes. For utførelse av kodene vil vi bruke "Spyder" som er en programvare som er skrevet i "Python" på et vennlig språk.

Syntaks:

“PD.Fusjon (DF1, DF2, ON = 'Kolonnenavn', How = 'Left')

Den medfølgende syntaksen brukes til VLOOKUP i pandaer. Vi vil gjøre det ved å bruke "fusjon" -funksjonen til pandaer. "DF" i syntaks er en forkortelse av "DataFrame". "PD" er Pandas -biblioteket og "prikken" fusjonsfunksjonen med den. Det gjør arbeidet med å matche likhetene mellom de to kolonnene i DataFrame. Da kan vi i braketten skrive DataFrame -navnene med metoden som vi vil utføre. Vi vil gjøre alle metodene: "indre", "venstre" og "høyre.

Følgende er måtene Pandas Vlookup -metoden kan utføres. Vi vil gjøre det med eksemplene for en bedre forståelse.

- Vlookup -funksjon ved hjelp av Merge (indre sammenføyning)
- Vlookup -funksjon ved hjelp av Merge (Ytre Join)
- VLOOKUP -funksjon ved hjelp av Merge (Right Join)
- Vlookup -funksjon ved hjelp av Merge (venstre sammenføyning)

Opprette en DataFrame for eksemplet implementering av Pandas Vlookup

For å lage et DataFrame, åpne “Spyder” -verktøyet, da vi vil bruke det til eksemplene. Vi importerer først biblioteket med Pandas som "PD". Dataframe består av “spillerne” og “laget”. Spillerne er “N”, “M”, “O”, “P”, “Q” og “R”. Og lagene er "elleve" og "tjue". Slik opprettes DataFrame med den gitte utskriftserklæringen.

Utgangen viser den opprettede DataFrame som gitt i følgende kode:

Opprette en annen DataFrame for Pandas Vlookup Eksempel på utførelse

Her vil vi opprette en annen DataFrame slik at det er mulig å gjøre applikasjonen. Vi går trinn for trinn slik at det er en klar forståelse av Pandas Vlookup. Dataframe består av “spillerne” og “poengene”. Spillerne er “36”, “85”, “44”, “55”, “35” og “25”. Deretter sendes "trykket" DataFrame -setningen for opprettelsen av DataFrame som vises på utgangskonsollen.

Utgangen viser en annen dataaframe opprettet med dataene satt inn i koden:

Siden vi opprettet to separate Dataframes, bruker vi dem nå for å implementere VLOOKUP -funksjonen.

Eksempel 1: Vlookup -funksjon ved hjelp av Merge (venstre sammenføyning)

I dette tilfellet vil vi utføre Vlookup -funksjonen ved hjelp av Merge Join. "DF" består av spillerne som "q", "w", "e," r "," t "og" y "og lagene" sytten "og" atten ". Den andre DataFrame har poengene “52”, “18”, “14”, “13”, “12” og “11”. Vlookup -funksjonen ser opp til verdiene i DataFrame -tabellene hvilken kolonne som samsvarer. "Venstre" sammenføyningsoperasjonen gir alle radene fra "First" DataFrame og gjør matchingen fra den "andre" sjekkingen hvilke rader som ikke blir matchet slik at disse verdiene erstattes som "NAN".

NAN står for "ikke en verdi" som betyr at det ikke er noen verdi tilordnet der. Som vi kan se, er "spillerne" den vanlige kategorien blant de to Dataframes. Så på betingelsen oppfyller det og venstre sammenføyning er på hvor dette eksemplet beveger seg.

Displayet viser Vlookup DataFrame i Pandas, ettersom spillerne følger opp henholdsvis informasjonen fra teamet og poengene.

Eksempel 2: Vlookup -funksjon ved hjelp av sammenslåing (indre sammenføyning)

Her vil vi utføre Pandas Vlookup med Merge Inner Join. Dataframe har spillerne “A”, “S”, “D”, “F”, “G” og “H”. Begge Dataframes har samme spillers navn. "DF1" består av teamet som "tolv og" atten ". Mens “DF2” har poeng for spillerne som “91”, “92”, “93”, “94”, “95” og “96”. Metoden som vi bruker i dette eksemplet for Vlookup -funksjonen er den indre sammenføyningen som brukes til å utføre utgangen til bare kolonnene der tilstanden er fornøyd i begge de resulterende kolonnene. Vi spesifiserer nøkkelordet “indre” for ytelsen i DataFrame.

Resultatene viser at den indre sammenføyningen utføres når vi ser Pandas Vlookup -funksjonen er representert.

Eksempel 3: Vlookup -funksjon ved hjelp av Merge (Right Join)

I eksempel 1 gjorde vi venstre -med -operasjonen for VLOOKUP i Pandas. Her vil vi gjøre et eksempel på Pandas Vlookup ved å bruke sammen "høyre" sammenføyning, som nesten er homogen som "venstre sammenstilling". “DF” omfatter spillerne som “Z”, “X”, “C”, “V”, “B og“ K ”i begge DataFrames. “DF1” involverer lagene som “Oval”, “Square” og “Rectangle” der den andre DF har poengene som “86”, “85”, “84”, “83”, “82” og “81” individuelt. Spesifikasjonen av høyre sammenføyning skal være med sammenslåingens brakett som dreier seg om koden.

Displayet viser riktig sammenføyning som fungerer DataFrame of the Pandas Vlookup -funksjonen, som ligner Pandas Join Merge “Left” -operasjonen utført i DataFrame for Pandas VLookup.

Eksempel 4: Vlookup -funksjon ved hjelp av Merge (ytre sammenføyning)

Her vil vi utføre den ytre sammenføyningsfunksjonen for Pandas Vlookup. DataFrame er sammensatt av dataene som spiller for både DataFrame som "L", "J", "U", "T", "P" og "M". "DF1" består av teamet som "sirkel" og "hastighet". “DF2” består av punktene “77”, “47”, “35”, “90” og “19”. Den ytre sammenføyningen som vi bruker her er for bruk av å gi displayet DataFrame med både DataFrames hvis verdi samsvarer, og ingen tildelte verdier vises som "NAN".

Utgangen viser den ytre sammenkoblingsmetoden til Pandas Vlookup -funksjonen. Nan i displayet er de ikke tildelte verdiene.

Konklusjon

Pandas Vlookup ved hjelp av Merge () -operasjonen gjør det lettere å utføre "Vlookup" -funksjonen i "Vlookup -stilen". Vi utførte alle metodene som Pandas Vlookup kan brukes. Vi har gjort dette ved å bruke fusjonsfunksjonalitetene til "Inner Join", "Ytre Join", "Left Join" og "Right Join" -metodene. Alle metodene har en god ytelse avhengig av situasjonene som Pandas Vlookup kan brukes til. Pandas Vlookup kom opp så praktisk som vi kan se at DataFrame “Data” alle administrerte og representerte godt. Alle ekstra kolonnene ble utelatt ved å skrive bare når de er vanlige i DataFrame. Verdiene skal være alarmerende, noe som gjør enhver analyseytelse for videre evaluering av data de beste og enkle som det kan være.

Python

Python Chmod

“OS.CHMOD () ”-funksjonen til OS -modulen brukes til å endre eierskapet til Python -filen ved å godt...

Anders Fjeld Moe

Docker

Hva er formålet med en Docker-komponering.YML -fil i Docker?

Hovedformålet med en “Docker-Compose.YML ”-filen er å forenkle prosessen med å distribuere og admini...

Elias Krogh Svendsen

Docker

Hva er forskjellen mellom Docker og Podman?

Docker bruker en klient-serverarkitektur, mens Podman er en demon mindre containermotor. Podman er s...

Daniel Johnsen