Pandas velger rad etter verdi

Pandas velger rad etter verdi
Rader fra en Pandas dataaframe kan velges basert på flere kriterier eller kolonneverdier. Denne artikkelen gir forklaringer og eksempler for de mange tilnærmingene for å oppnå dette
Sjekk ut de vedlagte metodene for dette formålet:
  • Boolsk indeksering
  • loc [] eiendom
  • spørring () Metode
  • Isin () -metode

La oss utforske den praktiske implementeringen av disse teknikkene.

Opprette en dataaframe

For implementering av eksemplene bruker vi Spyder -verktøyet. Etter å ha lansert verktøyet importerte vi det nødvendige biblioteket som er "Pandas" og aliaset det "PD". Nå, ved hjelp av Pandas -funksjonen, vil vi først lage et eksempel DataFrame som vil bli brukt i alle illustrasjonene i denne guiden.

Vi har påkalt Pandas -metoden “PD.DataFrame () ”som starter DataFrame Creation Process. Vi har initialisert det med 4 kolonner “Marks”, “St_name”, “ST_ID” og “Points”. Hver kolonne lagrer en liste over definerte verdier. Kolonnen “Marks” har verdiene “100”, “92”, “79”, “92”, “73”, “82” og “90”. For kolonnen "St_name" har vi strengverdier "Adam", "Albert", "Elsa", "Ronald", "Maya", "George" og "Jessica". Kolonnen "ST_ID" holder verdier som vi har definert som "10", "11", "12", "13", "14", "15" og "16". Verdiene “14”, “13”, “14”, “12”, “11”, “10” og “9” har blitt lagret i “Points” -kolonnen.

Verdiens lengde for kolonnene er 7 i dette tilfellet. “PD.DataFrame () ”-metoden vil generere en DataFrame med disse spesifiserte kolonnene og verdiene. For å lagre denne DataFrame, har vi laget en DataFrame -objekt “test” og tildelt det utfallet produsert fra å påkalle Pandas dataaframe konstruktørmetode. Fra nå av kan vi få tilgang til dette dataframet ved å bruke "test" -objektet som et dataaframe -navn for alle illustrasjonene. Til slutt vises DataFrame på skjermen ved å bruke Pythons metode “Print ()”.

Kommandoen "Run File" vil få oss den resulterende DataFrame presentert i Python -konsollen.

Eksempel 1: Velge rader i en dataaframe basert på kolonneverdiene

Den første metoden, for å velge rader i en DataFrame er den boolske indekseringsteknikken. I denne metoden sjekket vi hver rad som "sann eller usant" i DataFrame for en bestemt definert kolonnetilstand. Uansett hvilken rad (er) samsvarer med tilstanden den gir "sant" og vil bli valgt som utgang.

Syntaks for denne metoden for å utføre programmet er:

For å lære den praktiske demonstrasjonen, la oss se på disse enkle trinnene. Vi må skrive det som DataFrame -navnet; abonnementsoperatør; Og innenfor de firkantede parentesene, skriv kolonnenavnet og tilstanden. Dataframe, som vi nevnte ovenfor, er “Test” og kolonnen vi har valgt å bruke tilstanden på er “Marks”. Vi har brukt en betingelse for å velge rader der kolonnenavnet er "merker" og verdien er lik "92". Så vi må ganske enkelt trekke ut rader basert på kolonne “Marks” -verdien “92”. For å lagre resultatet har en variabel blitt generert og kalt “Dummy”. Vi vil gi denne variabelen “Dummy” til “Print ()” -metoden for å vise innholdet på terminalen når det påberopes.

Utgangen viser oss 2 rader som er valgt fra DataFrame etter å ha sjekket tilstanden. Du kan se at tilstanden vi spesifiserte var utvalgte rader der merker er "92". Her har vi 2 poster med alle dataene som vises hvis merker er "92". Den første er "Albert" og den andre er "Ronald".

Eksempel 2: Velge rader i en dataaframe basert på kolonneverdiene som bruker LOC [] -egenskapen

Den andre metoden vi bruker for å hente radene ved å bruke kolonneverdiene er “DF.loc [] ”med“ DF.verdier ”egenskap.

Vi har brukt “DF.verdier ”egenskap for å sjekke en betingelse. Kolonnen vi har valgt for å sjekke verdier er “St_name” fra “Test” DataFrame. Tilstanden vi har satt her er å velge raden der "ST_Name" -kolonnen er lik "Ronald". For å lagre resultatet har vi opprettet en variabel "kopi". Så denne egenskapen vil sjekke tilstanden og oppdage radene som holder de nødvendige dataene.

Deretter ansatte vi DataFrames "loc []" -egenskap. Navnet på DataFrame som "test" med "loc []" -egenskapen leveres. Mellom de firkantede parentesene i denne attributtet har vi passert variabelen "kopi" som har radene som samsvarer med den spesifiserte tilstanden. “DF.Loc [] ”-egenskapen vil ganske enkelt hente radene som" kopien "-variabelen holder. For å bevare utfallet, har vi en variabel "data". For å se den endelige utgangen, "skrive ut()" Metoden påberopes med "data" -variabelen som en parameter for å vise innholdet.

Vi får en rad som utgangen som oppfyller den definerte tilstanden. Siden det bare er en oppføring med "Ronald" -verdien i kolonnen "St_name" i DataFrame.

Eksempel 3: Velge rader i en dataaframe ved å bruke kolonneverdiene som bruker DF.spørring () funksjon

En annen teknikk for å filtrere rader i en dataaframe basert på kolonneverdier er ved å bruke "spørsmål()" metode. Denne metoden tar i uttrykket som vil returnere en boolsk verdi, sjekker tilstanden på alle radene i en dataafram, og returnerer en dataframme med bare de radene som oppfyller tilstanden.

Vi har påkalt “DF.spørring () ”-funksjon. Her er “DF” DataFrame som heter “Test”. Mellom parentesene til metoden har vi spesifisert tilstanden. Uttrykket vi har definert er fra “ST_ID” der ID er lik “10”. "Query ()" -funksjonen vil trekke ut alle radene i "Test" DataFrame som samsvarer med denne tilstanden. Resultatet vil bli lagret i "Extract" -variabelen. Til slutt vises dataene som er lagret i "Extract" -variabelen ved å kalle metoden “Print ()”.

Utgangsskjermen viser en enkelt rad fordi det bare er en post tilknyttet "ST_ID" som "10". Du kan se at posten er funnet på “0” -indeksen som er den første raden i DataFrame.

Eksempel 4: Velge rader i en dataaframe ved å bruke kolonneverdiene ved bruk av ISIN () -metoden

Den siste strategien vi diskuterer her for å velge rader er metoden “Isin ()”. Det tar en serie eller liste over verdier og trekker ut rader basert på listens verdier.

Vi har definert en liste over verdier som "iterasjon" som har disse verdiene: "Adam", "Elsa" og "George". “DF.Isin () ”-funksjonen påberopes. Dataframets navn og kolonnenavnet leveres med "ISIN ()" -metoden. Mellom seler er listen “iterasjon” gitt. Så den vil sjekke "Test" DataFrames kolonne "St_name" for verdiene som er lagret på listen. Hvis den finner verdiene, vil den ganske enkelt returnere den valgte raden. Vi bevarte resultatet i "Store" -variabelen og viste den ved hjelp av "print ()" -metoden.

Dette gir oss tre rader som matchet verdiene i listen.

Konklusjon

Å velge spesifikke rader etter verdier i en dataaframe er en nyttig teknikk. Vi har demonstrert en rekke metoder for å hente radene basert på kolonneverdiene. Vi fikk deg først til å lære konstruksjonen av et datafram, så utdypet vi 4 eksempler ved å bruke forskjellige strategier for å hente ut rader. Alle illustrasjonene er samlet og henrettet på Spyder.