Pandas DataFrame Velg rader etter tilstand

Pandas DataFrame Velg rader etter tilstand
“I“ Python ”, har vi et Open_Source -bibliotek som er“ Pandas ”-biblioteket. I "Pandas" kan vi gjøre flere oppgaver enkelt og effektivt. Som vi vet at vi kan lage dataframmer i “Pandas” ved å bruke “Pandas” -metodene. Så etter å ha opprettet DataFrames, kan vi velge rader ved å bruke betingelser. Vi kan bruke forskjellige metoder som "pandaer" gir for å velge radene til DataFrame, avhengig av tilstanden som vi har lagt til i "Pandas" -metodene. Vi vil diskutere alle metoder som vi kan bruke for å velge radene i DataFrame i "Pandas", i denne guiden.”

Metoder for å velge rader av DataFrame etter tilstand

"Pandas" gir fire forskjellige metoder for å velge radene til DataFrame etter tilstand. Disse metodene er her:

  • Dataramme.spørring () Metode.
  • Dataramme.Loc () Metode.
  • Dataramme.Isin () -metode.
  • Dataramme.Filter () Metode.
  • DataFarme.iloc () -metode.
  • Dataramme.Bruk () Metode.

Alle disse metodene brukes i "Pandas" for å velge radene til "Pandas" DataFrame. Vi legger også tilstanden i disse metodene, og de vil velge radene avhengig av den tilstanden. Vi vil bruke disse metodene og velge rader i denne guiden og forklare hver kode i detalj her.

Eksempel nr. 01
Verktøyet vi vil bruke i denne guiden for å utvikle “Pandas” -koden er “Spyder” -verktøyet. Vi genererer "pandas" -koden ved å importere modulene til "pandaer" og så utvikler vi en liste som heter "Matric_class" -liste som har "navn" i den som inneholder navn på studentene som "Peter, George, Bromley, Samuel, Leo , Farnham, og Lily ”.

Etter dette legger vi til noen merker av disse studentene i forskjellige fag, og disse fagene er "engelsk, datamaskin, fysikk, kjemi og biologi". I “Engelsk” har vi lagt til “46, 32, 54, 71, 68, 31 og 54”, i “Computer”, la vi til “82, 23, 48, 34, 32, 15 og 33”, deretter kommer “Fysikk”, der vi har lagt til “29, 31, 27, 55, 29, 20 og 32”, deretter “Kjemi” er der som inneholder “59, 32, 57, 85, 59, 55 og 81 ”,” Biologien ”er neste der merkene er“ 90, 31, 84, 95, 98, 72 og 77 ”. Dette er "Matric_class" nestede listen.

Nå må vi konvertere denne nestede listen til DataFrame, så for dette formålet har vi brukt “Pandas” -metoden, som også vises nedenfor “PD.Dataramme". Denne metoden endrer listen "MATRIC_CLASS" i DataFrame som heter "MATRIC_CLASS_DF". Denne "matric_class_df" blir deretter satt i "print ()" -metoden. Her er DataFrame fullført og også gjengitt.

Nå må vi utføre denne koden. Så når vi jobber med "Spyder" -verktøyet, er det derfor vi trykker på "Kjør" -ikonet for dette verktøyet for utførelse; Etter dette blir følgende utfall gjengitt der DataFrame er gjengitt. Nå vil vi velge noen rader fra denne DataFrame ved å bruke "Pandas" -metoden avhengig av noen forhold, som vi vil legge til i "Pandas" -metoden.

Her filtrerer vi noen rader ved å legge DataFrame -navnet, og tilstanden vi har lagt til i denne metoden er at "navnet" er lik "Bromley", så det vil være raden der studentnavnet er "Bromley" og lagre "Bromley" -rekken i "Resultat_df". Resultatet av “Bromley” er nå gjengitt på skjermen ved å sette den i “Print ()”.

Den komplette raden vises her, som inneholder dataene fra "Bromley". Vi har filtrert denne raden fra DataFrame ved å sette tilstanden i "Pandas" -metoden.

Eksempel # 02
Vi bruker "matric_class_df" igjen, og her velger vi andre rader enn "Bromley". Så tilstanden vi legger her er at "navnet" på studenten ikke er lik "Bromley". Den vil velge eller filtrere alle rader der navnet på studenten ikke er "Bromley" og også gjengir alle rader bortsett fra raden som inneholder "Bromley" -navnet i "Navn" -kolonnen.

Her velger den alle rader fra den originale DataFrame bortsett fra 2 -indeksraden fordi, i denne raden, "Navn" -kolonnen inneholder "Bromley". Så den ignorerer den raden og velger alle andre rader i DataFrame, og gjengir dem her.

Eksempel # 03
Nå lager vi en ny liste for det nye eksemplet her der listen opprettet er "ABC_LIST". I kolonnen "Navn" legger vi til "James, Milli, Farnham, Lily, Leo, Samuel og Fuller". Deretter har vi “kodene”, der vi setter inn “ABC19, ABC34, ABC39, ABC45, ABC59, ABC62 og ABC15”. Så kommer "måneden", som inneholder "juli, april, juli, august, september, juli og oktober". “Enhetene” har “19, 14, 9, 16, 15, 10 og 13”. Denne listen blir konvertert til DataFrame, og deretter blir DataFrame gjengitt.

Etter dette bruker vi “DataFrame.spørring () ”-metode for å velge noen rader. Vi setter tilstanden som er "måned == juli", noe som betyr at den velger alle de radene der "måneden" er "juli". Disse radene lagres i "ABC_DF2", og så viser vi de radene som inneholder "juli" -måneden ved å bruke "print ()"

Den originale DataFrame inneholder 7 rader, og vi velger de radene der måneden er "juli", så bare tre rader er til stede i denne dataaframmen, som inneholder "juli", og disse tre radene er også gjengitt separat etter den originale DataFrame.

Eksempel nr. 04
DataFrame som er opprettet i dette eksemplet heter “Patient”, som inneholder “Navn, City, Sittings_no og Fee/Sitting” i det. Navnene på pasienter er i "navnet", som er "James, Noah, Peter, Bromley og Samuel". Byene til disse pasientene er satt inn i “City”, som er “New York, Birmingham, New York, Los Angeles og Banglore”. Så legger vi antall sitter i "Sittings_no", som er "2, 6, 4, 4 og 3". Vi setter også inn perstitingsgebyret til disse pasientene, som er “6000, 6000, 6900, 7400 og 6300”.

Etter dette blir "pasient" -listen også endret til "Patient_df", som er DataFrame her. Så skriver vi ut “Patient_df,” og etter utskrift, flytter vi for å bruke “LOC” -metoden her, som hjelper oss med å velge radene. Tilstanden vi har satt her er at den velger de radene der "sittende_no" til pasienten er "4" og viser også disse radene på terminalen.

Bare to rader er der i DataFrame der "sittende_no" til pasienten er "4", og du kan også merke disse radene i utgangen nedenfor.

Eksempel nr. 05
Nå gir vi et annet eksempel her, og vi oppretter direkte DataFrame “Teacher_DF” her der kolonnene vi har lagt til er “Exam_Code, Examiner_name, Examiner_duty_num, eksamen_room_no og eksamen_block”. Vi setter også inn data i alle kolonner på samme måte som vi har forklart i våre tidligere koder. Så gjengir vi også “Teacher_df”, her filtrerer vi rader ved hjelp av “ISIN ()” -metoden. Vi initialiserer en "data" -variabel med "A og C" og plasserer deretter "data" i "ISIN ()" -metoden og setter også kolonnens navn der den sjekker disse dataverdiene. Kolonnenavnet er "Exam_Block" her, så det vil sjekke kolonnen "Exam_Block" og velge de radene der "Exam_Block" er "A" eller "C" og deretter skrive ut disse radene der denne tilstanden er fornøyd.

Denne "ISIN ()" -metoden velger alle kolonnene der "Exam_Block" er "A" eller "C". I denne Dataframe vises bare fem rader som tilfredsstiller denne tilstanden, og disse vises også her.

Konklusjon

Denne guiden presenterer konseptet "å velge DataFrame -radene etter tilstanden i pandaer". Vi har diskutert forskjellige metoder som brukes til å velge radene i pandaer avhengig av noen forhold. Vi har brukt fire metoder i kodene våre her og forklarte hver av dem i detalj. Vi har vist hvordan vi setter tilstanden i disse metodene og hvordan disse metodene kommer tilbake eller velger radene til DataFrame. Vi har diskutert at når vi setter tilstanden i en hvilken som helst metode som vi har forklart her for å velge radene, så sjekker den denne tilstanden og velger disse radene fra DataFrame, som tilfredsstiller den gitte tilstanden. Vi har vist utdataene sammen med kodeskriptet i denne guiden.