Pandas DataFrame -spørring

Pandas DataFrame -spørring
Python -pakken gjør det til et flott språk for å utføre dataanalyse. Et av programmene som tillater anskaffelse og analyse av data betydelig enklere er pandaer. Vi har en dataaframe og vi filtrerer dataene i henhold til våre behov fra denne dataaframe i pandaer. Dataanalysen krever mange filtreringsteknikker. Det er mange måter å filtrere dataene fra den spesifiserte DataFrame ved hjelp av Pandas -metodene. En av dem er metoden “Query ()” som hjelper oss med å filtrere noen data fra DataFrame. Vi kan spørre DataFrame ved å bruke "Query ()" -funksjonen i pandaer. Et spørringsuttrykk sendes til "Query ()" -funksjonen, og det returnerer resultatet av den returnerte spørringsuttalelsen. Vi vil bruke metoden “Query ()” i denne guiden, og vi vil forklare hvordan det hjelper i pandaer å filtrere de ønskede dataene fra DataFrame.

Syntaks:

Dataramme.spørring (expr, inplace = falsk, ** kwargs)

Her setter vi tilstanden som den første parameteren for “Query ()” -metoden. Inplegen er valgfritt. Hvis vi ikke legger til dette, er standardverdien "falsk" som justeres automatisk. Vi kan også sette den til "True" som oppdaterer DataFrame.

Nå flytter vi for å bruke metoden “spørring ()” i pandaer i denne guiden, og vi vil forklare det her.

Eksempel 1:

Vi demonstrerer metoden “spørring ()” i pandaer i denne guiden. Vi bruker "Spyder" -appen for å skrive Pandas -koden. Vi er klar over at vi må importere noen Pandas -metoder som "PD". Vi utvikler “list_data” og plasserer “p_name” og “p_age” i “list_data”. “P_name” inneholder “Smith, Oscar, Mary, Theo, Teddy og John”. “P_age” inneholder “50, 33, 56, 29, 45 og 30” i den. Vi endrer "list_data" nestet liste i "my_df" dataaframe. Vi endrer det i DataFrame fordi vi må bruke metoden “spørring ()” på DataFrame. Så denne "my_df" er opprettet her som også vises siden vi setter den inn i følgende "print ()" -funksjon.

Nå bruker vi metoden “Query ()” for å trekke ut noen data. Vi får dataene hvis alder er større enn 30. For dette legger vi til tilstanden i metoden “Query ()” og bruker denne metoden inne i utskriften. Resultatet gjengir også for oss. Nå filtrerer det dataene hvis alder er større enn 30 og viser dem på utgangen.

Det er to metoder for å kjøre ønsket kode når vi sammenstiller og kjører den i "Spyder". En av dem er å trykke på “Shift+Enter”. Den andre metoden er å bruke "Spyder" -appens "Run" -ikon for å utføre koden. Vi oppnår den spesifiserte utdata ved utførelse. For det første blir den komplette DataFrame gjengitt. Deretter filtrerer vi dataene fra denne dataaframe hvis alder er større enn 30. De filtrerte dataene vises også i det følgende. Vi filtrerer disse dataene bare ved å bruke metoden “spørring ()” i pandaer.

Eksempel 2:

Vi oppretter en "Player_Data" nestet liste og legger til en "Player_name" -kolonne der vi har "Emma, ​​Samuel, Robert, Smith, Noah, Jessica og Harper". Deretter legger vi til "Player_age" -kolonnen som har "22, 26, 21, 25, 29, 24 og 28" i den. Deretter kommer "score_1" -kolonnen som inneholder "29, 28, 16, 17, 35, 20 og 15". Kolonnen “Score_2” inneholder “28, 45, 49, 62, 70, 55 og 40”. “Score_3” inneholder “24, 13, 59, 62, 72, 64 og 66”. Og det siste vi har er "score_4" -kolonnen som har "38, 44, 69, 72, 81, 71 og 79". Denne "Player_Data" -listen blir omgjort til DataFrame ved hjelp av Pandas -metoden. Vi navngir denne dataaframe som "player_df".

Når vi legger til "Player_df" til følgende "print ()" -funksjonen og vises den. Nå inkluderer vi tilstanden i "spørring ()" -funksjonen og bruker denne metoden i Print () -metoden for å skaffe dataene hvis "score_1" er mer enn 20. Vi legger det i "trykk" som også gjengir resultatet for oss. Dataene hvis "score_1" er mer enn 20 blir nå filtrert og vist på konsollen.

Som du kan se, er det bare tre rader der "score_1" er større enn 20. Så denne "spørringen ()" -metoden gjengir disse dataene på skjermen etter å ha vist hele DataFrame.

Eksempel 3:

"Fruit_data" er opprettet. "Fruit_name" og "Fruit_Quantity" blir lagt til. "Apple, oransje, mango, eple, banan, eple, litchi og eple" er oppført under "Fruits_name". Mengdene deres som er “5 kg, 7 kg, 2 kg, 4 kg, 5 kg, 7 kg, 2 kg og 4 kg” er listet opp under “Fruits_quantity”. Vi forvandler den nestede listen “Fruits_data” til DataFrame “Fruits_df.”Denne“ Fruits_df ”er dannet her og vises også siden vi skriver den inn i følgende“ print () ”-funksjon. Nå filtrerer vi noen data ved hjelp av “Query ()” -teknikken. Vi ønsker å filtrere "Apple" fra denne DataFrame, så vi legger tilstanden der "Fruits_name" er lik "Apple". Vi viser også "eplene" på terminalen.

I dette utfallet, etter å ha gjengitt hele DataFrame, blir radene som inneholder "eple" filtrert ut. De filtrerte dataene vises også i følgende illustrasjon. Vi bruker Pandas Query () -metoden for å filtrere disse dataene.

Eksempel 4:

Vi utvikler "Resultat_9th" nestede listen etter import av Pandas -metoden. Vi legger til en "Navn" -kolonne til vår "Resultat_9th" nestede liste og fyller den med "Samuel, George, James, Melissa, William, Farnham og Smith". Kolonnen “Subj1” inneholder verdiene “47, 30, 54, 71, 68, 16 og AB”. “Subj2” blir deretter lagt til med følgende verdier: “81, 23, 48, 34, 21, 15 og AB”. Kolonnen “Subj3” konserner følgende verdier: “29, 14, 28, 55, 29, 27 og AB”. Kolonnen “Subj4” inneholder følgende verdier: “59, 27, 58, 75, 59, 17 og AB”. “Subj5” inneholder følgende verdier: “90, 4, 82, 85, 95, 22 og AB”. Deretter legger vi også til "Pass/Fail" -kolonnen som inneholder "Pass" og "Fail" -statusen til studentene.

Vi bruker Pandas -teknikken her for å konvertere denne "Resultat_9th" -listen til en DataFrame som vi kalte “Resultat_9th_df ”. “Resultat_9th_df ”er gjengitt som et resultat av vårt tillegg til følgende“ print () ”-metode. Nå filtrerer vi dataene til studenten hvis navn er “James”. Vi legger navnet som tilstanden til "spørringen ()" -metoden. Vi plasserer kolonnenavnet "Navn" og tilsvarer det "James". Deretter lagrer vi dataene fra "James" -student i "DF2". Deretter plasserer vi denne "DF2" i "Print" for å vise dataene fra "James".

Den første DataFrame inneholder resultatet av 7 studenter som vi legger til DataFrame. Vi henter ut "James" -dataene fra denne DataFrame. På denne måten kan vi enkelt trekke ut eller filtrere dataene vi ønsker å få fra DataFrame i Pandas.

Konklusjon

Denne guiden er her for å utforske “Query ()” -metoden i pandaer. Vi demonstrerte forskjellige eksempler i denne guiden og forklarte hver av dem i detalj for å gi deg en riktig forståelse av "spørringen ()" -metoden. Vi diskuterte bruken av metoden “Query ()” for å filtrere de spesifikke dataene fra DataFrame. Til din fordel er hvert eksempel i denne guiden og syntaks for denne "spørringen ()" -metoden nøye presentert her. Du skal kunne lære dette "spørring ()" -konseptet i pandaer ved hjelp av denne guiden.