Pandas AGG Count

Pandas AGG Count
I “Pandas” kan vi lage DataFrames som inneholder Rows_and_columns. Store mengder tabelldata blir generelt undersøkt og organisert ved hjelp av Pandas -programmet. "Pandas" gir oss flere metoder, og en av dem er "tellingen", vi kan se hvor mange verdier det er for hver kolonne i DataFrame ved å bruke tellemetoden.

Tellemetoden brukes til å lokalisere ufullstendige kolonner. Derfra kan du velge om du vil hoppe over kolonnene i prosessene dine, eller om nødvendig gi dem standardverdier. I denne guiden vil vi undersøke Pandas Count og Value_Counts som er to måter å vurdere DataFrame.

Eksempel nr. 01

Vi starter med å bruke "Spyder" -appen. Dette vil hjelpe oss med å gjøre “Pandas” -kodene. På tekstredigereren starter vi vår første kode ved å importere "Pandas som PD". Denne "PD" brukes til å få tilgang til “Pandas” -metodene vi ønsker. Nå trenger vi ikke å skrive hele navnet “Pandas” for å få tilgang til funksjonen. I stedet skriver vi bare “PD”.

Vi oppretter deretter en variabel og initialiserer den også ved å legge til noen data. Vi legger til dataene i kolonnen ved å angi det første kolonnenavnet som "Navn" og navnene vi legger til her er "Ray", "James", "Mole", "Smith", "Jay", "Milli", "William" , og “Rick”. Den neste kolonnen heter “Emner” som inneholder emne -navn som “Maths”, “Economics”, “Science”, “Maths”, “Statistics”, “Statistics”, “Statistics” og “Computer”.

Under variabelen lager vi “nummer” og bruker “PD.DataFrame () ”-metode. Vi bruker "PD" for å få Pandas -metoden "DataFrame". Vi endrer "kurs" -dataene til "DataFrame" og oppdaterer navnet som "nummer". Deretter hjelper metoden “Print ()” med å vise DataFrame. Under dette bruker vi først "Groupby ()" -metoden. Det gjør oss i stand til å dele opp dataene dine i mange kategorier, slik at du kan kjøre beregninger for en grundigere analyse. Vi "GroupBy" denne dataaframmen ved å sette "emner" og deretter bruke "count ()" -metoden.

Count () -funksjonen gir en serieenhet med utfallet for hver rad etter å ha talt antall ikke-tomme verdier for hver rad. Vi legger begge metodene i "print ()" -funksjonen slik at den vises på terminalen.

Den viser den originale DataFrame først og deretter "Groupby" -fag og teller antallet av emnet. Den legger også til de samme emnene og skriver det her. I dette DataFrame inneholder to kolonner “Matematikk” -faget slik at det viser “Maths” “2” og “Statistics” -emnet “3”.

Eksempel # 02

Nå importerer vi “Pandas” og genererer deretter data og lagrer disse dataene i variabelen “Data123”. Vi har "ansatt" og "adresse" kolonner her. I "ansatt" setter vi inn navn på ansatte som er "Ray", "James", "Mole", "Smith", "Jay", "Milli", "William" og "Rick". I "adressen" setter vi adressene til de ansatte som er "London", "Amerika", "Sodan", "London", "Sodan", "Sodan", "Amerika" og "Amerika".

Deretter erklærer vi og initialiserer også "samme" som er et variabelt navn og initialiserer det med “PD.Dataramme". Vi passerer også parameteren “Data123” til denne “PD.Dataramme". Vi bruker metoden “Value_Count ()” nedenfor. Verdien teller teknikk er bedre. Denne teknikken vil gi det totale antallet forskjellige verdier for en gitt kolonne. Vi gir "adresse" -kolonnen her.

Vi har navnet på DataFrame som er "samme" og legger til navnet på kolonnen som er "adresse". Skriv deretter "Value_Count ()" -funksjonen eller metoden. Vi legger til denne fulle uttalelsen i "print ()" -metoden slik at den også gjengis på konsollskjermen.

Etter å ha gjengitt DataFrame i dette utfallet, teller det de samme adressene til de ansatte og viser dem nedenfor og fjerner navnet på de ansatte eller fjerner "ansattes" -kolonne. Det viser bare adressen og tallene deres som er til stede i denne DataFrame.

Eksempel # 03

Dataene her er satt inn i fem kolonner. Vi oppretter en dataaframe som heter “Studenter” og kolonnene vi har er “Roll_no”, “S_name”, “S_instructor”, “S_Course” og “Credit_hrs”. I kolonnen "Roll_no" har vi "A1, A2, A3, A4 og A5". Nå, i neste kolonne “S_name”, legger vi til navnene på studentene “Smith, Noah, Joseph, Mishi og William”. Deretter legger vi instruktørens navn: “Peter, Taylor, James, Robert og Olivia”. Kursene vi setter inn her er "engelsk, britisk, engelsk, arabisk og engelsk" ".

For kolonnen “Credit_hrs” legger vi til “4, 5, 4, 3 og 4” til den. Vi endrer alle disse dataene i DataFrame og navngir denne DataFrame eller lagrer denne DataFrame i "Student" -variabelen. Deretter bruker vi “Print ()” som gjengir denne dataaframe. Under dette plasserer vi “Groupby ()” og “Count ()” -metodene. Og legg "s_couse" i det slik at det teller kursene og viser dem.

Vi har 1 “arabisk” kurs, 1 “britisk” kurs og 3 “engelsk” -kurs her i dette Dataframe. Vi får dette antallet ved å bruke "Count ()" -metoden.

Eksempel nr. 04

I dette eksemplet inneholder DataFrame som er opprettet "upload_date" der vi legger til noen datoer som er lagt til fem datoer. Sett deretter inn en annen kolonne “Viewer_ids” der vi legger til ID -ene til seerne som “V1, V2, V3, V4 og V5”. Vi gir navnet "Video" til denne DataFrame. Bruk “Groupby” først som grupper dataene basert på “Upload_Date” og bruker deretter “Count ()” som vil telle disse dataene basert på “Upload_Time”. Til slutt, vis resultatet.

Dette er resultatet av denne koden, og den teller dataene basert på "opplastingstiden" for videoene. Videoene som lastes opp på “2022-07-21” er to i totaltellingen.

Eksempel nr. 05

"Studien" er variabelen som inneholder data som er i kolonne- og radformer. Kolonnenavnene er "kurs, c_fee og c_duration". Kolonnen "Courses" har "Pandas, Ubuntu, Linux, Python, Pandas, Linux, Spark, Python, Ubuntu, Python og Python" i den. Kolonnen “C_fee” inneholder “22000, 25000, 23000, 24000, 26000, 25000, 25000, 22000, 25000, 24000 og 24000”. Kolonnen "C_Duration" inneholder data som er "30 dager, 50 dager, 35 dager, 40 dager, 60 dager, 35 dager, 30 dager, 50 dager, 50 dager, 40 dager og 40 dager".

Endre dem i DataFrame og skriv også ut DataFrame. “Groupby ()” “Courses and C_Duration” og telle dem ved å bruke “Count ()”. Disse metodene "Groupby" og "Count" vil gruppere dataene basert på kolonnene for kurs og varighet. Beregn deretter tellingen.

Her grupper det dataene på kurs og deres varighet og teller deretter disse kursene ved å bruke metoden “Count ()”.

Konklusjon

Denne guiden er på konseptet "AGG Count" -funksjonen i "Pandas.”Vi har beskrevet hvordan“ AGG Count ”-funksjonen i pandaer brukes til å telle. "AGG Count" -metoden har blitt brukt på de fem tilfellene vi har etablert.