Pandas DataFrame Groupby

For å gruppere dataene i kategorier og bruke en funksjon på kategoriene, bruker vi Pandas “GroupBy ()” -metoden. Effektiv dataggregasjon er også hjulpet av det. Groupby () -funksjonen brukes til å dele dataene i grupper basert på noen spesifikke kriterier. Objekter med "pandas" kan deles langs hvilken som helst akse. Vi kan si at i en "groupby ()" -metode er objektet delt, en funksjon blir brukt, og resultatene deres blir kombinert. Store data kan grupperes ved hjelp av “Groupby ()” -metoden, og operasjonene kan også beregnes på disse gruppene. Denne guiden vil forklare metoden “Groupby ()” i detalj og vil gi deg riktige retningslinjer for “GroupBy ()” -metoden.

Eksempel # 01:

Vi implementerer også denne "Groupby ()" -funksjonen i "Pandas" -koden i denne guiden, så du vil lære raskere om "Groupby ()" -funksjonen. Vi importerer "pandaene som PD" først i "Spyder" -verktøyet og genererer deretter en liste som heter "Data" her og setter inn litt informasjon i den. Vi legger navnet "Team" som overskriften for spalten og lagene vi legger til det er "Riders, Riders, Devils, Devils, Kings, Kings, Kings, Kings, Riders, Royals, Royals, Riders". Den neste kolonnen vi oppretter her er kolonnen "År", der vi legger til årdata som "2014, 2015, 2014, 2015, 2014, 2015, 2016, 2017, 2016, 2014, 2015, 2014".

Nå, dette er listen vår, og vi endrer denne "data" -listen til DataFrame. Så for dette har vi brukt “PD.DataFrame () ”-funksjonen, som konverterer denne listen til“ Pandas ”DataFrame. DataFrame som er opprettet her er lagret i "DF" -variabelen, og vi skriver den ut ved å plassere "DF" som parameteren til "Print ()". Nå er hovedmålet med å skrive denne koden å implementere “groupby ()” -metoden på disse dataene. Vi bruker "groupby ()" -metoden og bruker den på "år". Dette vil gruppere dataene basert på årene vi har satt inn. Etter gruppering bruker den “Count ()” -metoden for denne gruppen. Det vil telle de samme årene og deretter lagre dem i "DF1". Etter dette har vi "trykket" som vil gjengi dette.

For å få utdataene, klikker du bare på "Kjør" -knappen på "Spyder" -appen. DataFrame som inneholder team og år blir gjengitt først, og deretter grupper den de samme årene, teller dem og viser tellernummeret foran hvert år gruppe. Som det grupper året "2014" og viser "5", som betyr at "2014" -året vises fem ganger i dette DataFrame. Denne gruppen gjøres fordi vi bruker “groupby ()” -metoden på denne dataaframe.

Eksempel # 02:

Etter å ha importert “Pandas som PD”, genererer vi direkte DataFrame med navnet "Animals", og den inneholder to kolonner: "Animal" og "Max Speed". Kolonnen “Animal” har “Sparrow, Falcon, Parrot, Parrot, Sparrow og Falcon” i den. Kolonnen “Max Speed” inneholder “210, 30, 37, 24, 260 og 390”. Det skaper en dataaframe som inneholder disse kolonnene, da vi har brukt “PD. DataFrame () ”-metode her.

Så viser vi dette "dyret" dataaframe. Etter dette bruker vi “Groupby ()” -metoden på “Dyr” DataFrame og setter inn “Animal” -kolonnen som parameter. Dette vil gjøre grupper avhengig av de samme dyrenavnene. Deretter bruker vi også "Mean ()" -funksjonen her, som vil finne gjennomsnittet av de gruppene som er opprettet her, og vi initialiserer "gruppen" -variabelen med denne "Groupby ()" -metoden, så resultatet vi får etter gruppering vil bli lagret i den. Vi ønsker også å vise resultatet som er lagret i "gruppe", så for dette bruker vi igjen "print ()" -funksjonen.

Dyrene og deres maksimale hastigheter vises i den første DataFrame uten å gruppere. Etter dette brukes "groupby ()" -funksjonen her, og den grupper alle dyr med samme navn, og finner deretter gjennomsnittet og viser dem nedenfor.

Eksempel # 03:

Vi oppretter en ny liste i denne koden, som er "Summer_Courses" -listen, og legger til fire unike kolonner til den. Kolonnens overskriftsnavn er "emne, sub_fee, dager og dis_amount". Vi legger også til fagnavnene, faggebyrene, kursets varighet i dager og diskonteringsbeløp på gebyret i disse kolonnene. I "emnet" legger vi til her "webutvikling, wengineering, CSS, HTML, CSS, Web Development, CSS, HTML, og også NA". “Sub_fee” inneholder gebyret som er “22000, 25000, 23000, 24000, 25000, 26000, 25000, 25000, 22000 og 15000”. Dagene vi kommer inn her er “30, 50, 55, 40, 60, 35, 30, 50 og 40”, og også “Dis_amount” -kolonnen inneholder “1000, 2300, 1000, 1200, 2500, ingen, 1400, 1600, og 0 ”.

Nå må vi endre denne listen til DataFrame. Så for å konvertere listen til DataFrame, bruker vi “PD.DataFrame () ”-funksjonen og navngi DataFrame“ Summer_Course_df ”. Vi gjengir også “Summer_Course_df” her. "Summer_Course1" -variabelen initialiseres ved hjelp av "Groupby ()" -teknikken slik at resultatene av gruppering blir lagret i den. "Groupby ()" -metoden blir deretter brukt på "emnet" -kolonnen.

Som et resultat vil grupper basert på lignende fagnavn opprettes. "Sum ()" -funksjonen blir deretter brukt til å beregne summen av faggruppene som nettopp ble dannet. Denne "sum ()" beregner summen av gebyrer, dager og rabattbeløp for de samme fagene. Vi ønsker også å vise utfallet som ble lagret i “Summer_Course1”, så vi bruker nok en gang “Print ()” -funksjonen.

Her kan du legge merke til at det gjengir alle emner separat i den første dataaframe. Deretter kombinerer den de samme fagene eller lager grupper med samme emnavn og viser også samme navnemne en gang. Den bruker sumfunksjonen på sub_fee, dager og dis_amount kolonner med de samme emnetavnene og gjengir summerene sine her.

Eksempel # 04:

I denne koden bruker vi dataframmen til det forrige eksemplet, men her utfører vi "groupby ()" -funksjonen på flere kolonner. Vi passerer to navn på kolonner til "Groupby ()" -funksjonen, som er "emne" og "dager". Plasser deretter "sum ()" som vil utføre summeringen på gruppene som er opprettet her og lagre dem i variabelen "Summer_Courses2". Etter dette gjengir vi “Summer_Courses2” på slutten.

Dette utfallet viser at det utfører "Groupby ()" -funksjonen i både "emnet" og "dager" kolonner og gjengir resultatet her etter gruppering.

Konklusjon:

Du kan benytte deg av denne guiden for å studere hvordan du bruker "groupby ()" -funksjonen i "pandaer" og også lære om syntaksen til denne "groupby ()" -metoden her. Vårt hovedmål er å gi deg en kortfattet og forståelig forklaring av ideen om “Groupby ()” -metoden i “Pandas”. Vi har forklart at denne metoden hjelper oss med å lage grupper avhengig av noen spesifikke kriterier. Vi har gjort fire eksempler i denne guiden der vi lager grupper ved å bruke metoden “Groupby ()” i “Pandas”. Etter å ha lest denne opplæringen, vil du ha en beskjeden grad av kunnskap, hvor du kan gå videre til en overlegen scene.

Docker

Hvordan er volumene definert i Docker Compose Yaml?

Volumene er definert ved hjelp av Volum -tasten i Docker Compose Yaml -filen. Brukere kan definere D...

Tobias Andresen

Golang

Introduksjon til Golang -programmeringsspråk

Golang er et åpen kildekode-programmeringsspråk utviklet av Google. Følg denne artikkelen for å lære...

Oskar Fossum

Linux -kommandoer

Hvordan få versjonen av CUDA installert på Linux

Omfattende opplæring om hvordan du finner ut versjonene av CUDA som støttes av de for tiden installe...

Simen Ødegård