Pandas Groupby Sum

Pandas Groupby Sum
Pandas gir en rekke nyttige muligheter for å hjelpe oss med å konvertere dataene til ønsket format. En av dem er Groupby -funksjonen som deler radene til en dataaframe i grupper basert på verdiene til bestemte kolonner. Pandaer er det beste verktøyet for denne saken siden de kan håndtere den uforutsigbare naturen til faktiske data. Pythons “Groupby ()” -metode for Pandas er et sofistikert og nyttig verktøy. Det lar deg dele dataene dine i flere grupper og kjøre beregningene for mer nøyaktig analyse.

Pandas sum () -metode

Summen av verdiene for den brukerinnvilte aksen returneres av summen () -funksjonen. Hvis inngangsverdien er en indekseringsaks, legges alle verdiene i den kolonnen. Dette gjelder alle kolonnene. Dette resulterer i en serie som inneholder summen av hver kolonnes verdier. Du kan direkte bruke Pandas Sum () -metoden på de valgte kolonnene fra utgangen fra Pandas Groupby for å få summen eller totalen av hver gruppe. Denne metoden figurerer summen av rader og kolonner i inngangen.

Pandas GroupBy Sum () Metode

Det er noen følgende trinn for å finne Pandas Groupby Sum ():

  • Lag en datatype som er todimensjonal, størrelsesmutabel og kan inneholde store datasett.
  • Vis DataFrame -inngangen, DF.
  • Bruke DF. GroupBy Sum (), Finn Groupby Sum (). Denne funksjonen sorterer verdiene i en gitt kolonne. Verdiene til de andre kolonnene blir deretter sortert avhengig av de sorterte verdiene.
  • Summen for gruppen.

Syntaks for GroupBy Sum () -metoden

Denne grunnleggende syntaks brukes til å beregne summen av verdier i GroupBy Sum () -funksjonen.

Eksempel 1: Lag et Groupby -objekt ved hjelp av DataFrame

Vi trenger en programvare eller verktøy for å gi oss en plattform der vi kan kjøre dette programmet for å sette eksemplet Python -koder i praksis. Dermed brukes "Spyder" -verktøyet. Vi må åpne en ny fil når grensesnittet vises. På "Spyder" -verktøygrensesnittet har vi valgt alternativet "nye fil" for å utføre koden. Det gir oss også flere alternativer for å åpne filene. Derfor kan du også åpne den ved å bruke “Ctrl+N”.

Vi må importere disse “pandaene som PD” for å kjøre Pandas -koden. Kodenes "PD" -seksjon instruerer Python om å tilordne pandas aliaset til "PD.Dataramme.Groupby () ”som et funksjonsnavn som DataFrame“ Groupby () ”. Ved hjelp av Groupby grupperer vi Pandas DataFrame. Grouper -funksjonen velger den nødvendige kolonnen. Ved hjelp av en mapper eller et sett med kolonner, GroupBy () -funksjonene en DataFrame og returnerer et Groupby -objekt. Store datamengder i disse gruppene kan kombineres eller transformeres ved å bruke en rekke metoder og tilpassede funksjoner på Groupby -objekter.

Vi opprettet en dataaframe hvis størrelse er “6, 2” og kolonnenavnene er “Alfabet” og “Verdi”. I dette eksemplet er variablene vi har tatt “k”, “l” og “m”, og verdiene deres er “36”, “21”, “42”, “8”, “9” og “3”. For å anvende de samlede funksjonene, pandas 'groupby () "metodegrupper de lignende dataene i en gruppe. Denne metoden returnerer et DataFrame Groupby -objekt som har samlede metoder som sum og andre lignende. ”DF.Groupby ([“Alfabet”] ”, for eksempel, legger til alle verdikolonnene i en datafram sammen og beregner summerene sine. Bruken av “Gruppen.count () ”-metoden er å få tellingen for hver gruppe, ignorere ingen og NAN -verdiene for å gruppere radene etter kolonne. Dessuten fungerer det med data som ikke er flytende type. Med tellinger av verdiene for hver gruppe i en gruppe, konstruer du en ny serie eller DataFrame.

I denne koden brukte vi “Gruppen.sum()". Denne funksjonen sorterer verdiene i en gitt kolonne. Verdiene til de andre kolonnene blir deretter sortert avhengig av de sorterte verdiene. Dette oppretter en tabell hvis kolonnenavn er "alfabet" og "verdier" av alfabetet som er skrevet under alfabetet og skriver verdiene sine foran dem. Ved å bruke "gruppen.sum () ”, de lignende alfabetene kombinerer verdiene deres og får dem til å summen. Ved å bruke "gruppen.sum () ”, de lignende alfabetene kombinerer verdiene deres og får dem til å summen.

Etter å ha kjørt koden, viste den resultatet der "gruppen.count () ”-funksjon opprettet en tabell ved å telle“ alfabetene ”og“ verdiene ”. I neste linje samler den de lignende alfabeter og oppsummerer gruppene deres ved å bruke "gruppen.sum () ”-funksjon. Nå er verdien for “k” “99”, verdien for “L” er “17”, og verdien for “M” er 3.

Eksempel 2: Finn og sum hastigheten på noen dyr ved å bruke GroupBy Sum () -funksjonen

Dette scenariet er også sammenlignbart med det første. For funksjonene som vi brukte i forrige eksempel, bruker vi også det samme i denne koden. For dette opprettet vi et dataaframe som har to kolonner. Navnet for den ene kolonnen er "dyr" og den andre er "hastighet".

I denne koden har vi også de samme funksjonene som vi hadde i forrige program - "Group.Count () ”og“ Group.sum()". Summen av hver gruppe kan fås ved bruk av Pandas “Sum ()” -metoden direkte på de valgte kolonnene fra utgangen fra Pandas Groupby. DataFrame representerer Pandas DataFrame -funksjonen. På listen over dyr har vi tatt tre dyr - "ape", "løve" og "tiger". I den andre kolonnen har vi skrevet hastigheten deres. DataFrame er delt inn i grupper ved å bruke metoden “DataFrame Groupby ()”. Det beregner antall lignende datatellinger som er til stede i en spesifikk DataFrame -kolonne.

Bruke “DF.Groupby () ”, objektet er delt, en funksjon brukes, og produktene blir kombinert. En stor mengde data kan grupperes ved hjelp av dette, og operasjonene kan beregnes på disse gruppene. Du kan gruppere dataene dine med "Groupby ()" -metoden og utføre operasjonene på disse gruppene. Gruppen.Count () ”-funksjonen returnerer det totale antallet ikke-nan-verdier. En dataaframe returneres hvis det er flere kolonner. Telling er den enkleste grunnleggende samlede teknikken. Å bruke grevpandasfunksjonen på hele dyret DataFrame avslører raskt hvor mange ”aper”, “Lions” og “Tigers” som er der i “Animal” -gruppen.

Undersøk resultatene av kildefilen, kjør denne koden og gi en veracious output. Denne utgangen viser tre tabeller ved hjelp av tre forskjellige funksjoner. Hvis vi teller hastigheten for tre “aper”, vil det være “105”. Hastigheten for to “Lions” er “160” og hastigheten til en “tiger” er “65”.

Konklusjon

Tatt i betraktning denne informasjonen, fungerer denne artikkelen som et eksempel på ideen og nødvendigheten av å forenkle tingene for deg. Vi definerte to funksjoner her. Dette er applikasjonene for "gruppen.sum () ”og“ gruppe.telle ”funksjoner i pandaer. Du kan sikkert forstå hvor utrolig og hjelpsom "gruppen.sum () ”og“ gruppe.Count () ”-funksjoner er for å undersøke dataene. I denne opplæringen har vi sett hvordan vi kan kombinere de samme dataene ved å bruke “DF.gruppe ”og summere dem. Vi ga denne guiden en god og enkel forklaring av alle metodene, så det er lettere for deg å få poenget vårt. Du kan velge en av de to tilgjengelige teknikkene basert på dine behov, men å mestre begge deler er viktig og forbedrer derfor Python Pandas -ferdighetene dine.