Pandas Groupby Max

Pandas Groupby Max
“Panda” er et Python -bibliotek. "Groupby" brukes til å gruppere dataene som består av en eller flere enn en kolonne i henhold til kategoriene som gir etiketter til hver gruppekartlegging. I Pandas Python Dataframe, hvis du vil finne den "maksiske" verdien til en bestemt gruppe som du trenger, kan du gjøre det bare ved å bruke "Group by () og Max ()" -funksjonen. Dette hjelper en til å finne maksimalverdiene uten kjas som i selskapene; Dataene er i stor skala som blir vanskelig å håndtere manuelt. Hva om du vil finne et bestemt område fra hele dataene? Det blir vanskelig å gjøre statistikken på egen hånd. Det vil konsumere mye tid så vel som tålmodigheten til en bestemt, så i stedet for det, bruk funksjonene til Groupby Max i Pandas DataFrame. I Pandas Python Dataframe, hvis du vil finne "Max" -verdien til gruppen, kan du gjøre det bare ved å bruke "Group by () og Max ()" -funksjonen.”

Syntaks
# DF.Groupby ('Column_name').Max ()

"DF" representerer DataFrame her, Groupby fulgte opp med kolonnens navn der du må skrive navnet på kolonnen du vil jobbe med. “Max” skrevet til slutt, er for påvisning av maksimalverdiene i kolonnen valgt fra “DF.”

Groupby maks av enkelt- og flere kolonner i pandaer kan utføres på forskjellige måter. La oss gjøre dem en etter en.

Vi vil diskutere og dekke alle følgende måter:

  • Groupby Max - Enkelt kolonne
  • Groupby Max - Flere kolonner
  • Groupby Max - Bruke Pivot -funksjon
  • Groupby Max - Bruke en samlet funksjon
  • Groupby Max - Bruke RESET_INDEX -funksjon (enkelt- og flere kolonner begge)

Opprette DataFrame for implementering av Groupby Max -funksjonen

La oss først lage et dataaframe for å bruke funksjonene og forstå hver metode tydelig. DataFrame “DF” her består av byer, produkter og deres salg. Vi trenger et Python -verktøy for å kjøre kodene våre. Her er programvaren som brukes Spyder for implementeringen. Du må laste den ned først direkte fra Google, oppfylle installasjonskravet etter installasjonsprosessen og starte verktøyet. Åpne filen og begynn å utføre koden din som er enkel som den går. Beskrivelsen av alle måter ved å bruke Groupby Max Panda Python -kode er definert kort i eksemplene nedenfor.

For Python -domenet er Pandas som "PD" og Numpy som "NP" bibliotekene importert i eksempelkoden. Numpy brukes til numeriske data i Python, mens pandaer brukes til tolkning av dataene.

Ved å bruke følgende kodelinje, vil vi jobbe med hvert av eksemplene som dekker:

# DF1 = PD.DataFrame (Data, Columns = ['Cities', 'Products', 'Sales'])

I henhold til DataFrame er kolonnene byer, produkter og salg; Tilsvarende består syntaks av alle tre i kolonnerepresentasjonen.

Koden skal vises slik på konsollskjermen.

Utgangen viser listen over kolonner bestående av byer, produkter og antall salg. Det viser også serienummeret spesielt.

Eksempel # 01: Groupby Max Pandas - Enkelt kolonne

Starter den praktiske implementeringen av Groupby Max enkeltkolonne ved hjelp av Python -koden i Pandas DataFrame, trenger vi et spesifikt verktøy, og for det vil vi bruke Spyder, som nevnt tidligere i beskrivelsen ovenfor. Nå, etter å ha åpnet Spyder på den bærbare/stasjonære datamaskinen, trenger du filtypen som ".py ”det er Python -referansen fordi koden vår er på Python -språk.

Nå, med start av kodedelen, er det en ordpanda som også er vår artikkelens første ord, så det betyr noe med Pandas 'bibliotek bør implementeres for det; Vi må skrive "Panda" som "PD", som vil importere alle funksjonene i Panda Library i arbeidsfilen vår.

Single Column Groupby Max jobber ved å ringe “Groupby ()” og skrive navnet på kolonnen du vil ha fra DataFrame, som er “Cities” i “DF” som er fulgt opp med å velge feltet for maksimal estimering “Max () ”Funksjon.

Output.

Eksempel # 02: Groupby Max Pandas - Flere kolonner

Åpne nå den nye filen for eksemplet implementering av flere kolonner i Groupby Max, da du kan finne den maksimale verdien av hver gruppe som refererer til forskjellige kolonner fra "DF" i Pandas Groupby Max. Velg kolonnene; Her kan du velge mer enn en kolonne når den løfter opp flere kolonner fra "DF" i henhold til ditt behov.

Koden som brukes for Multiple Groupby Max er:

Utgangen viser, som du kan se, maksimalverdiene til begge kolonnene.

Eksempel # 03: Groupby Max Pandas - Bruke Pivot -funksjon

Igjen, å åpne en ny fil for arbeidseksemplet på pivotfunksjonen i Groupby Max Pandas. Pivot () -funksjonen er å ordne din "DF" i en fin representabel form. Du kan jobbe med det med enkelt- eller flere kolonner som du vil. Her er implementeringen på flere kolonne Groupby, men hvis du vil gjøre singel -kolonnen Pivot Groupby Max Panda, må du legge til en kolonne i GroupBy () legge til i stedet for flere kolonner; Du kan også få den enkle kolonnerepresentasjonen.

Pivot () i Pandas Groupby Max -kode er:

Ved hjelp av Pivot () -funksjonen ser utgangsskjermen ut som avgjorte individer.

Eksempel # 04: Groupby Max - Bruke en samlet funksjon

Du må åpne en annen fil fra filen og gå til den nye filen. Nå ser vi etter eksemplet ved å bruke den samlede funksjonen i gruppen av Max Pandas. Den samlede funksjonen i koden, som vi skriver som agg (), fungerer ved å ta "maks" som input, som vil utføre Groupby Max i din "DF" og lage en klar struktur av "DF".

Den samlede funksjonsgruppenby Max Panda for flerkonnertkoden er:

AGG () -funksjonen tillater all kolonneaggregeringen mulig med maksimale verdier.

Eksempel # 05: Groupby Max - Bruke RESET_INDEX -funksjon (for enkelt- og flere kolonner)

Tilbakestillingsindeksen med navnet forklarer at funksjonen tilbakestiller indeksen og vil også gi en ny indeks til DataFrame ved å gjøre den til en mer ordentlig struktur.

Koden for reset_index -funksjonen enkeltkolonne i pandaer er:

Her blir tilbakestilling av "DF" utført med tilbakestilling () -funksjonen til den valgte kolonnen, som er byer som viser MAX -verdiene.

For flere kolonner reset_funksjon i pandaer er koden:

Utgangen viser begge kolonnene som tilbakestiller “DF” i pandaene ved å bruke RESET () -funksjonen Groupby Max.

Konklusjon

Panda Groupby Max -funksjonen er veldig nyttig og forenklet. Ettersom det kan oppdage valg av valgkolonens maksimer ved å bruke “.Max () ”-funksjon og kan beregne maksimalt av verdiene i DataFrame. I denne artikkelen har vi forklart alle metodene som Max () Function Groupby () fungerer, i.e., Groupby Max på enkelt- og flere kolonner, og vi kan tilbakestille indeksen for dem begge, på samme måte som aggregatet og pivotfunksjonen som fungerer til sin beste forklaring med eksempler for bedre forståelse. Hver del av denne opplæringen understreker den enkle forståelsen og ryddingen av konseptene.