Pandas agg

Pandas agg
“Pandas” gir “AGG ()” -funksjonen. Ved å bruke "AGG ()" -funksjonen kan vi bruke forskjellige funksjoner. Den utføres på radindeksaksen, som automatisk settes inn i DataFrame. Standard oppførsel av den numpy “AGG ()” -funksjonene (middel, median, prod, sum, std, var), som evaluerer AGG () til den flate matrisen, er forskjellig fra denne oppførselen. Vi kan legge til data ved hjelp av AGG () -funksjonen. Denne guiden vil bruke "Pandas AGG ()" -funksjonen og vil vise arbeidet med denne "AGG ()" -funksjonen i "Pandas".

Syntaks

Syntaks for denne funksjonen er:

#Dataramme.AGG (Func, Axis, Args, Kwargs)

Eksempel nr. 01

Vi har "Spyder" -appen for å utføre våre "pandas" -koder. Når vi utvikler "Pandas" -koden, må vi "importere" "Pandas" -metodene som "PD". Denne "PD" lar oss få tilgang til metodene eller funksjonene til "Pandas" ved å legge til "PD" i stedet for "Pandas". Vi genererer dataene og lagrer dem i “Data1”. Vi skriver “X1” og i “X1”. Vi legger til "60", "50" og "40". Vi har “Y1” og legger til “900”, “1212” og “51” i den. Vi plasserer også “Z1”. I dette setter vi inn “200”, “300” og “800”. Vi endrer denne "data1" til "DataFrame" og skriver "PD" med "DataFrame", slik at det vil støtte oss i å få tilgang til denne funksjonen til "Pandas".

Vi passerer “Data1” som parameter for “PD.Dataramme ()". Det genererer "dataaframe" for oss og bruker også variabelen her "DFA" som lagrer denne dataaframmen i den. Så legger vi til “Print (DFA)” for å gjengi dette. Nedenfor bruker vi "AGG ()" -funksjonen for å utføre noen operasjoner på denne dataaframe. Vi bruker "sum" i denne "AGG ()" -funksjonen. Resultatet vi får etter at summen er lagret i "Ans" -variabelen. Vi skriver også ut denne summen ved å sette “print ()”.

Vi limer også ut utgangen her. Denne utgangen blir trukket ut på "Spyder" -terminalen ved å trykke på "Shift+Enter". Den viser først dataene når de settes inn i koden og legger til verdiene til “X1” den, og vises deretter i nedenfor “X1”. Verdiene til "Y1" blir også lagt til, og resultatet vises i "Y1" -kolonnen. Til slutt utføres sumoperasjonen også på verdiene til "Z1". Resultatet etter at oppsummeringen er gjengitt i "Z1" -kolonnen.

Eksempel # 02

Vi produserer DataFrame etter å ha importert “Pandas” som “PD”. DataFrame heter “Data”. Vi setter inn tre rader først og legger til “9, 8, 7” til første rad; “4, 5, 6” til andre rad; og også “1, 2, 3” til tredje rad. Deretter setter vi navnet på overskriften på hver kolonne ved å bruke nøkkelordet "Kolonner". Vi tildeler “A1” som overskriften til den første kolonnen. “A2” som overskriften til den andre kolonnen. Og “A3” for den tredje kolonnen. Vi skriver ut "dataene" på terminalen til Spyder -appen.

Vi legger navnet på DataFrame “Data” og bruker “AGG ()” -metoden med denne “Data”. Vi har to funksjoner som vi ønsker å bruke på DataFrame: “Sum” og “Min”. “Sum” vil legge til tallene for hver kolonne separat. “Min” vil finne minimumsverdien på kolonnen. Deretter vil den lagre summen og minverdien i "resultatet" som vi har opprettet. Til slutt vil det trykke "resultatet" da vi har satt inn "trykket" også.

Summen av kolonnen “A1” er “14” og minimumsverdien for denne kolonnen er “1”. Summen av den andre kolonnen “A2” er “15”. Minimumsverdien er “2”. Summen av den siste kolonnen “A3” er “16” og minimumsverdien vi har for denne kolonnen er “3” som vises.

Eksempel # 03

Vi gjentar den første linjen i dette eksemplet og konstruerer DataFrame “Info”. Sett deretter data i rader som "3, 8, 7" blir satt inn her til første rad. “4, 1, 6” og “7, 2,3” settes inn i henholdsvis andre og tredje rad. Vi tildeler også noen indeksnavn til alle kolonner som "Col1", "Col2" og "Col3" for henholdsvis første, andre og tredje kolonne. Vi gjengir denne "informasjonen" ved å bruke "utskrift". Vi bruker forskjellige aggregeringer på kolonnene.

I metoden “AGG ()” nevner vi navnet på kolonnen og legger deretter operasjonen som vi ønsker å bruke på den nevnte kolonnen. Når det gjelder "col1", bruker vi "sum" og "min" -operasjon. På "Col2" bruker vi "Min" og "Max" -operasjoner. Men vi nevner ikke “COL3”, så ingen AGG -funksjon blir brukt på “Col3”. Vi bruker også "endelige" variabelen for å lagre dette resultatet og deretter gjengi det.

"Summen" og "Min" brukes på "Col1", men i "Max" skriver den ut "Nan" fordi vi ikke brukte "Max" på denne "COL1". Deretter er "min" og "maks" verdier av "col2" her, men sumblokken inneholder "nan", da vi bare bruker "maks" og "min" på denne "col2". "Col3" er ikke her fordi vi ikke brukte noen "AGG ()" -metode på denne "Col3".

Eksempel nr. 04

Vi bruker forskjellige funksjoner på kolonnene og oppdaterer også navnet på indeksen etter resultatet. For dette bygde vi DataFrame “Raw Data”, og vi har tre rader som inneholder noen tall som er “22, 82, 27” i første rad; “14, 23, 36” her i andre rad; og “77, 29, 34” er i tredje rad. Navnene på kolonnene vi la til er “Data1”, “Data2” og “Data2”. Nedenfor har vi “Print ()” -metoden.

Nå bruker vi “AGG ()” -metoden til “Pandas” og setter “X” som brukes til å gi nytt navn til radindeksnavnet etter å ha brukt aggregeringsfunksjonen på "Data1" -kolonnen. Vi bruker "maks" -funksjonen på "data1". Vi velger "y" for å erstatte radindeksnavnet etter utførelse av aggregeringsfunksjonen. Til “Data2” bruker vi “Min” -funksjonen. På “Data3” setter vi “Mean” -funksjonen og setter radindeksnavnet til “Z” som erstattes etter å ha brukt aggregeringsfunksjonen. Deretter har vi også "print ()" slik at "beregningen" vises for oss.

På “Data1” er bare “Max” -funksjonen brukt, og de resterende to verdiene er “NAN”. Også indeksverdien endres til "x". "Data2" -kolonnen viser bare resultatet for "Min" -funksjonen, og de gjenværende verdiene er "Nan", og indeksens radnavn er "Y" for dette. Nå brukes det eneste gjennomsnittet på “Data3” og radindeksen endres til “Z”.

Konklusjon

Denne guiden er på "AGG" -funksjonen i "Pandas". Vi har forklart at "AGG" -funksjonen som brukes i pandaer for å bruke forskjellige funksjoner. Vi har etablert fire tilfeller, som vi har brukt "AGG" -metoden.

.