Pandas Pivot Table

Pandas Pivot Table

Python gir mange biblioteker for å gjøre forskjellige oppgaver. "Pandas" er også et bibliotek med Python. Vi bruker dette biblioteket til å manipulere og analysere dataene. Vi kan enkelt designe DataFrame i "Pandas". Vi designer også “Pivot -tabellene” også ved å bruke funksjonene til "Pandas". En pivotbord er en funksjon i regneark som muliggjør forskjellige tabeller for forskjellige perspektiver av identiske data. En interaktiv teknikk for å oppsummere et stort volum av data er "Pivot -tabellen". "Pivot_table ()" -metoden til "pandas" hjelper oss med å designe pivottabellene ved å bruke dataene til DataFrames. Vi kan angi indeks, kolonner og verdier i metoden “pivot_table ()” i henhold til vårt valg eller behov. Vi kan også bruke aggregeringsfunksjoner på disse pivot_tables i "pandas". I denne opplæringen vil vi lage pivottabellen ved å bruke metoden “pivot_table ()”, og vi vil forklare denne "pivot -tabellen" i detalj.

Syntaks

Pandas.PIVOT_TABLE (DataFrame_Name, Values ​​= Values_Names, Index = Index_Names, Columns = Column_Names, AgGFunc = 'Mean')

Vi legger først til navnet på DataFrame hvis data vi ønsker å bruke i Pivot -tabellen. I verdiene legger vi til navnene på kolonnene som vi ønsker å justere som verdiene til pivottabellen. Etter dette setter vi inn navnene på kolonnene i DataFrame som vi ønsker å angi som indeksen for pivottabellen. Nå, i kolonnene, angir vi navnene på kolonner som vi ønsker å justere som kolonnenavn på pivottabellen. Deretter kan vi også legge til aggregeringsfunksjonen til den. Nå vil vi gjøre "Pandas" -koden og vise opprettelsen av pivottabellen i kodene våre. La oss se på eksemplene nedenfor.

Eksempel 01

Vi starter dette eksemplet med å plassere "importen" for å importere modulene til "pandaer" i "Spyder" -appen. Vi plasserer "Pandas som PD" etter "Import" nøkkelordet. Vi importerer også et annet bibliotek som er "numpy" på samme måte. Vi plasserer "importerer" og legger deretter til "Numpy som NP", så det vil hjelpe oss med å få tilgang til metodene til "Numpy" -biblioteket. Etter å ha importert begge bibliotekene, går vi mot opprettelsen av DataFrame. DataFrame heter “Expense_df”, og deretter bruker vi “Pandas” -metoden “PD.DataFrame () ”Så det hjelper oss med å lage DataFrame.

Dataene som vi legger til i "Expense_df" inneholder tre kolonner som kalles "EXP_ID, EXPENSE_TYPE og MENING". Dataene vi legger til "Exp_id" er "E1, E2, E3, E4, E5 og E6". Deretter, i "Expense_type", plasserer vi: "Bolig, underholdning, transport, mat, regninger og skatt". Den siste kolonnen er kolonnen "penger" som vi legger til: "$ 1500, $ 1200, $ 200, $ 3000, $ 5000 og $ 2000" til det. Nå viser vi ganske enkelt denne "Expense_df ved å bruke" print () ". Dataframe er opprettet og vises. Vi brukte ikke “pivot_table ()” -metoden ennå. Først vil vi vise denne dataaframe. Deretter bruker vi "pivot_table ()" -metoden også i dette eksemplet.

Vi får resultatet av denne koden i "Spyder" -appen ved hjelp av "Shift+Enter" -tastene, eller vi kan også bruke "Run" -ikonet til denne appen. Bare DataFrame vises her i utfallet, og alle dataene blir lagt til i denne DataFrame. Nå vil vi bruke "pivot_table" -metoden for å lage pivot -tabellen ved å bruke dataene til denne dataaframe.

Vi legger til disse gitte linjene til koden ovenfor. Her kan du se at vi får tilgang til “PIVOT_TABLE ()” -metoden til “Pandas” ved å bruke “PD” med den metoden. Etter dette legger vi til navnet på DataFrame som den første parameteren. Deretter, i "Verdiene", har vi satt "Money" -kolonnen slik at den vises som verdiene i cellene i Pivot -tabellen. I "indeksen" setter vi "exp_id". Så "exp_id" -kolonnen vil konvertere til indeksen for pivottabellen. Vi justerer også "Expense_type" i "kolonnene", slik at verdiene til kolonnen "Expense_Type" vises som kolonnenavnene på Pivot -tabellen.

Deretter bruker vi også aggregeringsfunksjonen “AGGFUNC” og setter den til “NP. sum ”som vil legge til verdier. "Summen" er funksjonen til "Numpy" -biblioteket som vi får ved å plassere "NP". Vi har lagret denne "pivot tabellen" i "tabellen" -variabelen og lagt til denne "tabellen" -variabelen i "utskrift" for visning.

Her er svingbordet. Legg merke til at "kolonnenavn" i denne pivottabellen er verdiene til "utgifts_type" -kolonnen i DataFrame. "Indeksen" for denne pivottabellen er verdiene til "exp_id" til dataaframe som vi har opprettet ovenfor. Også "verdiene" som er lagt til i cellene i denne pivottabellen er verdiene til "pengene" -kolonnen i DataFrame.

Eksempel 02

Vi importerer igjen både "pandaer" så vel som "numpy" biblioteker for å generere den nye koden. Vi oppretter Pivot -tabellen etter å ha lest CSV -filen og konvertere dataene fra CSV -filen til DataFrame. Bruk deretter dataene til DataFrame for å lage pivottabellen. La oss prøve hvordan vi lager pivottabellen ved å bruke dataene fra CSV -filen. Etter å ha importert bibliotekene, bruker vi “read_csv” -metoden til “pandaene”. Legg deretter til navnet på CSV -filen i den som leser dataene til denne CSV -filen og lagrer disse dataene i form av DataFrame i "DF" -variabelen.

Deretter skriver vi ut denne "DF". Vi plasserer også "Head (8)" -metoden med dette, slik at den bare viser de første "8" radene i DataFrame. Etter dette bruker vi “pivot_table ()” -metoden der vi setter inn navnet på DataFrame. Deretter legger vi to indekser for pivot -tabellen som er kolonnene “Order_id og enheter” i DataFrame. I "Verdiene" plasserer vi "mengden" og "land" -kolonnene i DataFrame, slik at de vil bli lagt til som verdiene til Pivot -tabellen. I aggregeringsfunksjonen legger vi til “NP. sum ”-funksjon. Denne pivottabellen er lagret i "pivot_result", og vi viser også "pivot_result" ved å bruke "print ()".

DataFrame, så vel som pivottabellen, er gjengitt i dette resultatet, og du kan enkelt sjekke indeksene og verdiene til pivottabellen. Alle verdier og indekser for pivottabellen justeres deretter, da vi har satt i koden.

Eksempel 03

Vi kan også lage en pivottabell med mange aggregeringsmetoder. Her designer vi DataFrame, og så har vi laget pivottabellen ved å følge den samme metoden som vi allerede har diskutert tidligere. I metoden “pivot_table ()” justerer vi “emp_type” som “indeksen”. "Emp_pay" er satt som "verdiene" for den pivottabellen, og vi legger til flere aggregeringsfunksjoner her, og disse er "sum, middel og telling". Så alle disse funksjonene vil gjelde for verdiene i pivottabellen. Denne "pivot_table ()" er lagret i "resultat", og vi skriver ut "resultatet" også for å vise pivottabellen på terminalen.

DataFrame og Pivot -tabellen vises begge her. I Pivot-tabellen kan du merke deg at de tre kolonnene- “Sum, Mean og Count”- inneholder resultatet etter å ha brukt disse funksjonene på dataene fra Pivot-tabellen. Legg også merke til at den skriver de samme verdiene en gang i indekskolonnen og ikke dupliserer noen indeksverdi her.

Konklusjon

I denne opplæringen har vi studert "Pivot -tabellen" i "Pandas". Vi har diskutert hva en pivottabell er, hvorfor vi bruker denne pivottabellen og hvordan du lager denne pivottabellen i “Pandas”. Vi har forklart metoden som er "pivot_table ()" -metoden som hjelper oss med å lage "pivot -tabellen" i "pandaer" ved å bruke dataene til DataFrame. Vi har også brukt denne "pivot_table ()" -metoden i “pandas” -kodene også. Vi har brukt mange aggregeringsfunksjoner på denne “Pivot -tabellen”. Vi har også utviklet "Pivot -tabellen" etter å ha lest CSV -filen i denne opplæringen.