Pandas DataFrame Pivot

Pandas er biblioteket til Python. Vi bruker pandaer til mange formål. Vi kan lage DataFrame i Pandas og Pivot som gitt DataFrame. For å privo eller omforme DataFrame, gir Pandas metoden “Pivot ()”. En spesifisert DataFrame kan omorganiseres ved hjelp av “pivot ()” -metoden gjennom de spesifiserte indeks- og kolonneverdiene. Når vi ønsker å omforme DataFrame, bruker vi metoden “Pivot ()”. Når vi bruker "pivot ()" -metoden, må den bruke den unike indeksverdien. Dataaggregeringen støttes ikke av metoden “pivot ()”; Flere verdier produserer en multiindex i kolonnene. I denne guiden utforsker vi “pivot ()” -metoden i pandaer i detalj. Og vi vil gi deg en visuell demonstrasjon av kodene der vi omformet DataFrame ved å bruke "Pivot ()".

Syntaks:

Dataramme.pivot (selv, indeks = ingen, kolonner = ingen, verdier = ingen)

Eksempel 1:

Vi vil vise det praktiske eksemplet på “Pivot ()” -metoden i pandaer. Vi gjør Pandas -koden i "Spyder" -appen. Som vi vet, må vi importere noen funksjoner av pandaer som "PD". Vi utvikler denne koden, så vi bruker "pivot ()" -metoden. Denne metoden brukes på DataFrame. Vi oppretter først DataFrame her. DataFrame som vi utvikler her heter "Cars_Data" der vi legger til dataene relatert til biler. Vi lager den første kolonnen med navnet “Car_name” der vi legger til noen navn på biler som “Wagonr, Swift, Lexus, Mehran, Mustang, Alto og Jaguar”.

Vi setter også inn flere kolonner som heter “Car_model, Car_no og Challan”. Dataene i disse kolonnene er også satt inn her. Kolonnen “Car_model” inneholder modellnumrene til bilene som er “2014, 2001, 2010, 2015, 2020, 2012 og 2019”. Kolonnen “Car_no” inneholder “R123, R456, R162, R102, S127, W190 og Z345”. Deretter har vi "Challan" -kolonnen der vi legger til “500, 4000, 500, 6000, 2000, 1000 og 2000” verdiene. Dette er hele DataFrame som inneholder fire kolonner. Etter dette setter vi indeksverdiene for radene som er “R1, R2, R3, R4, R5, R6 og R7”. Vi setter inn disse indeksverdiene til “Cars_Data” ved å bruke “indeks” -metoden.

Deretter legger vi den i "print ()" -metoden for å gjengi på konsollen. Vi omformer ikke DataFrame eller bruker "pivot ()" -metoden ennå. Vi viser bare bare "cars_data" dataaframe.

Vi trykker på “Shift+ Enter” for å utføre denne koden. Etter å ha trykket på disse nøklene, får vi det gitte utfallet av koden som viser DataFrame som vi utviklet i Pandas -koden. Nå bruker vi “pivot ()” -metoden på denne dataframmen og omformet den etter vårt valg.

Her legger vi til disse linjene til Pandas -koden vår og bruker "pivot ()" -metoden. Denne "pivot ()" -metoden inneholder tre parametere. I den første parameteren satte vi den nye indeksen som er "car_model". Den andre parameteren er kolonnenavnet som vi har satt her som "Challan". Og den tredje parameteren er verdiparameteren som vi som "bilnavn". Nå er "Cars_Data" DataFrame omformet og vises som vi definerte. Kolonnen "Car_model" vises som indeksen, "Challan" -kolonnen vises som kolonnenavnene, og verdiene til DataFrame er "CAR_NAME".

Her vises det omformede DataFrame og alle justeringene av verdier vises deretter som vi definerte i koden. Indeksen i denne omformede DataFrame er “Car_model”. Kolonnenavnet her er "Challan" -kolonnen. All “Car_name” justeres her som verdiene. "Nan" vises her i den tomme cellen.

Eksempel 2:

DataFrame som vi utvikler i dette eksemplet er "new_interview_df". Men vi oppretter først en nestet liste med navnet "new_interview". Og så konverterer vi denne nestede listen til DataFrame. "New_Interview" -listen inneholder "pro_language" der vi har "Java, C#, Python, OOP og Python". Den har “Code_Office” der vi setter “Bar12, LON34, PAR33, LON56, BAR53, LON11 og Bar34”. Deretter har vi “EMP_SALARY” og setter inn “18000, 25000, 20000, 15000, 34000, 22000, 31000 og 43000”. "New_interview" blir forvandlet til "new_interview_df" ved hjelp av "PD.DataFrame ”-metode. Vi setter også “new_interview_df” i metoden “print ()”. Det vises på konsollen etter utførelse.

Nå omformer vi “new_interview_df” ved hjelp av “pivot ()” -metoden. Denne gangen nevner vi “verdiene, indeksen og kolonnen” inne i “pivot ()” -metoden. Her setter vi "emp_salary" som verdiene, "code_office" som indeksen, og "pro_language" som kolonnene. Deretter skriver vi ut denne omformede DataFrame.

Originalen, så vel som de omformede Dataframes, vises her. Du vil kanskje legge merke til at verdien, indeksen og kolonnenavnene endres og en ny omformet DataFrame vises under den originale DataFrame. I det omformede DataFrame som dukket opp her, er indeksen "Code_Office", kolonnenavnene er "pro_language", og verdiene er "emp_salary".

Eksempel 3:

Vi lager igjen en annen liste for dette eksemplet. Denne listen heter “temp_list” som har “måned, by, temperatur og fuktighet” i den. Den "måneden" som vi setter inn her er "januar, mai, juni, februar og juli" ". "Byen" har "New York, Birmingham, Mumbai, Baljiam og Bangalore". I "temperaturen" og "fuktighet" legger vi henholdsvis "62, 68, 70, 77, 69" og "60, 66, 69, 74, 63". Deretter endrer vi "temp_list" til "temp_df" dataaframe. Vi gjengir deretter denne "temp_df" her.

Nå ønsker vi å svinge eller omforme denne "temp_df". "Pivot ()" -metoden her hjelper deg med å gjøre det. Vi setter "måneden" som dens indeks og "byen" som kolonnens navn. Verdiene vi setter her er både "temperatur" og "fuktighet". De vises som to separate dataframmer med forskjellige verdier.

Dette utfallet viser at det etter omforming er to dataframes adskilt med prikker. Den første DataFrame inneholder "temperatur" -verdiene og den andre dataframet inneholder "fuktighet" -verdiene ". Indeksene og kolonnenavnene for begge dataframene er de samme. Indeksen for begge Dataframes er "måneden" og "kolonnene" for begge er "by".

Eksempel 4:

Denne koden inneholder en "DF" DataFrame der vi plasserer "A01" som den første kolonnen og legger til "James, James og Mina". Den andre kolonnen er "A02" som har "ingeniør, ingeniør og lærer". Den tredje kolonnen heter “A03” der vi setter “44, 63, 21”. Vi skriver ut “DF” og bruker “Pivot” her. “A01” er indeksen, “A02” er kolonnen og “A03” er verdien. Nå, sjekk utgangen av hva som skjer med denne dataaframe.

Her er resultatet av denne koden. Du vil kanskje legge merke til at feilmeldingen vises i utgangen som sier at indeksen inneholder duplikatoppføringene. Det betyr at vi ikke angir kolonnene som en indeks som inneholder duplikatoppføringene fordi indeksene er unike verdier. Så vær forsiktig med det mens du svinger noen dataaframe.

Konklusjon

Denne guidenes mål er å gjøre “Pandas Pivot ()” -funksjonens logikk mer forståelig for deg. Vi beskrev dette konseptet i stor dybde, slik at det ville være lett for deg å bruke "Pivot ()" -funksjonen i Pandas -koden. Vi forklarte “pivot ()” -metoden. Vi benyttet denne metoden for å omforme eller svinge Dataframe i pandaer. Vi forklarte også syntaksen her. I denne guiden så vi på fire beskrivende så vel som praktiske eksempler, og så nøye over hver kodelinje. Vi ga utfallet for hver kode her sammen med skriptene.

Python

Numpy astype

AstType () -metoden til Numpy -modulen brukes til å endre datatypen til en Numpy -matrise i andre da...

Elias Krogh Svendsen

Windows OS

Hva er Windows Package Manager

Windows Package Manager eller Winget er et kraftig verktøy for å installere og administrere programv...

Alexander Sørlie

Windows OS

Hva er forskjellen mellom Windows Top 10 Home og Pro

Pro -versjonen er for profesjonelle brukere og har mer administrative verktøy, mens Home -versjonen ...

Daniel Johnsen