Pandas Unstack

Pandas Unstack
“Ganske mange inkorporerte algoritmer for å endre et sett med data er aktuelle i pandaer. Blant alle av dem er sannsynligvis de to mest populære algoritmene for virvlende kolonner og rader "Stack ()" og "Unstack ()". På nivå 0 i det grupperte datasettet bruker vi sporadisk “Stack ()” og “Unstack ()”. Vi har tenkt å undersøke “Unstack” i pandaer i denne artikkelen. "Unstack" er en av de viktige holdningene til pandaer for å fjerne pyntegjenstander fra bunken. Ustacking er sterkt brukt i pandaer for å endre formen for datarammen vesentlig blir demonstrert. To hovedparametere i Pandas Unstack som kan brukes “Nivå” og “Fill_Value”.”

Syntaks for Pandas Unstack -metode

Eksempel 1: Vis Pandas Unstack i en dataramme med en enkel Unstack () -funksjon på en gang

Nå vil vi diskutere hvordan vi kan avgi datarammen i pandaer. For dette formålet er verktøyet vi har brukt som kompilator av Pandas Python “Spyder”. For å inkludere Pandas -implementeringen, importerte vi biblioteket med Pandas som "PD".

La oss undersøke det første eksemplets kode. Etter å ha importert Pandas bibliotek, opprettet vi vår dataramme som "Date_Values", der vi tildelte "indeks" -datoen som "2022-08-21". Den tildelte verdien for "periodene" er "120", og verdien som vi tildeles "freq" er "2min". Deklarerte kolonneverdier for datarammen inkluderer "data", "kolonner" og "indeks". Fenomenet "liste" -funksjonen brukes på "data" sammen med "verdien" av verdi som "120". "Kolonner" -variabelen lagrer karakterverdien som heter "Verdi". Verdien tilordnet kolonnen “Indeks” som “Indeks”. Datarammen “Date_Value” er tilordnet med to kolonneverdier som “Positive” og “Negative”. Den "positive" verdien vil bli tilordnet fra topprekkefølgen til datarammen som standard, men verdien "negativ" vil bli tilordnet datarammen fra "loc [0: 8]" for den "positive" verdien. Etter å ha tilordnet verdiene til kolonnene i vår dataramme “Data_Values”, brukte vi ganske enkelt å bruke “print ()” -funksjon bare for å vise vår dataramme.

La oss nå komme til hovedfunksjonen vår for å avslutte datarammen vår "Date_Values". For dette formålet bruker vi vår viktigste "Unstack ()" -funksjon på våre "Data_Values" dataramme. For å gjøre det ustoppt, bruker vi det generelt som “Date_Values.Unstack () ”sammen med datarammen. Etter implementeringen av hovedfunksjonen bruker vi "print ()" -funksjonen i den siste for å vise vår dataramme i ustakk form.

La oss nå se på output -visningen vår, der vi kan se at datarammen vår "Date_Values" er segmentert i tre kolonner i den første delen. Det første venstre hjørnet har datoverdien på “2022-08-21” sammen med tidsintervallet til “2min”. Midtkolonne -navnet "Verdi" har "indeks" -tall. Høyre hjørne kolonne Navn “Value_2” viser verdien “Negativ” fra topp til bunn. Hvis vi ser fra bunn til topp, viser den datoverdien som "2022-08-21" sammen med et tidsintervall på "2min", med det siste indeksnummeret vist som "119" da vi ga området "120 ”. Kolonnen “Value_2” viser den “positive” verdien fra bunn til topp. Etter datarammen kan vi se at den viser summen av "120" rader og "2" kolonner som vi tildeler vår dataramme i kode.

Når vi brukte vår viktigste "Unstack ()" -funksjon, skiller den verdien fra stabelen, og vi kan se at den viser verdien av "indeks" -tall og datoverdier separat for kolonnen "verdi" som inneholder "120" rader sammen med “2” kolonner fra topp til bunn ordre. Kolonnen "Value_2" vises separat sammen med datoverdiene med tiden for "2min" intervall som viser den "positive" verdien fra bunn til topp mot det "negative". Etter implementeringen av ustakking blir lengden på totale rader “240”. Fordi å fjerne verdien fra stabelen gjør at den totale lengden vil være "240".

Eksempel 2: Vis Pandas Unstack i datarammen ved å bruke Unstack () -funksjon på flere nivåer

Nå vil vi diskutere vårt andre eksempel der vi etter import av biblioteket med Pandas som "PD", opprettet vår dataramme som heter "Record". Datarammen “Record” er blitt erklært med tre kolonner med verdier som “Mobiles”, “Sales_r1 i $” og “Sales_r2 i $”. Kolonnen "Mobiles" lagrede verdier er "iPhone", "iPhone", "Samsung" og "Samsung". Verdiene som er tilordnet kolonne “Sales_r1 i $” er “10”, “20”, “30” og “40”. Verdiene som er tilordnet kolonne “Sales_r2 i $” er “12”, “15”, “16” og “18”. Etter å ha tilordnet verdiene, tildelte vi dem som tre kolonner og brukte ganske enkelt “print ()” -funksjonen for å vise vår dataramme “post” sammen med de tre kolonnene som inneholder alle de tildelte verdiene.

Etter å ha opprettet vår DataFrame, brukte vi først "Stack ()" -funksjonen på vår "post" dataramme i to nivåer sammen med begge kolonnene. Etter det brukte vi “Unstack ()” -funksjonen på flere nivåer på samme sted. Først brukte vi “Unstack ()” -funksjonen på datarammen på “Level = 0” og kalte den “First_Stack”, og viste den med “Print ()” -funksjonen. Etter det brukte vi “Unstack ()” -funksjonen på “Nivå = 1” og kalte den “Second_Stack”, og viste den ved å bruke "print ()" -funksjonen på den siste. Slik kan vi bruke en ustakkfunksjon på flere nivåer ved å bare tilordne “Unstack ()” -funksjonen på nivået der vi ønsker å fjerne verdien fra stabelen.

Nå vil vi diskutere utgangen fra vårt andre eksempel, der vi brukte "Unstack ()" -funksjonen på flere nivåer. I utgangen viser den for det første bare datarammen "Record", som vi opprettet sammen med tre kolonner med "Mobiles", "Sales_r1 i $" og "Sales_r2 i $". Indeksnumre varierer fra “0” til “3”, og verdier som vises i de første kolonnene er “iPhone”, “iPhone”, “Samsung,” og “Samsung”. Verdier i den andre kolonnen som vises er “10”, “20”, “30” og “40”. Verdiene som vises i den tredje kolonnen er “12”, “15”, “16” og “18”.

Da vi brukte "stack ()" -funksjonen, flyttet den alle verdiene fra “0” til “3” inn i stabelen hver for seg, sammen med begge kolonneverdiene. Helt fra neste etter datarammen kan vi se indeksen “0”, “1”, “2” og “3” -verdier for begge kolonnene alle settes inn i stabelen. Når vi bruker "Unstack ()" -funksjonen på "Nivå = 0", fjerner den verdien fra stabelen og viser hele kolonnens verdier på en horisontal måte sammen med alle verdier innen tre kolonner. Og da vi brukte "Unstack ()" -funksjonen på "nivå = 1", viser den datarammen ut fra stabelen inn i den opprinnelige formen som den var tidligere før du gikk inn i bunken på en vertikal måte sammen med alle kolonnene og verdier som ble tilordnet i koden. De to siste er visningen av “First_stack” og “Second_Stack” etter implementeringen av “Unstack ()” -funksjonen på “Level = 0” og “Level = 1”. Dette er måten å bruke ustabile fenomener på flere nivåer.

Eksempel 3: Viser Pandas Unstack i en dataramme med flere ustakk () -funksjoner på forskjellige duplettnivåer

I vårt tredje eksempel har vi tatt den samme datarammen “Record” som vi har brukt i forrige eksempel for å vise “Unstack ()” -funksjonen på to forskjellige nivåer. Først har vi ganske enkelt skrevet ut datarammen "post" det samme som i det andre eksemplet. For å bruke "Unstack ()" -funksjonen på to forskjellige nivåer, har vi først laget gruppen av en kolonne ved å bruke "groupby ()" -funksjonen sammen med "AGG ()" av "sum" og "maks" på kolonnen " Sales_r1 i $ ”. “Sum” og “Min” på kolonnen “Sales_r2 i $” og kalte det som “Grouped_Data”. Etter det brukte vi "print ()" -funksjonen med "gruppert_data" for å vise den.

Etter å ha gruppert to kolonner sammen med “Sum”, “Max” og “Min”, brukte vi “Unstack ()” -funksjonen på “Grouped_Data” på “(Level = 0)” og kalte den som “First_Unstack” og viste den med "print ()" -funksjon. Deretter brukte vi “Unstack ()” -funksjonen på “Grouped_Data” på “(Level = 1)” og kalte den “Second_Unstack”. Til slutt brukte vi “print ()” -funksjonen på “Second_unstack” for å vise den.

Nå på toppen av utgangsskjermen, kan vi se at den bare bare viser datarammen "post" det samme som i det andre eksemplet. Etter det kan vi se at det viser to hovedkolonner “Sales_r1 i $” og “Sales_r2 i $” sammen med to underkolonner av “Sum”, “Max” og “Sum”, “Min” sammen med verdiene “30 ”,“ 70 ”,“ 20 ”,“ 40 ”,“ 27 ”,“ 34 ”,“ 12 ”og“ 16 ”. På venstre side har den verdier av kolonnen "Mobiles", som er "iPhone" og "Samsung". Ved å bruke "groupby ()" -funksjonen, slo den seg sammen langs en gruppe av to vanlige verdier av "iPhone" og "Samsung", som vi kan se i utgangsskjermen sammen med "2" rader og "6" kolonner ". Etter implementeringen av "Unstack ()" -funksjonen på to forskjellige nivåer av grupperte data, fjerner den bare den fra stabelen, men dataene forblir i den grupperte formen på grunn av "Groupby ()" -funksjonen.

Konklusjon

I artikkelen vår har vi brukt to datarammer for å gjelde Unstack -funksjonen. I vårt første eksempel lærte vi hvordan vi kunne søke om Unstack -funksjoner på en gang. For de to andre eksemplene brukte vi de samme datarammene. I det andre eksemplet brukte vi "Unstack ()" -funksjonen på flere nivåer, mens vi i det tredje eksemplet brukte flere "Unstack ()" -funksjonen på forskjellige duplettnivåer ved å bruke fenomenet "Groupby". Disse metodene vil gjøre det enklere å forstå om vi bruker dem mens vi jobber med dem.