Pandas -serien Histogram

Pandas -serien Histogram

"En numerisk matriseres frekvensfordeling er typisk representert med et histogram, som er organisert i diskrete, like store binger. Metoden “Pandas.Serie.Hist () ”og“ Pandas.Serie.plot () ”er begge mye brukt. De kan brukes til å plotte histogrammer raskt ved hjelp av Pandas -serien.”

Syntaks -serien.Hist () ”-metode følger:

Syntaks for “Series.plot () ”-funksjon:

Denne artikkelen vil demonstrere implementering av begge disse metodene for å plotte histogrammer.

Eksempel 1: Bruke serien.Hist () Metode for å plotte et histogram

Vi kan plotte en Pandas -serie ved å bruke Pandas -serien.Hist () ”-metode. Den praktiske utførelsen av denne teknikken kan observeres i denne demonstrasjonen.

Vi har innført “Spyder” -verktøyet for å kompilere Python -programmene i systemet vårt. Lanseringen av verktøyet bringer oss til grensesnittet. Som standard åpner den en fil med navnet “Temp.py ”. Du kan endre navnet, og ".py ”er utvidelsen for Python -filene.

På denne Python -filen har vi satt i gang skriptet ved først å laste opp de nødvendige pakkene. Biblioteket vi har importert til Python -miljøet vårt er "Pandas". Dette spørsmålet kan oppstå i tankene dine, hvorfor importerer vi pandaer ut fra det brede spekteret av pakker som Python tilbyr? Vi lastet dette verktøyet fordi vi vil jobbe med å plotte histogrammer med Pandas -serien.

For å generere en serie, bruker vi en Pandas -metode, “PD.Serie () ”og for å plotte et histogram fra denne serien, en annen Pandas -metode,“ Series.Hist () ”vil bli utøvd i denne guiden. Så vi importerte “Pandas som PD” i Python -filen vår. Nå vil vi gå frem til manusstart.

For å plotte Pandas 'histogrammer ved å bruke en serie, er det første kravet å generere en Pandas -serie. Å konstruere Pandas -serien, “PD.Serie () ”-metode påkalles. Vi har brukt to parametere for denne funksjonen: “Data” og “Navn”. Verdiene for serien vil være inneholdt i "Data", mens navnet på denne verdilisten er tilordnet i "Navn". Verdiene “Data” holder er “12, 32, 45, 65, 76, 32, 19, 34, 76, 89, 45, 35, 76, 89, 90, 44, 14, 33, 56, 69, 65 , 44, 36, 57, 23, 41, 78, 32, 47, 81 ”. Så serien vår vil bli generert med 30 verdier. Vi har kalt denne listen “Salg”. “PD.Serie () ”-funksjon vil konstruere serien med vedlagte verdier, men den har ingen lagring i den for å holde denne serien for senere bruk.

For dette har vi opprettet et serieobjekt, kalt det “import_report”, og tildelt det resultatet generert fra å påkalle “PD.Serie () ”-metode. Presentasjonen av denne nyoppførte serien kan gjøres mulig ved å bruke “print ()” -metoden til Python. Denne metoden fungerer ved å ta noen form for innspill og behandle den for å utvise utfallet på terminalen. Her har vi brukt “.Head () ”-metode med seriens navn fordi posten som er lagret i serien er for lang, så vi foretrakk å se bare noen startverdier. “.Head () ”-metode viser som standard de første 5 oppføringene.

Bildet nedenfor presenterer en serie gjengitt i utgangsvinduet, og har de første 5 verdiene som blir sett på. Navnet på listen er nevnt nedenfor, og også dens datatype er identifisert som "INT64".

For å kartlegge et histogram fra en Pandas -serie, fikk vi funksjonen “-serien.Hist () ”fra Pandas verktøysett. Denne metoden tar ganske enkelt verdiene fra en serie og plotter et histogram som bruker dem. For implementering av denne metoden har vi påkalt den i Python -programmet vårt. Navnet på serien “Import_Report” leveres med “.Hist () ”-metode. Så utførte vi nettopp programmet ved å treffe alternativet "Run File".

Dette vil generere et plott på skjermen, som vises med stenger. Verdiene på y-aksen er fra 0-8, som representerer frekvens, mens x-aksen har intervaller fra 10-90.

Vi kan tilpasse dette histogrammet ved å endre antall binger i det. For dette har vi en parameter “Bin”. Vi har gitt denne parameteren til “-serien.Hist () ”-funksjon. Pandaene lager binger som standard, men vi kan endre dem om nødvendig. Så vi ga "søppelkassene" en verdi av "8". Det vil spre dataene våre i 8 stolper i histogrammet.

Du kan observere at det forrige visuelle hadde 10 binger, men denne har 8 barer.

Eksempel 2: Bruke serien.plot () metode for å plotte et histogram

Den andre teknikken vi skal bruke i denne opplæringen er Pandas “-serien.plot () ”-metode. Som standard oppretter det et linjekart, men vi kan spesielt spesifisere den typen plott vi ønsker å visualisere dataene våre med.

Programmet for denne metoden starter med å importere Pandas -biblioteket. Vi lastet Pandas -modulen og opprettet dets alias som "PD". Vi vil nå få tilgang til hvilken Pandas -metode vi trenger ved å skrive “PD” i stedet for “Pandas”. Den første metoden vi påkalte fra Pandas verktøysett er “PD.Serie () ”for bygging av en Pandas -serie. “PD.Series () ”-metode brukes med to attributter,“ Data ”og“ Navn ”.

Listen over verdier er lagret i “Data”, og tittelen på listen er definert i “Navn”. Verdiene vi ga for seriens skapelse er “20, 34, 45, 67, 64, 78, 98, 72, 12, 34, 17, 92, 56, 77, 63, 37, 29, 11, 20, 80, 44, 21, 37, 65, 48, 88, 24, 37, 33, 19, 74, 26 ”. Det totale antallet verdier som er lagret i denne listen er 32. Navnet vi har definert for listen over verdier er "verdier". Serien vil bli bevart i et serieobjekt for å gjøre det mulig for oss å bruke den senere. Vi har laget et serieobjekt, "my_series," og tildelt det til den nyopprettede serien.

Ettersom serien vi genererte er veldig lang og kan ikke sees i et enkelt øyeblikksbilde, så vi har bestemt oss for å vise bare de første oppføringene ved å utøve “-serien.head () ”-metode innen“ print () ”-funksjonen.

Navnet på serien, datatype av serien, og serieverdiene er utstilt på Python -konsollen.

Nå vil vi bruke denne serien til å lage sin visuelle representasjon ved hjelp av et plot.

Seriene.plot () ”-metoden påkalles. Her nevnte vi seriens navn som "my_series" med ".plot () ”-funksjon. Mellom parentesene i denne metoden brukes parameteren "slag". Denne attributtet vil definere typen plott som skal trekkes ut. Når vi ønsker å plotte et histogram, har vi spesifisert "typen" som "hist".

Histogrammet vårt genereres på skjermen, som har 10 binger for verdifordeling.

Vi kan endre formateringen av plottet vårt. For dette har vi laget en variabel "container" for å lagre histogrammet i den. Deretter benyttet vi “set_xlabe () l” for å identifisere en etikett “liste over verdier” som vil bli vist på x-aksen. I tillegg, for å sette etiketten til histogrammet, har vi brukt metoden "set_title ()" til tittelen et plot som "dette er vår demo plot".

Du kan se resultatene i nedenfor presenterte visuelle histogramplott.

Konklusjon

Visualisering av en serie data ved å lage plott er en veldig nyttig teknikk for rask dataanalyse. Denne leksjonen introduserte deg for de to metodene for å plotte histogrammet ved å bruke Pandas -serien. Den første teknikken vi har diskutert er "-serien.Hist () ”-metode, som også utforsker konseptet med å endre binger. Den andre funksjonen som utøves er “serien.plot () ”-metode. I denne teknikken har vi lært å endre formateringen av plottet i henhold til våre behov.