Pandaene.Dataramme.Hist () Teknikk brukes til å bestemme hvordan de numeriske variablene er distribuert. Verdiene er delt opp i numeriske variabler etter denne funksjonen. Dets primære formål er å lage et histogram fra en spesifisert dataframe. Når Pandas dataaframe.Hist () Metode brukes, hver serie i den spesifiserte DataFrame blir automatisk sendt til matplotlib. Pyplot.Hist () Metode. Til gjengjeld får vi et histogram for hver kolonne. Vi vil plotte histogrammet til DataFrame i denne guiden ved å bruke “Hist ()” -metoden til Pandas.
Syntaks:
Dataramme.hist (data, kolonne = ingen, av = ingen, rutenett = true, xLabelSize = ingen, xrot = ingen, ylabelSize = ingen, yrot = ingen, øks = ingen, sharex = falsk, sharey = falsk, figsize = ingen, layout = Ingen, binger = 10, backend = ingen, legende = falsk, ** kwargs)
Eksempel 1:
Pandas -kodene i denne guiden utføres på "Spyder" -verktøyet. I første linje importerer vi “Pandas som PD”. Deretter lager vi en "verdier" dataaframe ved å bruke “PD.DataFrame () ”-metode. Vi utvikler to kolonner av "verdiene" DataFrame som er "Lengde L" og "Bredde B". Og vi legger de numeriske verdiene i hver av dem. I “Lengde L” setter vi inn “2.7, 8.7, 3.4, 2.4, og 1.9 ”Numerisk verdi. Mens vi er i “Bredde B”, setter vi inn “4.24, 2.67, 7.6, 7.1 og 4.9 ”Numeriske Vlaues. Nå tegner vi histogrammet over disse dataene fra DataFrame. Vi initialiserer "Hist" -variabelen med “DataFrame.Hist () ”-metode og sett inn“ bins = 6 ”.
Et histogram evaluerer antall målinger som oppstår gjennom hver søppel etter å ha delt verdiene som er inneholdt i en numerisk variabel i “binger.”Vi kan raskt og enkelt få en instinktiv forståelse av fordelingen av verdier inne i en variabel ved å visuelt representere de innkoblede tellingene på en søyle.
Denne utgangen vises på Spyder -konsollen når vi trykker på “Shift + Enter” -tastene på tastaturet. Her har vi to histogrammer. Dette er histogrammer av disse dataene vi satte inn i Pandas -koden.
Eksempel 2:
Vi genererer "verdiene" DataFrame her som inneholder tre kolonner som er “B_1, H_1 og L_1” som viser henholdsvis bredde, høyde og lengde. Vi legger til “4.24, 2.67, 7.6, 7.1 og 4.9 ”i“ B_1 ”. Vi legger til også legger til "6.8, 5.5, 4.8, 11.88, og 1.1 ”i“ H_1 ”. Deretter setter vi inn “3.7, 9.7, 3.4, 4.4 og 2.9 ”i“ L_1 ”. Etter dette bruker vi “Hist ()” -metoden som konverterer disse numeriske verdiene til et histogram. Den trekker tre separate histogrammer. "Binger" -verdien som vi setter her er "12".
Tre forskjellige histogramdiagrammer vises i utgangen. Det første histogrammet er av “B_1” -dataene, det andre histogramdiagrammet er av “H_1” -dataene, og det siste er av “L_1” -dataene.
Eksempel 3:
Nå tegner vi fire distinkte histogrammer i dette eksemplet. For dette lager vi fire kolonner i DataFrame som “Data 1, Data 2, Data 3 og Data 4”. I “Data 1” legger vi til noen verdier som er “2.7, 0.0, 1.4, 2.4, og 1.9 ”. Vi plasserer “4.24, 2.67, 7.6, 7.1 og 4.9 ”i“ Data 2 ”. Legg til “5.8, 5.5, 7.8, 10.88, og 0.1 ”til“ Data 3 ”. Og legg til verdiene “20, 40.8, 55.8, 7.2 og 48 ”i“ Data 4 ”. Etter dette tegner vi histogrammet over alle disse kolonnene separat. Vi bruker “Hist ()” -teknikken med navnet på DataFrame og setter "binger" som "8". Det genererer fire distinkte histogrammer på utgangsskjermen.
Vi opprettet disse gitte histogrammer ved hjelp av “Hist ()” -funksjonen i pandaer. Alle kolonnene inneholder forskjellige data, så alle fire histogrammer her er forskjellige fra hverandre.
Eksempel 4:
Vi kan også tegne histogrammet over disse dataene som er til stede i CSV -filen. Nå, i dette eksemplet, plotter vi histogrammer av CSV -fildataene. For dette importerer vi “matplotlib.Pyplot ”-bibliotek som“ PLT ”. Vi får funksjonene til dette biblioteket ved å sette “PLT” -objektet i stedet for “matplotlib.Pyplot ”. Nå leser vi CSV -filen ved å bruke "read_csv" -metoden. Vi spesifiserer filens navn som inneholder dataene vi ønsker å importere til et dataaframe i "read_csv ()".
Her kalles filen “Fil.CSV ”. Dataene fra “Filen.CSV ”lagres i“ DF ”i form av DataFrame. Vi gjengir dataene til filen i form av DataFrame på konsollen. Deretter bruker vi “Hist ()” -metoden der vi plasserer navnet på kolonnen som er til stede i CSV -filen. Dette kolonnenavnet er "S_name". Når histogrammer er opprettet, vises dette navnet der. "Figsstørrelsen" som vi bruker her brukes til å justere størrelsen på histogrambildet som vi setter som "12" for "bredden" og "8" for "høyden" på histogrammet grafstørrelse.
Også "bins" er satt til "15". Til slutt plasserer vi “PLT.show () ”-metode. “Plt. Show () ”-metode lanserer en hendelsessløyfe, søker alle eksisterende figurenheter og lanserer flere interaktive vinduer som demonstrerer diagrammet eller diagrammer.
Her viser den først dataene som er til stede i CSV -filen i form av DataFrame. Deretter plotter det grafene til de numeriske dataene separat for hver.
Du vil se at vi har seks distinkte grafer her. Studentnavnene er nevnt på hver graf siden vi justerte denne "S_name" i koden. Så dette "S_name" er gjengitt her på toppen av hver graf.
Eksempel 5:
Vi importerer igjen begge bibliotekene som er "pandaer" og "matplotlib.Pyplot ”i denne koden som henholdsvis" PD "og" PLT ". Deretter tegner vi histogrammet til “Office.CSV ”-filen ved å plassere" read_csv () "-metoden først og deretter bruke den enkle" hist () "-funksjonen. I tillegg viser vi kontorfilens data som en dataaframe på terminalen før vi bruker "hist ()" -metoden. Vi legger til “PLT. show () ”-funksjon som vi forklarte i forrige eksempel.
Dataframet til “Office.CSV ”-filen er gjengitt. Histogramene deres vises i følgende illustrasjon. Her vises dataene fra CSV -filen først i form av en DataFrame.
To histogramdiagrammer vises i utdataene siden denne dataaframe bare inneholder to kolonner som har numeriske data,.
Eksempel 6:
Dette er vårt siste eksempel for denne guiden. Vi oppretter “cars_df” dataaframe og setter inn to kolonner i den. "Bilnavnet" inneholder navnene på bilene og "Challan Price" inneholder prisen på Challan. Etter dette får vi tilgang til “Hist ()” -funksjonen fra “PLT” som er biblioteket som vi importerer i begynnelsen av koden. Vi passerer kolonnen “Challan_Price” i “PLT. hist () ”-funksjon og bruk“ PLT. show () ”-metode.
Dette er histogramdiagrammet for denne koden som er tegnet basert på de numeriske verdiene som er til stede i kolonnen “Challan_Price”.
Konklusjon
"Hist ()" -metoden i pandaer er demonstrert i denne guiden. Hovedmålet vårt er å formidle ideen om “hist ()” -metoden i pandaer ganske enkelt og kortfattet. Vi forklarte hvordan du bruker Pandas “Hist ()” -funksjonen for å tegne histogrammet til de numeriske dataene til DataFrame. Vi forklarte at "histogrammet" er en visuell skildring av hvordan dataene distribueres. Du vil kunne gå videre til et mer komplisert stadium av Pandas -programmeringen etter å ha lest denne guiden. Vi håper at du vil ha stor fordel i fremtiden fra denne guiden.