I denne opplæringen lærer vi hvordan vi kan lage et histogramplott ved hjelp av plottly ekspressmodulen.
Plotly.uttrykke.histogram ()
I Plotly Express bruker vi histogram () -funksjonen for å lage histogramplott. Funksjonen gir en syntaks som vist:
plotly.uttrykke.histogram (data_frame = ingen, x = ingen, y = ingen, farge = ingen, mønster_shape = ingen, faset_row = ingen, FACET_COL = ingen, FACET_COL_WRAP = 0, FACET_ROW_SPACING = ingen, FACET_COL_SPACING = ingen, hover_name = ingen, hover_dataaa animation_frame=None, animation_group=None, category_orders=None, labels=None, color_discrete_sequence=None, color_discrete_map=None, pattern_shape_sequence=None, pattern_shape_map=None, marginal=None, opacity=None, orientation=None, barmode='relative', Barnorm = ingen, histnorm = ingen, log_x = falsk, log_y = falsk, range_x = ingen, range_y = ingen, histfunc = ingen, kumulativ = ingen, nbins = ingen, text_auto = falsk, tittel = ingen, mal = ingen, bredde = Ingen, høyde = ingen)Følgende er de mest nyttige funksjonsparametere du trenger å vite:
Funksjonen vil deretter returnere et histogramplott av Type Graph_Objects.Figur.
Eksempel - Bruke GapMinder () -dataene
Vi kan lage et histogram ved hjelp av gapminderdataene. Ta eksempelkoden vist nedenfor:
Importer plotly.uttrykk som pxI eksemplet over bruker vi GapMinder () -dataene fra Plotly Express. Vi plotter et histogram som viser fordelingen av BNP per innbygger av landene i Europa -kontinentet.
Når vi har kjørt koden over, bør vi se et histogram som vist:
Eksempel 2 - Bruke kategoriske data
Vi kan også lage et histogram med kategoriske data ved å spesifisere x- og y -parametrene.
Ta eksempelkoden vist nedenfor:
Importer plotly.uttrykk som pxI dette tilfellet vil histogrammet vise hvert land og summen av BNP per innbygger som vist på figuren nedenfor:
Eksempel 3 - Spesifisering av normaliseringstype
Som standard vil plotly lage et histogram med hver prøve i hver søppel. Imidlertid kan vi spesifisere modusen vi ønsker å presentere binsene ved hjelp av Histnorm -parameteren.
La oss se på forskjellige eksempler:
Sannsynlighetstetthet
Fig = px.histogram (df, x = 'gdppercap', histnorm = 'sannsynlighetstetthet')I dette eksemplet skaper vi en sannsynlighetstetthetshistogram som er en sum av stangområdene lik 1.
Den resulterende figuren er som vist:
Sjekk parameterlisten for å lære de forskjellige typene du kan spesifisere.
Eksempel 4 - Spesifiser antall binger
Som standard vil plotly velge antall binger slik at det kan sammenlignes med antall prøver i en søppelkasse. Vi kan imidlertid spesifisere antall binger ved hjelp av NBINS -parameteren.
Et eksempel er som vist:
Fig = px.Histogram (df, x = 'gdppercap', nbins = 50)I eksemplet over spesifiserer vi antall binger til 50. Dette skal returnere en figur som vist:
Eksempel 5 - Spesifiser fargeparameteren
Vi kan også spesifisere fargeparameteren. Dette vil tilordne en unik farge basert på det spesifiserte kolonnens navn.
Eksempelkode er som vist:
Fig = px.histogram (df, x = 'gdppercap', color = 'country')Den resulterende figuren:
I dette tilfellet vil Plotly tildele en unik farge til hvert land i plottet som spesifisert av fargeparameteren.
Eksempel 6 - Horisontalt histogram
Plotly lar oss også lage horisontale histogrammer. Ta en titt på koden nedenfor:
Fig = px.histogram (df, x = 'gdppercap', y = 'land', farge = 'land')I dette tilfellet planlegger vi et histogram av summen av BNP per innbygger for hvert land. Koden over skal returnere et tall som vist:
Eksempel 7 - Sortering etter kategorirekkefølge
I noen tilfeller kan det være lurt å sortere det resulterende plottet basert på en spesifikk verdi. For eksempel, i histogrammet ovenfor, kan vi sortere histogrammet basert på det totale GDpperCap i stigende rekkefølge.
Bruke funksjonen Update_xaxes eller Update_yaxes, spesifiserer vi hvordan vi ønsker å sortere dataene.
I vårt eksempel ønsker vi å sortere y -aksen. Derfor vil vi bruke oppdaterings_yaxes () -funksjonen. I funksjonen kan vi spesifisere kategorienderparameteren og metoden vi ønsker å sortere dataene. I dette tilfellet 'Total synkende'.
Vi kan kjøre koden som vist:
Fig = px.histogram (df, x = 'gdppercap', y = 'land', farge = 'land').update_yaxes (categoryOrder = 'Total nedstigning')Koden over skal resultere i et tall som vist:
Konklusjon
I denne artikkelen utforsket vi hvordan vi bruker histogram () -funksjonen fra Plotly Express -modulen. Funksjonen lar oss lage histogrammer over forskjellige data.