Plotly.uttrykke.histogram

Plotly.uttrykke.histogram
En av de vanligste tomtene i statistisk analyse er et histogram. Det er en av de mest effektive og enkle måten å implementere type plott som viser frekvensfordeling. Det ligner veldig på en bardiagram med noen få store forskjeller. Tenk på det som en aggregert barplott.

I denne opplæringen lærer vi hvordan vi kan lage et histogramplott ved hjelp av plottly ekspressmodulen.

Plotly.uttrykke.histogram ()

I Plotly Express bruker vi histogram () -funksjonen for å lage histogramplott. Funksjonen gir en syntaks som vist:

plotly.uttrykke.histogram (data_frame = ingen, x = ingen, y = ingen, farge = ingen, mønster_shape = ingen, faset_row = ingen, FACET_COL = ingen, FACET_COL_WRAP = 0, FACET_ROW_SPACING = ingen, FACET_COL_SPACING = ingen, hover_name = ingen, hover_dataaa animation_frame=None, animation_group=None, category_orders=None, labels=None, color_discrete_sequence=None, color_discrete_map=None, pattern_shape_sequence=None, pattern_shape_map=None, marginal=None, opacity=None, orientation=None, barmode='relative', Barnorm = ingen, histnorm = ingen, log_x = falsk, log_y = falsk, range_x = ingen, range_y = ingen, histfunc = ingen, kumulativ = ingen, nbins = ingen, text_auto = falsk, tittel = ingen, mal = ingen, bredde = Ingen, høyde = ingen)

Følgende er de mest nyttige funksjonsparametere du trenger å vite:

  1. Data_frame - Angir datarammen som inneholder kolonnenavnene. Du kan passere denne verdien som en dataaframe, en ordbok eller et array_lignende objekt.
  2. X - Spesifiserer verdiene som brukes til å plassere merkene langs x -aksen langs den kartesiske koordinaten. Dette kan være et kolonnenavn i en dataramme eller en Pandas -serie.
  3. Y - Ligner på X, men verdiene som er spesifisert i denne parameteren, brukes til å plassere merkene langs Y -aksen.
  4. Farge - definerer verdiene som brukes til å tilordne en unik farge til merkene.
  5. Kumulativ - spesifiserer om verdiene til histogrammet er kumulative.
  6. NBINS - Angir antall binger.
  7. Histnrom - Angir modus som binsene opprettes. Aksepterte verdier inkluderer:
    1. 'prosent'
    2. 'sannsynlighet'
    3. 'Tetthet'
    4. 'Sannsynlighetstetthet'

Funksjonen vil deretter returnere et histogramplott av Type Graph_Objects.Figur.

Eksempel - Bruke GapMinder () -dataene

Vi kan lage et histogram ved hjelp av gapminderdataene. Ta eksempelkoden vist nedenfor:

Importer plotly.uttrykk som px
df = px.data.Gapminder ().spørring ("kontinent == 'Europa'")
Fig = px.histogram (df, x = 'gdppercap')
Fig.forestilling()

I eksemplet over bruker vi GapMinder () -dataene fra Plotly Express. Vi plotter et histogram som viser fordelingen av BNP per innbygger av landene i Europa -kontinentet.

Når vi har kjørt koden over, bør vi se et histogram som vist:

Eksempel 2 - Bruke kategoriske data

Vi kan også lage et histogram med kategoriske data ved å spesifisere x- og y -parametrene.

Ta eksempelkoden vist nedenfor:

Importer plotly.uttrykk som px
df = px.data.Gapminder ().spørring ("kontinent == 'Europa'")
Fig = px.histogram (df, x = 'land', y = 'gdppercap')
Fig.forestilling()

I dette tilfellet vil histogrammet vise hvert land og summen av BNP per innbygger som vist på figuren nedenfor:

Eksempel 3 - Spesifisering av normaliseringstype

Som standard vil plotly lage et histogram med hver prøve i hver søppel. Imidlertid kan vi spesifisere modusen vi ønsker å presentere binsene ved hjelp av Histnorm -parameteren.

La oss se på forskjellige eksempler:

Sannsynlighetstetthet

Fig = px.histogram (df, x = 'gdppercap', histnorm = 'sannsynlighetstetthet')
Fig.forestilling()

I dette eksemplet skaper vi en sannsynlighetstetthetshistogram som er en sum av stangområdene lik 1.

Den resulterende figuren er som vist:

Sjekk parameterlisten for å lære de forskjellige typene du kan spesifisere.

Eksempel 4 - Spesifiser antall binger

Som standard vil plotly velge antall binger slik at det kan sammenlignes med antall prøver i en søppelkasse. Vi kan imidlertid spesifisere antall binger ved hjelp av NBINS -parameteren.

Et eksempel er som vist:

Fig = px.Histogram (df, x = 'gdppercap', nbins = 50)
Fig.forestilling()

I eksemplet over spesifiserer vi antall binger til 50. Dette skal returnere en figur som vist:

Eksempel 5 - Spesifiser fargeparameteren

Vi kan også spesifisere fargeparameteren. Dette vil tilordne en unik farge basert på det spesifiserte kolonnens navn.

Eksempelkode er som vist:

Fig = px.histogram (df, x = 'gdppercap', color = 'country')
Fig.forestilling()

Den resulterende figuren:

I dette tilfellet vil Plotly tildele en unik farge til hvert land i plottet som spesifisert av fargeparameteren.

Eksempel 6 - Horisontalt histogram

Plotly lar oss også lage horisontale histogrammer. Ta en titt på koden nedenfor:

Fig = px.histogram (df, x = 'gdppercap', y = 'land', farge = 'land')
Fig.forestilling()

I dette tilfellet planlegger vi et histogram av summen av BNP per innbygger for hvert land. Koden over skal returnere et tall som vist:

Eksempel 7 - Sortering etter kategorirekkefølge

I noen tilfeller kan det være lurt å sortere det resulterende plottet basert på en spesifikk verdi. For eksempel, i histogrammet ovenfor, kan vi sortere histogrammet basert på det totale GDpperCap i stigende rekkefølge.

Bruke funksjonen Update_xaxes eller Update_yaxes, spesifiserer vi hvordan vi ønsker å sortere dataene.

I vårt eksempel ønsker vi å sortere y -aksen. Derfor vil vi bruke oppdaterings_yaxes () -funksjonen. I funksjonen kan vi spesifisere kategorienderparameteren og metoden vi ønsker å sortere dataene. I dette tilfellet 'Total synkende'.

Vi kan kjøre koden som vist:

Fig = px.histogram (df, x = 'gdppercap', y = 'land', farge = 'land').update_yaxes (categoryOrder = 'Total nedstigning')
Fig.forestilling()

Koden over skal resultere i et tall som vist:

Konklusjon

I denne artikkelen utforsket vi hvordan vi bruker histogram () -funksjonen fra Plotly Express -modulen. Funksjonen lar oss lage histogrammer over forskjellige data.