Python Numpy Histogram Tutorial

Python Numpy Histogram Tutorial
Et histogram er en kartlegging av intervaller til frekvenser. Det brukes til å tilnærme sannsynlighetstetthetsfunksjonen til den spesielle variabelen. Det er kjent som bargrafen også. Mange alternativer er tilgjengelige i Python for å bygge og plotte histogrammer. Numpy Library of Python er nyttig for vitenskapelige og matematiske operasjoner. En av dette bibliotekets viktige funksjoner er å implementere histogram ved å bruke histogram () -funksjonen. Denne funksjonen brukes til å lage histogram som representerer frekvensfordelingen av data grafisk. I histogrammet er klasseintervallene representert av binger som ser ut som horisontale rektangler, og variabelhøyden representerer frekvensene. Kunnskapen om å lage numpy matrise er nødvendig for å forstå eksemplene som vises i denne opplæringen.

Syntaks:

numpy.histogram (input_array, binger = 10, rekkevidde = ingen, normert = ingen, vekter = ingen, tetthet = ingen)

Denne funksjonen kan ta seks argumenter for å returnere det beregnede histogrammet til et sett med data. Formålene med disse argumentene er forklart nedenfor.

  • input_array: Det er et obligatorisk argument som brukes til å beregne histogram -datasettet.
  • binger: Det er et valgfritt argument som kan ta heltall eller et sett med heltall eller strengverdier. Det brukes til å definere antall lignende bredder binger. En rekke søppelkanter kan defineres som øker monotonisk. Det kan inkludere høyre kant også som kan bruke ikke-ensartede søppelbredder. I den nye Numpy -versjonen kan strengverdien brukes til dette argumentet.
  • område: Det er et valgfritt argument som brukes til å definere de nedre øvre utvalgene av søppelkassene. Standardområdeverdien er angitt ved å bruke Max () og min () funksjoner. Det første elementet i området må være mindre enn eller lik det andre elementet.
  • Normert: Det er et valgfritt argument som brukes til å hente antall prøver i hver søppel. Det kan returnere falsk utgang for ulik søppelbredder.
  • Vekter: Det er et valgfritt argument som brukes til å definere matrisen som inneholder vektverdier.
  • Tetthet: Det er et valgfritt argument som kan ta en hvilken som helst boolsk verdi. Hvis dette argumentets verdi er sant, vil antallet prøver i hver søppel bli returnert; Ellers vil verdiene for sannsynlighetstetthet blir returnert.

Denne funksjonen kan returnere to matriser. Den ene er HIST -arrayen som inneholder settet med histogramdata. En annen er kantoppstillingen som inneholder verdiene på søpla.

Eksempel 1: Skriv ut histogrammets matrise

Følgende eksempel viser bruk av histogram () -funksjonen med en endimensjonal matrise og bins-argumentet med sekvensielle verdier. En matrise med 5 heltallstall har blitt brukt som en input -matrise, og en rekke 5 sekvensielle verdier har blitt brukt som binsverdi. Innholdet i histogram -arrayen og bin -arrayen vil skrive ut som utgang.

# Importer numpy bibliotek
Importer numpy som NP
# Ring histogram () -funksjon som returnerer histogramdata
np_array = np.Histogram ([10, 3, 8, 9, 7], bins = [2, 4, 6, 8, 10])
# Skriv ut histogramutgangen
Print ("Utgangen til histogram er: \ n", np_array)

Produksjon:

Følgende utgang vises etter å ha utført skriptet ovenfor.

Eksempel 2: Skriv ut histogrammet og søppelkassene

Følgende eksempel viser hvordan histogram -matrisen og BIN -arrayen kan opprettes ved å bruke histogram () -funksjonen. Det er opprettet en numpy matrise ved å bruke Arrange () -funksjonen i skriptet. Deretter har histogram () -funksjonen kalt for å returnere histogram -array- og bin -arrayverdiene separat.

# Importer numpy bibliotek
Importer numpy som NP
# Lag numpy matrise ved hjelp av Arange ()
np_array = np.Arange (90)
# Opprett histogramdata
hist_array, bin_array = np.Histogram (np_array, bins = [0, 10, 25, 45, 70, 100])
# Skriv ut histogram -matrise
Print ("Dataene til histogrammet er:", hist_array)
# Skriv ut bin -array
PRINT ("Dataene til bin -arrayen er:", bin_array)

Produksjon:

Følgende utgang vises etter å ha utført skriptet ovenfor.

Eksempel 3: Skriv ut histogram og bin -matriser basert på tetthetsargument

Følgende eksempel viser bruken av tettheten Argument fra histogrammet () -funksjonen for å lage histogram -matrisen. En numpy rekke 20 tall opprettes ved å bruke Arange () -funksjon. Den første histogram () -funksjonen kalles ved å stille inn tetthet verdi til Falsk. Den andre histogram () -funksjonen kalles ved å stille inn tetthet verdi til ekte.

# Importer numpy matrise
Importer numpy som NP
# Opprett et numpy utvalg av 20 sekvensielle tall
np_array = np.Arange (20)
# Beregn histogramdataene med falsk tetthet
hist_array, bin_array = np.histogram (np_array, tetthet = falsk)
Print ("Histogramutgangen ved å sette tetthet til FALSE: \ n", hist_array)
PRINT ("Utgangen fra Bin Array: \ n", bin_array)
# Beregn histogramdataene med ekte tetthet
hist_array, bin_array = np.histogram (np_array, tetthet = true)
print ("\ n the histogram output ved å sette tetthet til true: \ n", hist_array)
PRINT ("Utgangen fra Bin Array: \ n", bin_array)

Produksjon:

Følgende utgang vises etter å ha utført skriptet ovenfor.

Eksempel 4: Tegn et søylediagram ved hjelp av histogramdata

Du må installere matplotlib -biblioteket til Python for å tegne bardiagrammet før du utfører dette eksemplets skript. hist_array og bin_array er opprettet ved å bruke histogram () -funksjonen. Disse matriser har blitt brukt i baren () -funksjonen til Matplotlib -biblioteket for å opprette stolpediagrammet.

# Importer nødvendige biblioteker
Importer matplotlib.Pyplot som Plt
Importer numpy som NP
# Opprett histogram datasett
hist_array, bin_array = np.Histogram ([4, 10, 3, 13, 8, 9, 7], binger = [2, 4, 6, 8, 10, 12, 14])
# Angi noen konfigurasjoner for diagrammet
plt.Figur (FigSize = [10, 5])
plt.xlim (min (bin_array), max (bin_array))
plt.rutenett (akse = 'y', alfa = 0.75)
plt.Xlabel ('Edge Values', FontSize = 20)
plt.Ylabel ('Histogram Values', FontSize = 20)
plt.Tittel ('Histogram Chart', FontSize = 25)
# Opprett diagrammet
plt.Bar (bin_array [:-1], hist_array, bredde = 0.5, farge = 'blå')
# Vis diagrammet
plt.forestilling()

Produksjon:

Følgende utgang vises etter å ha utført skriptet ovenfor.

Konklusjon:

Histogram () -funksjonen er blitt forklart i denne opplæringen ved å bruke forskjellige enkle eksempler som vil hjelpe leserne å vite formålet med å bruke denne funksjonen og bruke den riktig i skriptet.