Histogram i r

Histogram i r

Histogrammer er diagrammer sammensatt av rektangler for å vise ethvert statistiske datasett. De brukes til å oppsummere fordelingen av statistisk informasjon grafisk. Histogrammer er veldig allsidige og gir enkelhet. De brukes til å representere frekvensene til en variabel i kontinuerlige områder.

Vi vil prøve å dekke histogrammet i denne artikkelen. Vi vil først gå gjennom syntaksen til hist () funksjon Før du ser på noen eksempler på hvordan du lager histogrammer i R ved å bruke denne metoden.

Histogrammet i r:

I R-programmering er histogrammer veldig nyttige for å visualisere det brukerdefinerte området. Histogrammet er en av de mest brukte plottene for grafisk datavisning og analyse. Histogrammer er ofte avbildet som vertikale rektangler rettet langs en todimensjonal akse, og viser en sammenligning av datagrupper. Datatellene er representert med størrelsen på kolonnene eller rektangulære bokser på Y-aksen, mens datagruppenes verdier er vist på x-aksen. Histogrammer hjelper til med evaluering av data. I R kan et histogram genereres for en spesifikk variabel. Dette er viktig for variabel valg og funksjonslæringsprogrammer i datavitenskapelige prosjekter.

Konstruere et histogram i r:

Syntaksen for konstruksjon av et histogram i R er:

# HIST (V, Main, XLAB, Ylab, XLIM, Ylim, Breaks, COL, Border)

v”Representerer dataene som brukes til å lage histogrammet. “hoved-”Er tittelen på røye,”col”Er fargen på stolpene,”xlab”Er en etikett for den horisontale aksen, og“ylab”Er en etikett for den vertikale aksen. “xlim”Brukes til å definere den horisontale aksegrensen. “ylim”Brukes til å definere den vertikale aksegrensen. “gå i stykker”Brukes til å spesifisere bredden på binger. “grense”Angir fargen på barens grense.

Vi vil utføre forskjellige eksempler for å forstå og implementere alle parametrene som er nevnt i avsnittet ovenfor.

Eksempel 1: Opprette et enkelt histogram i R ved hjelp av et innebygd datasett eller vektor:

Histogrammet trenger noe innebygd datasett for å importere til R for evaluering. Tallrike grafiske moduler og funksjoner er inkludert i R samt bibliotekene. Vi brukte det innebygde luftpassasjerens datasett i dette eksemplet. For å konstruere et histogram for et bestemt datasett, bruk HIST () -funksjonen med et $ -skilt for å velge en spesifikk kolonne med data fra datasettet.

Følgende eksempel oppretter et histogram av verdiene i luftpassasjerens datasett:

Det resulterende histogrammet ser slik ut:

I eksemplet ovenfor lærte du å lage et histogram ved å bruke det innebygde datasettet. Videre kan du raskt generere et histogram som bruker "Hist ()" -funksjonen som evaluerer et histogram avhengig av verdiene du spesifiserer. Du oppgi navnet på datasettet ditt mellom parentesene i denne funksjonen. Denne funksjonen godtar en liste over tall for å plotte histogrammet.

Ved å bruke alternativet "Main" kan du legge til en tittel i histogrammet. Ved å passere “Main” som en inngang til Hist () -metoden, kan du endre navnet på histogrammet. I dette scenariet lager du et histogram fra "S" datainnsamlingen kalt "All Students". Mens “XLAB” vil bli brukt til å navngi x-aksen.

Du kan se utgangshistogrammet til HIST () med en liste over tall:

Eksempel nr. 2: Legge til farge, kant og bryter til histogrammet:

Standardrepresentasjoner hjelper deg sjelden med å analysere histogrammer. Du må ta et ytterligere trekk for å få en dypere kunnskap om histogrammer. R gir forskjellige raske og enkle løsninger for å optimalisere diagramrepresentasjon mens du fremdeles bruker HIST () -funksjonen.

”COL” -argumentet vil bli brukt til å legge til farge i histogrammet og deretter nevne fargenavnet. Bortsett fra det, kan du også legge til grensefarge til histogrammets binger ved å bruke parameteren "grensen". Alternativet "pauser" lar oss velge antall barer i histogrammet. Dette nummeret er imidlertid bare en anbefaling. Vi kan definere antall stenger i histogrammet med "pauser" -parameteren. Du kan gi "pauser" -parameteren en vektor av bruddpunkter hvis du vil ha ekstra kontroll over bruddpunktene mellom bins. Dette er mulig med "C ()" -funksjonen.

Farget utgangshistogram:

Eksempel nr. 3: Innstilling av rekkevidde av x-aksen og y-aksen:

For å spesifisere verdiene, bruk "XLIM" og "Ylim" -argumentene. Området som gis til disse to argumentene vil bestemme aksene til histogrammet vårt. La oss få et glimt av hvordan det gjøres nedenfor.

Dette histogrammet i kodebiten ovenfor har en x-aksen begrenset til verdier 0 til 50 og en y-aksen begrenset til verdier 0 til 4. Når du bruker “XLIM” og “Ylim”, brukes “C ()” -metoden for å begrense verdiene på aksene. Det tar to verdier: en for start og en for slutten.

Ovennevnte skript oppretter et histogram med dataverdier fra “S” og kaller det “alle studenter”, merker x-aksen som “nei. av studenter ”, legger til en svart kant og en blå farge til søppelkassene, begrenser x-aksen fra 0 til 50, y-aksen fra 0 til 4, og endrer bin-bredden til 6.

Eksempel 4: Histogram med klekket fyllmønster:

Du kan også konstruere et histogram med det klekkede mønsteret. I dette eksemplet er klekkingsfyllhistogram med 45 ° skrålinjer konstruert. I et histogram bestemmes frekvensen av baren i stedet for dens høyde, som refererer til dens "tetthet". Klekkingslinjene vil være blå mens grensene vil være svart.

Når vi kjører koden ovenfor, får vi følgende resultat:

Konklusjon:

I dette emnet forsøkte vi å utforske grunnleggende om histogrambygging i R ved hjelp av RStudio. For å bruke argumentene i “hist ()” -metoden, utfører vi flere kodesett. I fire tilfeller dekket vi den grunnleggende konstruksjonen av et histogram, hvordan du legger farge og kant til et histogram, hvordan du kan begrense rekkevidden til x- og y -aksene, og hvordan du legger klekking til histogrammer. Du vil være i stand til å forbedre den visuelle appellen til histogrammet ditt ved å følge disse enkle og enkle eksemplene.