Binomial distribusjon i r

Binomial distribusjon i r

Innen statistikk er binomialfordelingen en type sannsynlighetsfordeling. I binomial distribusjonsmodell kan hver prøve bare ha en utgang. Den samme sannsynligheten for suksess må være den samme for hver prøve, og flere forsøk kan ikke oppstå om gangen, eller de skal ikke påvirke hverandres produksjon.

I et multiple-gjentatt eksperiment eller undersøkelse kan binomialfordelingen betraktes som sannsynligheten for et pass eller mislykket resultat av en hendelse. Den binomiale fordelingen gir resultatet på bare to mulige måter eller verdier (prefikset "bi" betyr "to" eller "to ganger"). Når vi for eksempel vipper en mynt, har den bare to resultater: hoder eller haler, og å gjennomføre en test har bare to utfall: suksess eller fiasko.

Hvorfor bruke binomial distribusjon:

Sannsynlighetsfordelingsmodellen kan brukes til å svare på en rekke komplekse forretningsutfordringer. Disse modellene gir svar på spørsmål som “Hvor sannsynlig er vareprisene å vokse i løpet av det neste året?”Binomial- og Poisson -distribusjonene av diskrete tilfeldige variabler er to av de mest utnyttede sannsynlighetsfordelingene i virksomheten (bare et begrenset antall verdier er mulig). Den binomiale distribusjonen beregner sannsynligheten for forekomster med bare to mulige utfall (suksess eller fiasko), for eksempel å se på lukkekursen på en aksje hver dag i et år og se om den klatret eller redusert.

Hva er binomial distribusjon i R:

Binomial distribusjon brukes på R -programmeringsspråket for å løse eller svare på de statistiske problemene. Det er en klassifisering av sannsynlighetsfordelingen. Det er fire definerte funksjoner for binomial distribusjon i r, i.e. dbinom, pbinom, qbinom og rbinom. Å være en diskret distribusjonsmodell, suksess eller fiasko er de eneste to mulige resultatene som kan genereres av binomial distribusjonsmodellen. Alle forsøkene er uavhengige, sannsynligheten for suksess forblir konstant, og det forrige resultatet vil ikke påvirke neste produksjon eller resultat. Resultatene fra forskjellige forsøk er ikke relatert. Den binomiale distribusjonen lar oss beregne individuelle og kumulative sannsynligheter over et gitt område.

Hvordan bruke binomial distribusjon i R:

For å bruke binomial distribusjonsmodell i R, er det fire definerte innebygde funksjoner (Dbinom, Pbinom, Qbinom, Rbinom). Følgende er syntaks for disse funksjonene:

Mens verdivektoren P representerer sannsynlighetsvektoren, N inneholder hyppigheten av observasjoner, beskriver størrelsen på antall forsøk, og ProB indikerer sannsynligheten eller sannsynligheten for fullføring av prøve. I eksemplene nedenfor vil vi lære deg hvordan du bruker disse innebygde funksjonene i R.

Eksempel nr. 1: Dbinom -funksjonen i r

Dbinom er kjent som binomial tetthetsfunksjon i r. Det brukes til å finne tettheten av binomial distribusjon. For å lage en R -plott av dbinom -funksjonen, vil vi lage en vektor (x_dbniom) som inneholder verdier. Denne vektoren vil bli matet som en inngang i dbinom -funksjonen.

Etter å ha opprettet vektoren, vil vi bruke dbinom -funksjonen på vektoren vi har opprettet ovenfor. Vi vil tildele denne funksjonen til en ny variabel, i.e. (y_dbinom). Vi vil sette størrelsen lik hundre, som representerer det totale antallet forsøk. For hver binomialtrekning vil vi spesifisere sannsynligheten ved 0.5. Disse parametrene kan endres tilsvarende kravene.

For å visualisere resultatene av Dbinom -funksjonen, vil vi bruke plottfunksjonen, der vi vil passere variabelen som inneholder resultatene av dbinom -funksjonen. Resultatet er avbildet på skjermbildet.

Denne grafen viser resultatene av sannsynligheten for 100 forsøk.

Eksempel nr. 2: Pbinom -funksjonen i r

For å beregne den kumulative sannsynligheten for en hendelse, brukes pbinom -funksjon. For å lage en R -plott av pbinom -funksjonen, vil vi lage en vektor som heter X_Pbinom som inneholder verdier. Vi vil passere denne vektoren som et argument i pbinom -funksjonen.

Nå vil vi tilordne Pbinom () -funksjonen til en ny variabel (y_pbinom). Vi vil spesifisere de samme verdiene som vi brukte i eksempel nr. 1 (størrelse = 100, prob = 0.5).

Vi vil passere Y-Pbinom-variabelen i plottfunksjonen for å visualisere den på en graf. Resultatet er avbildet på skjermbildet.

Sannsynlighetene for de første 40 forsøkene er 0.0, men etter det øker de gradvis til 60 forsøk, og gir en utgang på konstant 1.0 for alle forsøkene etter 60.

Eksempel nr. 3: QBinom -funksjonen i r

Qbinom er kjent som binomial kvantilfunksjon i r. Det brukes til å beregne den omvendte kumulative sannsynligheten for en hendelse. For å lage en R -plott av QBinom -funksjonen, vil vi i første trinn lage en vektor (X_QBniom) som inneholder noen verdier. Denne vektoren vil bli matet som en inngang i qbinom -funksjonen.

Vi bruker nå Qbinom -funksjonen for å finne verdiene til binomial kvantilfunksjon.

Vi vil bruke plottfunksjonen for å vise resultatene av plottet. Resultatet er avbildet på skjermbildet.

Eksempel 4: Rbinom -funksjonen i r

Rbinom -funksjonen brukes i R for å generere et tilfeldig tall med binomialfordelingen. For reproduserbarhet må vi sette en frøverdi og spesifisere en prøvestørrelse av tallet som skal trekkes.

Nå kan vi bruke Rbinom -funksjonen til å generere tilfeldige verdier og tilordne dem til en ny variabel, som vi senere vil bruke i HIST () -funksjonen.

Som du ser, gir det oss tilfeldige tall og rekkevidden deres er mellom 0 og 100.

Vi vil bruke ovennevnte hist () -funksjon for å illustrere resultatet av histogrammet. Resultatet er avbildet på skjermbildet.

Konklusjon

Etter å ha dekket denne opplæringen nå, bør du ha en bedre forståelse av binomial distribusjon. Du vil bli kjent med hvilke typer binomial distribusjon. Det kan være nyttig i forskjellige forretningskompleksiteter så vel som fremtidig statistisk forskning. I denne opplæringen har vi diskutert binomialfordelingen, dens typer og hvordan du kan bruke dem i R. Vi har implementert forskjellige eksempler for å gjøre det enkelt for alle leserne å forstå det tydeligere.