Gjennomsnitt i r

Gjennomsnitt i r

Gjennomsnittet er en verdi som vi får fra et datasett eller et utvalg. Det representerer datasettet eller prøven som det beregnes. Innen statistikk og matematikk beregnes det ved å dele summen av datasettverdier med det totale antall verdier i det gitte datasettet. Gjennomsnitt, median og modus er klassifiseringene av gjennomsnittsfunksjonen. Av disse tre typer gjennomsnitt er gjennomsnittet det mest brukte.

For å finne gjennomsnittet av en verdi, kan vi oppsummere alle numeriske data eller verdier i et sett eller serie sammen og dele dem med antall verdier i disse settene eller seriene. Hvis du for eksempel ønsket å beregne gjennomsnittet av 12, 4 og 6, etter å ha lagt dem til, ville du fått 22, så dele det med antall verdier, i.e., 3. Som et resultat tilsvarer gjennomsnittet av 12, 4 og 6 22/3 = 7.333. Medianfunksjonen ordner datasettet i stigende rekkefølge og finner deretter mellomverdien fra det gitte settet, mens modus brukes til å finne den mest gjentatte eller forekommende verdien fra datasettet.

Hvorfor bruke gjennomsnittet:

Hovedformålet med den gjennomsnittlige funksjonen er å finne endringen i eksempeldata av samme type over tid. På de fleste programmeringsspråk blir den gjennomsnittlige funksjonen vurdert under innebygde statistiske funksjoner. Det vil gi deg den gjennomsnittlige verdien av et sett med tall. Det brukes til å finne ut hva det aritmetiske gjennomsnittet av et sett med parametere er.

Hva er R -gjennomsnittet i Ubuntu 20.04?

R brukes som et dataanalyseverktøy og statistisk programvare. R kommer med et kommandolinjegrensesnitt som standard. R -programmeringsspråket har noen enkle teknikker for å beregne gjennomsnittet. R -basepakken inneholder de fleste av disse funksjonene. Disse funksjonene godtar R -vektoren og argumentene som inngang og returnerer utgangen. Modus, median, eller (oftest) gjennomsnittet er et tall som uttrykker sentrum eller vanlig verdi i et sett med data og bestemmes ved å dele totalen av verdiene i settet med nummeret deres.

I de følgende eksemplene vil vi lære deg syntaks for disse funksjonene og hvordan du kan bruke dem i R.

Eksempel 1: R Gjennomsnitt/gjennomsnitt av en vektor:

I R regnes gjennomsnittlig og gjennomsnittlige funksjoner som de samme. Navnene på disse funksjonene kan brukes om hverandre. For å finne gjennomsnittet av en vektor, lager vi en vektor v1 med numeriske verdier.

Etter å ha opprettet vektoren V1, vil vi gi vektoren til middelfunksjonen (). Da vil middelfunksjonen summe alle verdiene i vektor v1 og dele dem med det totale antall verdier for å bestemme gjennomsnittet av den gitte vektoren.

Som sett i eksemplet over, tar middelfunksjonen vektoren V1 som inngang og produserer en numerisk verdi på 12.1. Fordi det ikke var noen nullverdier i dataene, var det enkelt å beregne gjennomsnittet av vektor v1. Utfallet vil være annerledes hvis en nullverdi er inkludert i vektoren. For å unngå nullverdier, kan vi bruke NA.RM -alternativet innenfor gjennomsnittet () -funksjonen. Hvis vi spesifiserer Na.RM = SANN I parametrene til middelfunksjonen vil alle NA -verdiene bli ignorert. Deretter en.RM er en parameter brukt av mange rammedatafunksjoner og er verken en operasjon eller en funksjon.

La oss opprette en vektor som har Na/NULL -verdier.

Når middelfunksjonen brukes på V2, i stedet for å generere en middelverdi, viser den en utgang av NA. Som vi har diskutert tidligere, kan bare numeriske data sendes som inndata i middelfunksjonen. For å unngå slike problemer, bruker vi NA.RM -parameter inne i middelfunksjonen.

Som du kan se, ved hjelp av NA.RM -alternativet vi har en nøyaktig output betyr jeg.e. 18.

Eksempel nr. 2: Median av en vektor i R:

For å finne medianen i R, er det en innebygd funksjonsmedian () å finne som kan brukes. Vi vil lage en vektor og gi den inn i medianfunksjonen som et argument.

Hvis vi bruker medianfunksjonen på en vektor med jevn verdier, gir den en uklar utgang, i.e. 4.5 I vårt tilfelle. På den annen side, med vektoren som inneholder det rare antall verdier, er utgangen fra medianen et reelt tall, i.e. 6.

Akkurat som middelfunksjonen, kan vi også bruke NA.RM -alternativ i median () -funksjonen hvis det er NA- eller NULL -verdier i datasettet.

Eksempel nr. 3: modus for en vektor i r:

For å beregne modus, oppretter vi en brukerdefinert funksjon ved hjelp av kode som vist i eksemplet nedenfor. Først oppretter vi en variabel modus og tildeler en funksjon og dens beskrivelse til modusvariabelen. I funksjonen er det bare en parameter, så hver verdi i datasettet vil bli bestått som et argument. I parentesen vil noen operasjoner bli utført på 'V' -parameteren for å identifisere det mest gjentatte elementet i datasettet.

Når modusfunksjonen er opprettet, vil vi lage en vektor som skal mates som en inngang i denne funksjonen, i.e. modus ().

Når vektorens verdier 'sendes inn i modusfunksjonen, vil den beregne modus for den vektoren. Ettersom 7 er det mest gjentatte elementet i den gitte vektorens 'verdier', så vil utgangen være 7.

Konklusjon:

I denne opplæringen har vi sett hvordan vi bruker gjennomsnittet på R -programmeringsspråk, og vi har diskutert forskjellige typer gjennomsnitt. Vi har implementert tre eksempler for å vise deg hvordan du kan bruke middel-, median- og modusfunksjoner i R, hvordan lage en modusfunksjon manuelt; og hva forskjellene i resultatet av moden når datasettet består av odd eller til og med verdier. Vi har også sett bruken av NA.RM -alternativet i middel- og medianfunksjoner.