Standardfeil i r

Standardfeil i r
“Standardfeilen til gjennomsnittet er et veldig viktig og essensielt ord i statistikk. Til tross for standardavvik, som er en måling av datadispersjon, avslører den hvor langt prøven avviker fra det sanne middel. Det er ingen standardfeilfunksjon i r. Å beregne; Du kan enten skrive din standardfeilmetode eller bruke et program som Plotrix. I R, estimering av standardfeilen til gjennomsnittet er enkel. Standardfeilen (SE) i R er ganske grei. Vi kan bruke Plotrix's STD.Feil () Funksjon eller skriv vår egen.”

Hva er standardfeilen i R -språket i Ubuntu 20.04?

Standardfeilen til en data er prøvedistribusjonens standardavvik, eller et estimat av det (SE). For å ha standardfeilen, del standardfeilen med kvadratroten til eksperimentelle data. Vi vil utforske hvordan vi kan estimere standardfeilen til middelverdien i R -skriptspråket i dette innlegget. Standardfeilen kan beregnes matematisk ved hjelp av formelen:

Syntaks:

SD (A)/SQRT (lengde ((a)))

Vi har SD, som er nevnt som standardavvikingsmetoden. Inngangen “A” er variabelen til eksempeldataene. SEM (standardfeil for middelverdien) er et kriterium for å evaluere hvordan omfattende verdier er spredt rundt middelverdien. Ta hensyn til følgende to faktorer når du vurderer standardfeilen i gjennomsnittet:

  • Flere av elementene i en samling er spredt ut over gjennomsnittet når standardavviket for gjennomsnittet øker.
  • Når størrelsen på de gitte dataene utvides, faller middelets standardavvik.

Standard feilapplikasjonen i R i Ubuntu 20.04

  • Det beregnede standardavviket for prøvedistribusjonen er statistikkens standardfeil. Dette skapes ved å ta prøver av befolkningens gjennomsnittlige eller annen statistikk (inkludert prøvestandardavvik) gjentatte ganger og observere variasjonen i prøvene dine. Denne statistikken finnes ofte i både sammendrag og beskrivende statistikkperspektiver. I en test eller et eksperiment er det viktig å bruke en tilfeldig prøvetilnærming for å oppnå den mest nøyaktige datapunktsmodellen som mulig, slik at Barplot eller et annet datamodelleksempel er så nøyaktig som mulig og så nær en normal distribusjon som mulig.
  • Standardfeilen til en prøves gjennomsnitt er et mål på hvor nær det er den ekte befolkningens middelverdi. Hvis standardfeilen din er betydelig, er statistikken upresis. Når prøvestørrelsene blir større, har prøvemidlene en tendens til å klynge seg nærmere det sanne middelet.
  • Standardfeilen (skalert basert på prøvestørrelseens kvadratrot) og varians påvirkes begge av prøvestørrelsen, som sett i eksemplet ovenfor. Dette har konsekvenser for din befolkning betyr estimatets konfidensintervall.

Hvordan evaluere standardfeilen i R i Ubuntu 20.04?

I denne artikkelen lærer du hvordan du beregner et datasetts standardfeil ved å bruke noen forskjellige metoder i R. Det er verdt å merke seg at resultatene av alle prosedyrene er identiske.

Eksempel 1: Bruke SD -metoden for evaluering av standardfeil i R i Ubuntu 20.04

Ved å bruke funksjonene som er inkludert i base r -skriptpakken, kan du raskt bestemme standardavviket for middelverdien. For frittstående beregninger, distribuerer SD-metoden (standardavvik i R). Standardavviket beregnes ved hjelp av SD () -metoden, som godtar en heltallvektor som input. Vi vil bruke SD () -metoden for å beregne standardavviket, etterfulgt av lengden () -metoden for å definere antall observasjoner totalt.

I det gitte skriptet har vi erklært en variabel x der den numeriske vektoren er initialisert. Deretter har vi en utskriftsuttalelse, og innen utskriftserklæringen har vi en SD -funksjon for å ta inngangen X og deretter dele med SQRT -funksjonen, som har lengdeoperasjonen på variabelen x. Når utføres, viser utskriftserklæringen ut -estimering av standardfeil.

Eksempel nr. 2: Bruke standardfeilformelen for å evaluere standardfeilen i R i Ubuntu 20.04

For å få observasjonene, skal vi bruke standardfeilformelen. Formelen er SQRT (sum ((A-Mean (a))^2/(lengde (a) -1)))/Sqrt (lengde (a)) for standardfeilen, der inngangen er data. Kvadratroten er estimert ved bruk av data SQRT -funksjonen. Summen er en metode som brukes til å estimere det samlede antallet elementer i et datasett. Funksjonen brukes til å beregne dataens gjennomsnitt. Lengdemetoden brukes til å skaffe datalengde.

X -variabelen er definert her og initialisert med vektorene med ti elementer. Standardfeilformelen brukes på inngangen til data x inne i utskriftskommandoen, som genererer estimering av standardavviket for denne vektoren.

Eksempel nr. 3: Bruke STD.Feilfunksjonen til Plotrix -modulen for å evaluere standardfeilen i R i Ubuntu 20.04

Installer Plotrix -pakken i R for å bruke STD.Feil () Funksjon. Std.Feil () Metode i Plotrix-tilleggsmodulen kan også estimere standardfeilen. Standardavviket blir evaluert ved bruk av STD.Feil () Metode. En numerisk vektor kan sendes til STD.Feil () Funksjon.

Her har vi lagt til modulen Plotrix inne i bibliotekfunksjonen da vi har inkludert Plotrix -modulen, så nå kan vi enkelt bruke STD.Feilfunksjon for standardfeilestimering. For dette har vi opprettet dataene i variabelen V og passert variabelen V i STD.Feilfunksjon, som kalles innenfor utskriftskommandoen. Ved utførelsen av utskriftserklæringen genereres standardfeilverdien.

Konklusjon

Her har vi gjort med standardfeilen på R -språket. Gjennomsnittet (SEM) er en statistikk for å finne ut hvor mye verdier i et datasett distribueres. Med delingen av standardfeilen med roten til prøvetakingsstørrelsen, beregnes utvalgsmiddelet. Vi har analysert tre måter å evaluere standardfeilen i denne R -artikkelen: ved å bruke SD () -metoden i kombinasjon med lengdefunksjonen, brukes standardfeilformelen som en guide, og den siste Plotrix -pakken brukes.