Tallrike forhåndsinnstilte funksjoner kan brukes til å analysere dataene ved bruk av statistiske teknikker i R. Basismodulen til R inneholder disse teknikkene. Gjennomsnitt, median og modus er bare noen få av de statistiske funksjonene som er tilgjengelige i R for dataanalyse. I dette spesielle innlegget vil vi presentere deg for hvordan du får modus for verdier i datasettets variabler.
Selv om modusen ikke er en av de sentrale tendensene, kan det være en veldig nyttig mengde i statistisk forskning. Mange metodologiske tilnærminger krever å etablere distribusjonsmåten, eller den oftest forekommende verdien. Du kan bruke R for å finne ut hvilke numeriske vektorer som hyppigst vises i de anskaffede dataene, noe som kan hjelpe deg med å lage anbefalinger om de ferske dataene i fremtiden. Til tross for at R-programmeringsspråket har en innebygd metode for å finne ut modusen, kan noen få kodelinjer raskt løse dette problemet.
Hva er modus i R -programmeringsspråk i Ubuntu 20.04
Som gjennomsnittet og medianen kan modusen inneholde både numeriske og karakterdata. Beregningsmodus er ikke en innebygd funksjon i R. Som en konsekvens oppretter vi en R -brukerfunksjon for å bestemme datainnsamlingsmetoden. Disse funksjonene aksepterer en vektor som en inngang og gir et resultat som en vektor.
Hvordan fungerer modus i R -programmeringsspråket i Ubuntu 20.04?
Modusfunksjonen godtar en R -vektor og argumentene som inngang og returnerer utgangen. Dataene i en STAT hvis frekvens i en variabel er like mye som alle andre data i en variabel er modus for oppføringene til den variabelen i et datasett.
Vi vil vise deg hvordan du beregner modus i R -programmeringsspråket i denne opplæringen. Det er flere tilfeller av forskjellige datascenarier.
Eksempel 1: Opprette en brukerdefinert funksjon for modus i r
Brukerdefinerte funksjoner, i motsetning til innebygde funksjoner i R, er brukerdefinerte funksjoner. Gjennomsnittlig () -metoden, for eksempel, er forhåndsinstallert og beregner gjennomsnittet av de gitte dataene. Hvis vi trenger noe gjenbrukbart, men ikke eksisterer i R, kan vi implementere vår funksjon. Siden det ikke er noen modusfunksjon på R-programmeringsspråket, opprettet vi en brukerdefinert funksjon.
I det følgende R -skriptet definerte vi en ny funksjons navn som R_Mode, som er et vilkårlig navn. Oppdragsoperatøren kalles her som spesifiserer beskrivelsen av funksjonen som skal følges. Funksjonen (x) sier at R_Mode er en funksjon med en enkelt parameter eller inngang som tar “X” som et argument. Innenfor de krøllete parentesene har vi gitt litt operasjon som presterer på argumentet x. Vi bruker denne manuelle brukerdefinerte funksjonen i hele artikkelen for modusoperasjonen.
Eksempel 2: modus for de numeriske vektortataene i r
Vi demonstrerte ganske enkelt modusfunksjonen i dette eksemplet. Her inkluderte vi den manuelle brukerdefinerte funksjonen og opprettet deretter en variabel "data" som har definisjonen av en vektorliste. Det er noen gjentatte tall i vektorlisteformen der modusfunksjonen utføres.
Innenfor r_mode -funksjonen passerte vi variabelen “Data”. Når du trykker på Enter i R -skriptkompilatoren, vises utgangen. Modusen er “5” fra de forrige dataene fra vektorlisten.
Eksempel 3: Få modus for flere numeriske vektortata
I det foregående r-eksemplet har vi en enkeltmodus returnert fra vektorens datasett. Men i noen scenarier kan en datavektor inneholde mange tall med samme gjentakelse. La oss lage et nytt vektoreksempel for å observere arbeidet med modusfunksjonen i denne situasjonen.
Til å begynne med kalte vi en manuell brukerdefinert funksjon. Vi definerte deretter et datasett med de numeriske vektorene som inneholder mer enn en modus og lagres i "data" -variabelen.
"Dataene" som har vektorer som er lagret i den, kalles inne i R_Mode -funksjonen og returnert modusverdiene 3 og 6. Disse to modusene vises i et vektortatasett. Følgende skjermbilde viser modusen som er returnert fra R_Mode -funksjonen:
Eksempel 4: Få modus for tegnvektortata
Begge de to foregående eksemplene returnerte modusen fra de numeriske vektortataene. Vi kan også beregne modus for tegnvektorens datasett. De samme reglene brukes også på karaktervektorene.
Til å begynne med benyttet vi den brukerdefinerte funksjonen. Deretter opprettet vi i neste trinn et datasett av karaktervektorene i "String_data" -variabelen. Oppdragsoperatøren brukes mellom "String_ Data" -variabelen og tegnens vektor som viser at "String_data" har definisjonen av tegnvektorene. Vi har seks strenger av karakterer her.
Deretter kalte vi R_Mode -funksjonen som "String_Data" sendes for utførelsesmodusoperasjonen. Vi fikk modus "Stars String" fra de gitte karakterene 'Vector. Denne strengen vises hyppigst i karakterstrengen til vektoren. Utgangen vises i følgende R -konsoll -øyeblikksbilde:
Eksempel 5: Få modus fra eksemplet datasettet
For å tilby deg et mer realistisk eksempel, vil vi implementere modusfunksjonen til en dataramme -kolonne fra et ekte datasett. Her valgte vi en dataramme “Iris”. Først inkluderte vi en manuell brukerdefinert funksjon som vi opprettet i forrige Exaple. Deretter tildelte vi en dataramme "iris" til en datafunksjon som en parameter.
Vi kalte hodet () og ga Dataframe “iris” til det. Datasettet vises i følgende snap -skudd:
Deretter passerte vi “kronbladet.Bredde ”kolonne fra datarammen“ iris ”til r_mode -funksjonen. Modusen er 0.2, som for det meste vises i “kronbladet.Bredde ”kolonne.
Konklusjon
Du skal nå kunne beregne modusen ved hjelp av R -skriptspråket i Ubuntu 20.04. Evnen til å evaluere modusen, derimot, innebærer ikke at du forstår den statistiske forskningen og prinsippet i modus. I R, på jakt etter datainnsamlingsmodus, konstruerte vi en manual for de brukerdefinerte funksjonene. Metoden aksepterer vektorene, enten de numeriske eller karakterstrengene, som et argument og sender ut modusverdien.