Når ingen data er tilgjengelige med en eller flere moduler eller for en hel enhet, gjenkjennes det som tapte data. I hverdagsmiljøer er manglende verdier et fremste spørsmål. Na (ikke tilgjengelige) oppføringer brukes til å representere manglende poster i r. Mange datasett kommer i DataFrame med manglende verdier fordi de enten eksisterer, men ikke ble anskaffet eller fordi de aldri eksisterte.”
Hvordan bli kvitt NA -verdiene i R -programmeringsspråket i Ubuntu 20.04?
Symbolet Na brukes i R for å betegne manglende verdier (ikke tilgjengelig). NA kan indikere tomme verdier i dataframkolonner i R -programmeringsspråk. Vi vil se på hvordan du kan bli kvitt NA -rader i en kolonne i denne artikkelen.
Eksempel 1: Bruke er.Na -metoden for å fjerne Na i R i Ubuntu 20.04
Vi kan bruke er.Na for å eliminere slike Na -verdier fra vektoren. NA -verdiene oppnås ved bruk av er.Na () og vektorindeksen. Alle verdier bortsett fra NA vil bli returnert av IS.na ().
I eksemplet over har vi en vektorrepresentasjon der noen tilfeldige tall er inkludert sammen med NA -verdiene. Utgangen genererte også NA -verdien. Dermed ønsker vi å fjerne dem. For dette har vi kalt V1 inne i funksjonen er.Na, som vil eliminere all eksistensen av Na -verdier i vektorene. Utgangen fra denne funksjonen viser bare tallet.
Eksempel 2: Bruke NA.RM -metode for å fjerne Na i R i Ubuntu 20.04
Ved å evaluere summen, gjennomsnittet og variansen, kan vi også fjerne NA -verdier. Deretter en.RM er en metode som brukes til å bli kvitt NA. Hvis na.RM = sant, na blir ignorert; Hvis na.rm = falsk, na blir vurdert.
Så starter med å lage vektorsamlingen, som har noen tall og NA -verdier. Denne vektorsamlingen lagres inne i variabelen VEC. Deretter fjernes disse NA -verdiene først ved å evaluere variansen representert som var. Deretter evaluerte vi summen og mente på VEC for å eliminere NA -verdiene. Merk at vi har na.RM satt til True, som vil unngå NA i vektoren.
Eksempel nr. 3: Bruk av OMIT -metoden for å fjerne NA i R i Ubuntu 20.04
OMIT () -metoden eliminerer Na-verdier direkte, og returnerer ikke-NA-verdier og kasserte Na-verdier indekser som et resultat. Dette er det enkleste valget. Deretter en.utelater () metode returnerer resultatet uten NA -verdier i noen av radene. På R -språket er dette den raskeste teknikken for å eliminere NA -rader.
Her har vi initialisert de variable heltallene med vektorene. Da har vi med utskriftskommandoen generert utgangen fra vektorene. Så i utgangen har vi sett noen NA -verdier. For å fjerne disse na fra vektoren, har vi NA.utelate funksjon, som tar heltalvariabelen som inngang for å fjerne NA -verdier. Etter dette har vi sjekket gjennom utskriftserklæringen om NA -verdiene blir fjernet fra vektorene. Når utgangs -ID genereres, viser den ingen NA -verdier i heltallene.
Eksempel 4: Bruke hele.Tilfeller metode for å fjerne Na i R i Ubuntu 20.04
For forskjellige slags analyser av data i dataspråket R er det nødvendig med en detaljert dataramme uten manglende verdier. Det komplette.Tilfeller metoden vil få dette. Denne R -funksjonen undersøker en dataramme og returnerer en resultatvektor med manglende verdier i radene.
Som i det foregående eksemplet har vi vektorrepresentasjoner. Nå eliminerer vi NA -verdiene fra datarammene. For dette har vi opprettet datarammen som vi for hver kolonne har satt inn noen NA -verdier. Deretter har vi kalt Complete.Saksfunksjon som tar datarammen som et inngangsalternativ. Data2 holder denne operasjonen som skrives ut og viser at NA -verdiene fjernes.
Eksempel 5: Bruke Rowsum -metoden for å fjerne NA i R i Ubuntu 20.04
R har den innebygde metoden Rowsums, som genererer summen for hver rad i datainnsamlingen i formatet til Rowsums (X). Ytterligere parametere kan spesifiseres, hvorav den viktigste er det boolske argumentet til NA.RM, som instruerer funksjonen om du skal hoppe over NA -verdier.
Etter å ha opprettet datarammen i de variable dataene, har vi brukt Rowsums -metoden. Innenfor rowsum har vi det.Na -metode og NCOL -metode. Merk at det bare fjerner NA-verdier på tredje rad. Ettersom de andre radene også inneholder NA -verdiene.
Eksempel 6: Bruke filtermetoden for å fjerne Na i R i Ubuntu 20.04
Vi kan også bruke Tidyvers DPLYR -pakken for å slippe bare rader der alle verdier mangler. Da kan vi bruke en kombinasjon av DPLYR -pakkenes filterfunksjon, og base r er.na funksjon. Vi vil vise deg hvordan du bare sletter radene som alle dataoppføringene er NA.
Ved hjelp av DPLYR -pakken for filterfunksjonen har vi opprettet datarammen. Deretter har vi brukt filterfunksjonen til denne datarammen og viser utgangen, som har fjernet NA -verdiene fra den tredje raden.
Konklusjon
Vi har lært å fjerne NA fra R -språket som vises enkelt eller flere ganger i vektorene eller datarammen på dette stadiet i økten. Vi har dekket seks metoder som hjelper oss å fjerne NA fra de gitte dataene. Disse metodene er ganske enkle å implementere på R -skriptspråket, som også kan fjerne NA -verdier fra radene og kolonnene. Noen metoder krevde også R DPLYR -pakken for å eliminere NA.