Fjern Na i r

Fjern Na i r
“Når en produksjonssensor mislykkes, vil du bare kunne samle nøyaktige målinger på fire av samlebåndets seks målepunkter. Et av kvalitetsarkene er imidlertid uleselig. Du kan være uten prøver for et helt skifte. Derfor kan dette påvirke dine statistiske beregninger. Manglende data håndteres ikke grasiøst av flere prosesser. I denne artikkelen skal vi se på noen få forskjellige teknikker for å bli kvitt NA -verdier i r. Dette tillater deg å begrense beregningene dine til R -dataramme rader som oppfyller et spesifikt fullføringsnivå.

Når ingen data er tilgjengelige med en eller flere moduler eller for en hel enhet, gjenkjennes det som tapte data. I hverdagsmiljøer er manglende verdier et fremste spørsmål. Na (ikke tilgjengelige) oppføringer brukes til å representere manglende poster i r. Mange datasett kommer i DataFrame med manglende verdier fordi de enten eksisterer, men ikke ble anskaffet eller fordi de aldri eksisterte.”

Hvordan bli kvitt NA -verdiene i R -programmeringsspråket i Ubuntu 20.04?

Symbolet Na brukes i R for å betegne manglende verdier (ikke tilgjengelig). NA kan indikere tomme verdier i dataframkolonner i R -programmeringsspråk. Vi vil se på hvordan du kan bli kvitt NA -rader i en kolonne i denne artikkelen.

Eksempel 1: Bruke er.Na -metoden for å fjerne Na i R i Ubuntu 20.04

Vi kan bruke er.Na for å eliminere slike Na -verdier fra vektoren. NA -verdiene oppnås ved bruk av er.Na () og vektorindeksen. Alle verdier bortsett fra NA vil bli returnert av IS.na ().

I eksemplet over har vi en vektorrepresentasjon der noen tilfeldige tall er inkludert sammen med NA -verdiene. Utgangen genererte også NA -verdien. Dermed ønsker vi å fjerne dem. For dette har vi kalt V1 inne i funksjonen er.Na, som vil eliminere all eksistensen av Na -verdier i vektorene. Utgangen fra denne funksjonen viser bare tallet.

Eksempel 2: Bruke NA.RM -metode for å fjerne Na i R i Ubuntu 20.04

Ved å evaluere summen, gjennomsnittet og variansen, kan vi også fjerne NA -verdier. Deretter en.RM er en metode som brukes til å bli kvitt NA. Hvis na.RM = sant, na blir ignorert; Hvis na.rm = falsk, na blir vurdert.

Så starter med å lage vektorsamlingen, som har noen tall og NA -verdier. Denne vektorsamlingen lagres inne i variabelen VEC. Deretter fjernes disse NA -verdiene først ved å evaluere variansen representert som var. Deretter evaluerte vi summen og mente på VEC for å eliminere NA -verdiene. Merk at vi har na.RM satt til True, som vil unngå NA i vektoren.

Eksempel nr. 3: Bruk av OMIT -metoden for å fjerne NA i R i Ubuntu 20.04

OMIT () -metoden eliminerer Na-verdier direkte, og returnerer ikke-NA-verdier og kasserte Na-verdier indekser som et resultat. Dette er det enkleste valget. Deretter en.utelater () metode returnerer resultatet uten NA -verdier i noen av radene. På R -språket er dette den raskeste teknikken for å eliminere NA -rader.

Her har vi initialisert de variable heltallene med vektorene. Da har vi med utskriftskommandoen generert utgangen fra vektorene. Så i utgangen har vi sett noen NA -verdier. For å fjerne disse na fra vektoren, har vi NA.utelate funksjon, som tar heltalvariabelen som inngang for å fjerne NA -verdier. Etter dette har vi sjekket gjennom utskriftserklæringen om NA -verdiene blir fjernet fra vektorene. Når utgangs -ID genereres, viser den ingen NA -verdier i heltallene.

Eksempel 4: Bruke hele.Tilfeller metode for å fjerne Na i R i Ubuntu 20.04

For forskjellige slags analyser av data i dataspråket R er det nødvendig med en detaljert dataramme uten manglende verdier. Det komplette.Tilfeller metoden vil få dette. Denne R -funksjonen undersøker en dataramme og returnerer en resultatvektor med manglende verdier i radene.

Som i det foregående eksemplet har vi vektorrepresentasjoner. Nå eliminerer vi NA -verdiene fra datarammene. For dette har vi opprettet datarammen som vi for hver kolonne har satt inn noen NA -verdier. Deretter har vi kalt Complete.Saksfunksjon som tar datarammen som et inngangsalternativ. Data2 holder denne operasjonen som skrives ut og viser at NA -verdiene fjernes.

Eksempel 5: Bruke Rowsum -metoden for å fjerne NA i R i Ubuntu 20.04

R har den innebygde metoden Rowsums, som genererer summen for hver rad i datainnsamlingen i formatet til Rowsums (X). Ytterligere parametere kan spesifiseres, hvorav den viktigste er det boolske argumentet til NA.RM, som instruerer funksjonen om du skal hoppe over NA -verdier.

Etter å ha opprettet datarammen i de variable dataene, har vi brukt Rowsums -metoden. Innenfor rowsum har vi det.Na -metode og NCOL -metode. Merk at det bare fjerner NA-verdier på tredje rad. Ettersom de andre radene også inneholder NA -verdiene.

Eksempel 6: Bruke filtermetoden for å fjerne Na i R i Ubuntu 20.04

Vi kan også bruke Tidyvers DPLYR -pakken for å slippe bare rader der alle verdier mangler. Da kan vi bruke en kombinasjon av DPLYR -pakkenes filterfunksjon, og base r er.na funksjon. Vi vil vise deg hvordan du bare sletter radene som alle dataoppføringene er NA.

Ved hjelp av DPLYR -pakken for filterfunksjonen har vi opprettet datarammen. Deretter har vi brukt filterfunksjonen til denne datarammen og viser utgangen, som har fjernet NA -verdiene fra den tredje raden.

Konklusjon

Vi har lært å fjerne NA fra R -språket som vises enkelt eller flere ganger i vektorene eller datarammen på dette stadiet i økten. Vi har dekket seks metoder som hjelper oss å fjerne NA fra de gitte dataene. Disse metodene er ganske enkle å implementere på R -skriptspråket, som også kan fjerne NA -verdier fra radene og kolonnene. Noen metoder krevde også R DPLYR -pakken for å eliminere NA.