I R kan du noen ganger trenge å eliminere en eller flere spesifiserte kolonner fra en dataramme. Heldigvis er det en innebygd metode fra R-modulen som gjør det enkelt. Å slippe kolonner fra et datasett er ganske enkelt en metode for å fjerne unødvendige kolonner fra datarammen. I dette innlegget vil vi se på forskjellige distinkte metoder for å fjerne kolonner med tittel fra et datasett i r.”
Hvordan fjerne kolonnene fra datarammer i R i Ubuntu 20.04?
Kolonnedråpemekanismen i R lar deg fjerne unødvendige kolonner fra en dataramme. I R kan du slippe en kolonne med navnet på en rekke måter. Denne artikkelen viser hvordan du fjerner en kolonne fra en dataramme gjennom forskjellige tilfeller i mange forskjellige metoder.
Eksempel 1: Bruke undergruppemetode for å fjerne kolonner i R i Ubuntu 20.04
Bruke undergruppemetoden med “-“ symbolet, som betyr å slippe variabler, er en av de enkleste måtene å slippe kolonner. Denne funksjonen på R -programmeringsspråket brukes til å bygge undergrupper av en dataramme og for å fjerne kolonner fra en dataramme. Syntaksen til undergruppen i R er slik: undergruppe (DF, Expr). Der DF er datarammen, og Expr betegner som uttrykket for undergruppen.
I eksempelskriptet har vi laget datarammen “Data1” som inneholder fire kolonner X1, X2, X3 og X4. Posten er satt inn i disse kolonnene. Når du utfører Data1 -kommandoen, skrives datarammen, som viser kolonnenavnene med oppføringene de har. Etter dette har vi laget en variabel data2 og kalt delmengde -metoden inne i den. Undergruppe -metoden tar data1 som en inngang og valgt tilstand for å slippe kolonnene X1 og X3.
Når data2 utføres, genererer den den nye datarammen, som har alle kolonnene bortsett fra X1 og X3, da disse kolonnene fjernes med undergruppe -metoden.
Eksempel 2: Bruke navnemetoden for å fjerne kolonner i R i Ubuntu 20.04
Denne teknikken skaper en dråpe tegnvektor der kolonnenavn er lagret. Senere instruerer vi R om å velge alle variabler bortsett fra de som er angitt i kolonnedråpen. Negasjon er betegnet med "!”Symbol. Navn () -metoden i R brukes til å hente eller endre objektets navn. Denne metoden aksepterer objektet som en parameter, som kan være en matrise, vektor eller dataramme, samt verdien som vil bli brukt til å navngi objektet. Lengden på verdien som leveres må nøyaktig samsvare med objektets lengde som skal navngis, og den returnerer alle kolonnenavn.
I ovennevnte R -skript har vi etablert datarammen i variabelen “DF.”Datarammen er skrevet ut på skjermen, og som du kan se har denne datarammen fire felt med forskjellige oppføringer. Deretter har vi inkludert drop -kommandoen og spesifisert kolonnenavnene i vektoren. Den nye variabelen er opprettet som "new_df", der navnemetoden blir påkalt, og til navnet () -metoden har vi passert vår dataramme "DF.”Merk at vi har brukt % i % operatør etter navnemetoden og drop -kommandoen til høyre for % i % operatør.
Utførelsen av ovennevnte kode genererer følgende dataramme der kolonnene Y2 og Y3 er fjernet.
Eksempel nr. 3: Bruke SELECT -metoden for å fjerne kolonner i R i Ubuntu 20.04
Vi vil bruke Select () i denne metoden ved å importere DPLYR -pakken til R og spesifisere argumentet for å utelate datasettets kolonner. I hovedsak lagrer denne funksjonen bare variablene du spesifiserer.
Vi har tatt med DPLYR -pakken for å få tilgang til SELECT -metoden. Vi har også konstruert datarammen som vi kan fjerne kolonnene. Datarammen genereres i tabellformen når du kjører MyData -kommandoen når datarammen er lagret i denne variabelen. Etter det har vi i neste hurtige bilde distribuert SELECT -metoden der datarammen er spesifisert som et argument, og også kolonnenavnet A1 med minustegnet er gitt.
R -ledeteksten tolker denne valgte metodekommandoen og sender ut datarammen, som har kolonne A1 slettet.
Eksempel nr. 4: Bruke SELECT -metoden for å fjerne kolonner med kolonneposisjonene i R i Ubuntu 20.04
Vi vil passere kolonneindeksposisjonen som en vektor til SELECT-metoden med et negativt tegn for å fjerne kolonne-for-kolonneposisjon, som vist nedenfor.
Her har vi inkludert DPLYR -modulen først. Og så har vi satt inn R-innebygde dataramme “Iris.”IRIS -datarammen vises, og den har flere kolonner, som vist i R -ledeteksten. Vi kan fjerne noen av kolonnene inne i iris -datarammen ved å spesifisere indeksen for kolonnen. For dette har vi Select () -metoden som vi har gitt datarammen og indeksverdien til vektoren. Kolonne 3,4 og 5 fjernes fra datarammen Iris, som vises nedenfor.
Eksempel nr. 5: Bruke SELECT -metoden for å fjerne kolonner ved start- og sluttkarakteren til kolonnen i R i Ubuntu 20.04
Vi kan også velge kolonner avhengig av deres begynnelses- og sluttkarakterer her. Funksjonen starter_with () returnerer kolonnen som begynner med det medfølgende tegnet. For å bruke Start_with () -metoden, må vi følge syntaksen gitt av R-språket, som er SELECT (DataFrame, -starts_with (“Substring”)). Der DataFrame betegner kilden, betegner DataFrame og Substring tegnet eller strengen som går foran den.
Vi har valgt datamengde tannvekst i dette eksemplet, da den har tre kolonner som er skrevet ut på skjermen. Nå, i neste trinn, har vi en start_with () -metode inne i SELECT -kommandoen. Start_with () -metoden med et minustegn tar kolonnetavnet som starter med "dosen" i tannvekstdatarammen. Den fjernet kolonnen "dose" fra datarammen da denne valgte kommandoen ble utført.
Ends_with () er en funksjon som returnerer kolonnen som inneholder den gitte karakteren på slutten. Syntaksen vi bruker for End_With () -metoden er denne: SELECT (DataFrame, -ends_with (“Substring”)). Der DataFrame refererer til inngangen DataFrame, og Substring refererer til tegnet eller strengen som følger den.
Som ovennevnte start_with () -metode, har vi passert kolonnen "Supp" fra datarammen Tannvekst til Ends_with () -metoden med minustegnet. Denne metoden har også fjernet kolonnen som ender_ med "supp.”
Konklusjon
R -programmeringsspråket ble brukt til å demonstrere tilnærmingen til å fjerne kolonner fra en dataramme. Vi har sett Rs innebygde delmengde og navnemetode, som har fjernet kolonnene. I R kan du slippe en kolonne ved å bruke minusoperatøren før valgmetoden. SELECT () -metoden i DPLYR -modulen i R brukes også til å velge eller fjerne kolonner basert på forholdene som starter med, ender med og slipp kolonner basert på plassering presenteres med eksempler.