R Les CSV

R Les CSV
En CSV -fil er et vanlig dokument som kan inneholde en liste over data atskilt av komma. Disse filene brukes ofte til dataoverføring mellom apper. CSV -filer støttes ofte av databaser og kontaktsjefer. Målet er å eksportere sofistikerte data fra en applikasjon til en CSV -fil, som deretter kan importeres til en annen applikasjon. Vi lærer måten å lese innhold fra en CSV -fil i denne artikkelen. R skal kunne lese filen hvis den er plassert i den nåværende okkuperte katalogen. Vi kan selvfølgelig lage vår nye katalog og lese dokumentfiler derfra også. R lar oss lese innhold fra filer som ikke er i R -miljøet. R -programmeringsspråk kan lese og komponere forskjellige filtyper, inkludert CSV, Excel og XML.

Hva er CSV -filen på R -programmeringsspråket i Ubuntu 20.04?

Filformatet CSV (komma -separerte verdier) er en vanlig måte å lagre tabelldata i regneark og databaser. En CSV -fil er et vanlig tekstdokument som inneholder tabelldata (heltall og tekst). Den respektive linjen i filen angår en datapost. Komma brukes som feltskillelse, som gir dette filformatet navnet. På R -programmeringsspråk er det en iboende modul som heter CSV som lar deg operere med CSV -filer. Funksjonen for å lese en CSV -fil på R -programmeringsspråket har følgende syntaks.

Lese.CSV (“File_name”)

Leset.CSV () er en innpakningsmetode for lesing.Tabell () som bruker komma som separator. Den første linjen i inndatafilen som en overskrift for kolonnenavnene på den gitte tabellen. Som en effekt er det et enormt valg for å lese CSV -filer.

Hvordan lese CSV -filen på R -programmeringsspråk i Ubuntu 20.04?

I mange tilfeller er det viktig å lese data fra en CSV -fil når du kjører analyse ved bruk av r. Når det gjelder å lese CSV -filer, er R ekstremt pålitelig. For dette trenger vi noen data for å lese, skrive eller endre data i r. Her har vi noen illustrasjoner av hvordan du oppretter en CSV -fil og leser den. Vi har også utført de forskjellige operasjonene på CSV -filen som leser de spesifikke dataene fra CSV -filen på R -skriptspråket.

Eksempel 1: Opprette CSV -filen i R i Ubuntu 20.04

Vi har satt datarammen for ansattes poster med noen ansattes detaljer. Så lagrer dette i EMP.CSV -fil.

Eksempel 2: Les fra CSV -fil i R i Ubuntu 20.04

Leset.CSV () -funksjon i R kan lese hele teksten til en CSV -fil som en dataramme. CSV -filen som skal leses må enten være i arbeidskatalogen, eller katalogen må etableres på riktig måte i R ved å bruke SetWD () -funksjonen. Leset.CSV () -funksjonen kan også lese en CSV -fil via en URL.

Som ovenfor har vi definert variabelen som emp_data. EMP_DATA er tildelt med lesingen.CSV -funksjon der filnavnet er gitt. Som vi har fil emp.CSV til stede i vår nåværende katalog, R kan enkelt tolke denne filen. En gang er utskriftskommandoen gitt i R -ledeteksten. Den viser CSV -filinnholdet i tabellform.

Eksempel 3: Vurdert CSV -filen i R i Ubuntu 20.04

Leset.CSV () -funksjon produserer en dataramme som standardutgang. Her er en rask tilnærming for å sjekke dette. Hyppigheten av CSV -fildataramme kolonner og rader kan også sjekkes.

Innenfor utskriftskommandoen har vi kalt en funksjon NCOL for kolonnene og NROW for radene. Disse funksjonene blir deretter bestått med EMP_DATA -variabelen fra eksemplet ovenfor som har hele CSV -filinnholdet. Utgangen genererte antall kolonner og rader inne i EMP.CSV -fil. I funksjonen blir overskriften først satt til sann som standard. Dette er fordi antall rader ikke inkluderer hodet; Denne CSV har fem kolonner og åtte rader.

Eksempel 4: Les minverdien fra CSV -filen i R i Ubuntu 20.04

CSV -dataene kan brukes til å anvende aggregatorfunksjoner (.). $ Tegnet brukes til å bruke min () -funksjonen på kolonnen.

For de variable dataene har vi lest CSV -filen først. Deretter har vi en min () -funksjon brukt på emp_data -kolonnen. EMP_DATA returnerte minimumsverdifinansieringen fra CSV -filen. Der har vi en annen spørring som får maksimal verdi fra den spesifikke kolonnen fra CSV -filen emp_data.

Vi leser maksimalverdien fra EMP.CSV -fil ved å bruke MAX -funksjonen på emp_salary -kolonnen. Denne funksjonen vil generere maksimal lønn fra EMP.CSV -tabell.

Eksempel 5: Les CSV -filen og lag undergruppen CSV -filen i R i Ubuntu 20.04

Delsett () -funksjonen i R kan brukes til å trekke ut det tilsvarende resultatet fra SQL -spørsmål på CSV -innholdet. Ulike spørsmål kan kjøres gjennom funksjonen samtidig, hver atskilt av en logisk operatør. I R lagres resultatet som en dataramme.

Fra lesingen.CSV -funksjon som er lagret i variable data, vi har lest EMP.CSV -informasjon. New_CSV -variabelen er etablert der vi har kalt undergruppen og til delmengde -funksjonen, har vi brukt tilstanden. Den produserte delmengden av data lagres som en dataramme som oppfyller betingelsene som er angitt i funksjonens argumenter. I den resulterende datarammen er radnumrene bevart.

Konklusjon

Denne artikkelen forklarer hvordan du kan lese fra CSV -filene. Funksjonene i R, er omfattende. Leset.CSV () -funksjonen i R gir oss å lese en CSV -fil som for øyeblikket er i vår arbeidskatalog. Leset.CSV () -funksjonen tar et filnavn som et argument og returnerer alle postene som finnes i den. Med CSV -operasjonene har vi sett hvordan vi lager og lest fra CSV -filer i R. SQL -spørsmålene brukes også på CSV -filen som leser de spesifikke kolonnene på tilfredsstillende forhold.