Komme i gang med RStudio på Ubuntu Linux

Komme i gang med RStudio på Ubuntu Linux
Denne opplæringen vil illustrere hvordan du installerer RStudio på Ubuntu 20.04.

RStudio gir et integrert utviklingsmiljø for å håndtere gratis programmeringsspråk “R” ting, som er tilgjengelig under lisensen til GNU. RStudio er et ideelt databehandlingsmiljø for å generere detaljerte statistiske visualiseringer, og brukes som sådan av statistikere over hele verden.

RStudio er også tilfeldigvis tilgjengelig som et program og som serverapplikasjon, brukt av en rekke forskjellige Linux -distribusjoner og for Windows og MacOS.

Last ned R -programmeringsspråk (Forutsetninger)

RStudio Desktop -applikasjon trenger R -programmeringsspråket for å jobbe med Linux Distros. Det er nødvendig å laste ned en R -versjon som er kompatibel med Linux -operativsystemet. Du kan laste ned det ved hjelp av et programvarelager.

1- Last ned R med nettleseren

Hvis du ikke kan få R fra programvaresenteret, betyr det at depotet må oppdateres først. Du kan bare hoppe over alt det og laste det ned på nettet ved å skrive inn denne lenken:

https: // kran.Studio.com

Inn i søkeboksen i nettleseren din. Hjemmesiden deres skal ligne skjermbildet nedenfor:

2- Last ned R fra Linux Terminal

Fire opp CLI -terminalen, skriv inn kommandoen nedenfor, og trykk Enter:

Kjør deretter en oppdatering med kommandoene nedenfor:

$ sudo apt-get oppdatering

Denne kommandoen vil hente Rs oppdateringer og anskaffe alle relevante filer fra det viktigste Ubuntu -depotet.

Utsted deretter følgende kommando for å installere R:

Kommandoen over går gjennom pakkelisten, og avslører hvor mye diskplass den vil fylle opp, og ber deretter om bekreftelse. Treff 'y' -tasten på tastaturet ditt for å fortsette med installasjonen.

Utgangen vil mest sannsynlig bekrefte installasjonen.

Du kan slå den opp i søkeboksen som illustrert nedenfor:

Installere rstudio på Ubuntu 20.04 med kommandoterminal

Med vertsprogrammeringsspråket installert, kan vi nå fortsette å installere RStudio. For å demonstrere installasjonen, bruker vi kommandolinjeterminalen.

Fyr opp terminalen og gi ut følgende

$ sudo apt-get install gdebi-core

Du blir bedt om å oppgi rotpassordet. Når du har angitt passordet, begynner pakkeninstallasjonen

$ wget https: // download1.RStudio.org/desktop/bionic/amd64/rstudio-1.3.1093-AMD64.Deb

RStudio online -pakken er nå koblet sammen og blir overført til harddisken din.

Du blir bedt om å oppgi rotpassordet igjen. Skriv inn passordet for å få pakkelisten lest og lastet.

Den installerte vil be om tillatelse til å fortsette, trykk Y -tasten på tastaturet.

Utgangen vil bekrefte installasjonen, som vist nedenfor.

Komme i gang med RStudio:

For å lansere RStudio, ta turen til søkefeltet og oppslag RStudio. Du vil se det innenfor en av listene som vist nedenfor:

Klikk på RStudio -ikonet for å starte det.

Undersøkelse av datasett med RStudio

Med RStudio kan du visualisere alle data i form av grafer, tabeller og diagrammer.

For å forstå hvordan data er representert visuelt i RStudio, la oss ta utvalget 2010 folketellingspopulasjon for hvert postnummer som et eksempel.

Prosessen med dataanalyse kan vagt reduseres til følgende fire trinn:

1-Import Raw Data

Du kan importere rå data direkte fra nettet til RStudio ved å gjøre det systematisk i konsollvinduet med kommandoen nedenfor:

$ CPD <- read.csv(url("https://data.lacity.org/api/views/nxs9-385f/rows.csv?accessType=DOWNLOAD")

Med kommandoen utført, vil RStudio få dataene som en CSV -fil fra nettet, og innholdet vil bli tilordnet CPD -variabelen.

En annen måte å gå på å importere data til RStudio er ved å laste ned datasettet manuelt til harddisken din og deretter åpne innholdet med RStudio's Import Data -funksjon.

Gå over til alternativet Importer datasett i kategorien Miljø, og velg datasettfilen du vil laste opp. Klikk OK, så blir du vist dialogen om datasettet. Det er her du vil spesifisere parametrene, så vel som navn og desimaler. Når du er ferdig, klikker du bare på import, og datasettet vil bli lagt til RStudio, og en variabel blir tildelt navnet.

For å se hvilke datasett som er i bruk, kan du utstede kommandoen nedenfor med variabelen tilskrevet et datasett:

$ Vis (CPD)

2 -Manipulering av dataene

Nå som du har importert datasettet, er det mye du kan gjøre for å transformere disse dataene. Dataene blir manipulert gjennom transformasjonsfunksjoner. Anta at du vil turnere til en viss matrise i datasettet. Hvis vi skulle gå til den totale populasjonskolonnen i datasettet vårt, ville vi angi kommandoen nedenfor:

$ cpd $ total befolkning

Dataene er også hentes i form av en vektor:

$ CPD [1,3]

Undergruppefunksjonen i RStudio lar oss spørre datasettet. La oss si at vi må fremheve radene der forholdet mellom mann og kvinnelig og kvinnelig er positivt. For å plukke ut radene, vil du utstede følgende kommando:

$ a <- subset(cpd , Total Males > Totalt kvinner)

I kommandoen over måtte den første parameteren vi tildelte være variabelen tilskrevet datasettet vi brukte funksjonen. Boolsk tilstand anses som den andre parameteren. Den boolske tilstanden må også vurderes for hver rad. Det fungerer som den avgjørende faktoren om en rad er å være en del av utgangen eller ikke.

3 -Bruke gjennomsnittsfunksjonene på datasettet

RStudio har spesifikke funksjoner for å utarbeide gjennomsnitt på datasettet:

$ middel (Cpd $ total hanner) - beregner enkelt gjennomsnitt
$ median (cpd $ total kvinner) - gir medianen for en kolonne
$ kvantil (cpd $ total populasjon) -Gleder kvantilet for en kolonne
$ var (cpd $ total hanner) -verk ut variansen for en kolonne
$ SD (CPD $ Total Hunnes) -Gives standardavvik

For å få den oppsummerte rapporten om datasettet, kan du også kjøre hvilken som helst av disse funksjonene på hele datasettet.

$ Sammendrag (CPD)

4 -Lage en graf for datasettet

Hvis du ofte skal jobbe med RStudio, finner du visualiseringsverktøyet veldig ressurssterk. Du kan opprette en graf av et hvilket som helst importert datasett med plottet og andre visualiseringsfunksjoner i RStudio.

For å generere en scatterplot for datasettet, vil du utstede følgende kommando:

$ plot (x = s $ total hanner, y = s $ total kvinner, type = 'p')

La oss nå diskutere parametrene som er involvert her. I hver parameter refererer S til undergruppen av det originale datasettet, og ved å legge til “P”, indikerer du at du vil ha utdata.

Du kan også representere datasettet ditt i form av et histogram:

$ hist (cpd $ totale husholdninger)

Tilsvarende for å skaffe et søylediagram over det importerte datasettet:

$ teller <- table(cpd$Total Population)
$ barplot (teller, main = "Total befolkningsfordeling",
$ xlab = "Antall totalpopulasjon")

Administrere data i ujevnt avstandstid

For å administrere data med ujevnt avstandstidsserie, bør du integrere dyrehagepakken med RStudio. For å få dyrehagepakken, gå til nedre høyre hjørne av skjermen i RStudio og til pakkeens komponent. Zoo -pakken konverterer de uregelmessige tidsseriedataene til dyrehageobjekter. Argumentene som er satt inn for å lage dyrehageobjekter er dataene, som kommer først, etterfulgt av verdien til bestilling av.

Zoo -objekter gir brukervennlighetsstøtte. Alt du trenger å gjøre er å skrive "plot", og du vil bli vist alle plottmetodene du kan bruke med den dyrehagepakken.

Hvis du finner deg selv forvirret over hva en viss RStudio -funksjon har å tilby, angir du den funksjonens navn og følger den med "?”For å se ledeteksten om hjelpemenyen. Trykk på CTRL+plass etter at et funksjonsnavn produserer automatisk fullføringsvindu.

Innpakning

Denne opplæringen har illustrert hvordan du kan sette opp RStudio på Ubuntu 20.04 og dekket det grunnleggende om statistisk representasjon og manipulasjon med RStudio. Hvis du ønsker å bruke RStudio bedre, bør det være et godt første skritt å gjøre det å gjøre det bra med R -programmering av R -programmering. RStudio er et kraftig verktøy og har applikasjoner i mange bransjer over hele kloden: kunstig intelligens og data mining, for å nevne noen.

Å bli kjent med R-programmering.