Hvordan installere og bruke Rattle i Linux for å bygge komplekse data mining -algoritmer

Hvordan installere og bruke Rattle i Linux for å bygge komplekse data mining -algoritmer

Skrangle er et grafisk brukergrensesnittbasert verktøy som bruker R å løpe. Det brukes til data mining og visualisering. Rattle gir visse funksjonaliteter til brukerne som gjør dem i stand til å konstruere undersøkende dataanalyserapporter, transmute data slik at de kan kjøres gjennom forskjellige statistiske og matematiske modeller, bygge uovervåkte og overvåket maskinlæringsmodeller for dataene og vise resultatene i en visuell,, intuitiv måte. Disse resultatene kan vises i grafer, diagrammer og variable dimensjonale plott.

Alt dette gjøres ved hjelp av kjernen R rammefunksjonalitet. Rattle konverterer alle handlingene du tar i det grafiske grensesnittet til et R -skript som utføres av den underliggende R -installasjonen. Slik kan Rattle oppnå all sin kraftige dataanalysefunksjonalitet.

Installasjon

Å installere Skrangle På Linux -maskinen din trenger du en spesiell pakkebehandlerinnpakning som vil kunne laste ned og installere alle Rattle -avhengighetene på maskinen din. Dette er Wajig Verktøy for Linux, som fungerer som en innpakning rundt standard Apt og dpkg Pakkeledere. Det ga lett nytteverdi til APT og DPKG og lagt til funksjonalitet utover disse to pakkelederne.

1. Vi starter med å installere Wajig Ved å kjøre følgende kommando i terminalen:

$ sudo apt-get install wajig


Du bør se en terminalutgang som ligner på dette:


2. Vi vil nå legge til noen programvarelagre ved hjelp av Personal Package Archives (PPA) som inneholder avhengighetene som kreves for å kjøre Rattle.

PPAer er programvare- og applikasjonslager designet for å kjøre på Linux -maskiner. Disse lar utviklere distribuere opprettet programvare ved hjelp av lenken til depotet.

Kjør følgende kommandoer:

$ wajig addrepo ppa: marutter/rrutter4.0


$ wajig addrepo ppa: c2d4u.Team/C2D4U4.0+



3. Vi vil oppdatere Wajig Liste over lokale depotkilder slik at programvarelageret vi har lagt til tidligere, kan oppdages av Package Manager og deretter lastet ned og installert.

Kjør følgende kommando:

$ Wajig Distupgrade


4. Siden Rattle bruker R og R-Cran For å kjøre vellykket, vil vi installere de som bruker Wajig Package Manager. Vi vil også installere noen andre avhengigheter sammen med de nevnte R -pakkene.

Kjør følgende kommando:

$ wajig installer libgtk2.0-dev R-Base-dev R-anbefalt


Du bør se en utgang som ligner på følgende bilde i terminalen din:


5. Med R Nå installert, vil vi utføre den og installere Skrangle innenfra r.

Kjør følgende kommando for å utføre R:

$ R


Du bør se en lignende R -ledetekst åpne seg i terminalen din:


6. Vi vil nå installere Skrangle Pakke innen r ved å kjøre følgende kommandoer:

> Installer.Pakker ("Rattle")


Du bør se en lignende terminalutgang:


Hvis den forrige kommandoen ikke fungerer for deg, kan du prøve følgende kommando:

> Installer.Pakker ("https: // tilgang.Togaware.com/rgtk2_2.20.36.2.tjære.gz ", repos = null)
> Installer.Pakker ("RGTK2")


7. Etter at begge kommandoene er lastet ned og installert, kan vi laste inn Skrangle pakke i R -biblioteket.

Kjør følgende kommando i R -ledeteksten:

> Bibliotek (Rattle)



8. Med Skrangle Lastet i R Bibliotek, vi kan kjøre det ved å kjøre følgende kommando i R -ledeteksten:

> Rattle ()


Du bør se en forekomst av Rattle åpne seg på Linux -maskinen din.

Brukerhåndboken

Vi kan bruke Skrangle For å konfigurere vår data mining -rutine i henhold til våre krav. Som du kan se på bildet over, er det forskjellige alternativer som du kan konfigurere.

I Data Fanen, vi kan velge forskjellige formater av datafiler, inkludert komma-separerte verdifiler, tekstfiler, åpne databaser og til og med data i skript. Dette gjør at Rattle kan legge inn data i noen form vi trenger.


Etter å ha importert dataene, kan vi besøke Forvandle Fanen for å gjøre endringer i dataene våre. Vi kan velge enkelt- eller flere kategorier i våre data og gjøre transformasjoner i henhold til våre behov. Vi kan raskt oppnå ting ved å velge radioknapper på toppen og omorganisere dataene basert på noen prioriteringer eller rangering vi tildeler vi. Vi kan normalisere dataene ved å skalere dem basert på et område som vi gir, eller vi kan øke manglende verdier ved å plassere gjennomsnittlig, minimum eller maksimal verdi som finnes i en kategori.


Dette er bare noen ting vi kan gjøre med Skrangle GUI-basert verktøy.

Konklusjon

Rattle er et veldig populært data miningverktøy som fortsetter å vokse i popularitet på grunn av det brukervennlige grafiske brukergrensesnittet. Det krever ikke at noen form for kode skrives og kan ganske enkelt brukes ved å samhandle med applikasjonsgrensesnittet. Forskere, studenter og programmerere over hele verden bruker det for å oppnå kravene til data mining. Siden Rattle gir en veldig sofistikert R -backend, kan den oppnå komplekse statistiske og analytiske datavitenskapskrav med få museklikk.

Rattle er et av de beste verktøyene som er tilgjengelige for folk som nettopp begynner sin datavitenskapelige reise, siden det er ekstremt kraftig og gir intuitive kontroller som brukerne kan lære av. Rattle er sterkt anbefalt av junior- og ekspertdataanalytikere over hele verden på grunn av sin medfødte evne til å bidra til å skape noen av de kraftigste datautstyrsrørledningene som brukes i dag.