Hvordan installere og bruke oransje i Linux

Hvordan installere og bruke oransje i Linux

Orange er en data mining-programvare som gir brukerne unike og klare til å bruke løsninger på hverdagsanalyseproblemer. Det bruker et visuelt programmeringsgrensesnitt som lar brukerne forstå og kontrollere arbeidsflytene deres på en visuelt intuitiv måte. I kjernen bruker den Python-baserte moduler som lar den arve deres kjernefunksjonalitet som skal implementeres på dataene som lastes inn i den. Bortsett fra data mining -teknikker, gir det også stor støtte for maskinlæringsalgoritmer som hjelper brukerne å generere ivrig innsikt fra dataene sine.

Orange er mye brukt i utdannings- og forskningsdomenet og regnes som et flott verktøy av ikke-programmeringsbaserte forskningsgrupper. Det visuelle programmeringsgrensesnittet kalt Oransje lerret Gjør det enkelt å få arbeidet gjort selv for folk som ikke har en omfattende bakgrunn innen programmering. Lerretet fungerer ved å la brukerne legge inn widgeter som representerer en viss kjernefunksjonalitet i en arbeidsflyt for dataanalyse. Disse widgetsene kan deretter stables etter hverandre for å lage en komplett rørledning som dataene beveger seg gjennom og genererer den nødvendige utgangen.

På slutten av denne artikkelen vil du kunne:

    1. Last ned og installer Orange på Linux -maskinen din
    2. Forstå viktigheten det har for datavitenskapssamfunnet
    3. Lære de forskjellige måtene dette verktøyet kan være gunstig for deg

Installasjon

Som tidligere diskutert bruker Orange Python -moduler, og det er derfor den enkelt kan lastes ned fra Python Package Manager som heter Pip. For å bruke Pip, må vi først laste ned og installere den.

Følg trinnene for fullstendig installasjon av oransje på Linux -maskinen.

1. Først må vi oppdatere det lokale Apt Lagrer ved hjelp av følgende kommando:

$ sudo apt-get oppdatering

Du bør få en utgang som ligner på dette:

2. Etter å ha oppdatert Apt Lokale lagre, installerer du nå noen Python -pakker som hjelper deg å laste ned og installere oransje. Dette gjøres siden Orange egentlig er en Python -modul som bruker noen kjernefunksjonalitet fra andre Python -moduler for å gi deg data mining og analysefunksjoner.

Kjør følgende kommando for å laste ned Pip Pakkesjef og Python Virtualenv Oppsett:

$ sudo apt-get install git python-pip python-virtualenv

Du bør få en utgang som ligner på dette:

Kjør nå den andre kommandoen som laster ned alle nødvendige Python -moduler som kreves av Orange for å kjøre ordentlig:

$ sudo apt-get install git python3-dev python3-numpy python3-scipy
python3-pyqt4 python-qt4-dev python3-sip-dev libqt4-dev

Merk: Denne kommandoen kan ta litt tid å fullføre løping avhengig av internettforbindelsen din.

For det andre kan du bli bedt om å trykke på Y Nøkkelen til å godta installasjonen av andre kjernepakker.

Du kan forvente en utgang som ligner på dette:

3. Vi skaper nå et virtuelt miljø for å installere alle oransje moduler og avhengigheter.

Kjør følgende kommandoer:

$ mkdir oransje3env
$ virtualenv -p python3-System-site-pakker Orange3Env


$ Source Orange3Env/Local/Bin/Activate



Merk: Hvis den forrige kommandoen ikke fungerer, kjører du følgende kommando:

$ kilde Orange3Env/Bin/Aktiver

4. Installere oransje ved å ringe på Pip som vi tidligere lastet ned.

Kjør følgende kommando:

$ pip install oransje3

Du bør få følgende utdata:

5. Den vellykkede produksjonen fra forrige trinn betyr at oransje har blitt lastet ned og installert ved hjelp av Python Package Manager Pip.

Vi kjører nå følgende kommando for å kjøre oransje:

$ python -m oransje.lerret



Merk: Hvis følgende oransje GUI -skjermer åpnes opp, det betyr at all din innsats var vellykket og oransje er installert og åpnes på Linux -maskinen din.

Brukerhåndboken

Orange er et hånd på data mining og analyseverktøy som lar brukerne lage arbeidsflyter for dataanalyse på en visuell og interaktiv måte. Dette betyr at du kan lage komplekse modeller ved hjelp av en enkel dra- og drop -teknikk.

Den oransje modulen kommer med et lerret som kan brukes til å dra og slippe widgets som representerer de forskjellige funksjonalitetene. Vi vil bygge en enkel rørledning i denne guiden som importerer dataene til oransje og deretter utføre noen handlinger på disse dataene og sende ut resultatene.

For eksempel kan vi se alle de forskjellige måtene i følgende bilde der dataene kan importeres til det oransje verktøyet som inkluderer import fra SQL -tabeller, CSV -filer, malingsdata og mer.


Vi importerer dataene fra en CSV -fil med formålet med denne opplæringen.

Nå som vi spesifiserte hvilket dataformat vi forventer å legge inn i rørledningen vår, velger vi en handling som vi ønsker å utføre på disse dataene.

Vi går nå til Forvandle Tab og velg Randomize -widgeten som tar alle dataoppføringene i våre data og randomiser deres bestilling.


Nå som vi vet hva vi vil gjøre med våre importerte data, kan vi velge hvordan vi vil vise resultatene av disse dataene.

For vår guide, la oss bygge en bardiagram av de randomiserte dataene slik at vi kan se hvilke klasser dataene tilhører og hvor mye av dataene som finnes i disse klassene.


Etter at dataene er importert til modellen som vi opprettet, krysser den automatisk hele rørledningen, og tar veien fra importen til bardiagrammet. Utgangen som vi mottar på våre data kan sees i følgende:


Videre kan vi også ganske enkelt vise dataene ved hjelp av widgeten Data bord Under kategorien Visualiser.

Konklusjon

Som det kan sees, er det ekstremt enkelt og intuitivt å jobbe i oransje for datavitenskap. Alt du trenger å gjøre er å dra og slippe de forskjellige funksjonalitetene du vil at dataene dine skal gå gjennom og samle ut utgangene. Dette verktøyet er spesielt nyttig for folk som ikke har programmeringsbakgrunn, men som fortsatt trenger å kjøre visse vurderinger på dataene sine. Forsknings- og akademisamfunnene bruker oransje rikelig siden det lar dem generere inferens og innsikt i dataene sine med relativt letthet og liten til ingen tidligere programmeringskunnskap.