Distribuer kjernemaskinens læringsmodeller ved hjelp av TURI Create på Linux

Distribuer kjernemaskinens læringsmodeller ved hjelp av TURI Create på Linux

Turi Create er et Python -bibliotek som er opprettet av Apple for enkel distribusjon av omfattende maskinlæring og dataanalysealgoritmer. Det er et open source -bibliotek som lar brukerne dra nytte av dette kraftige verktøyet gratis. Den inneholder implementeringer for både overvåket og uten tilsyn læringsteknikker som inkluderer klassifiseringsoppgaver, regresjonsoppgaver, grupperingsalgoritmer, objektdeteksjonsoppgaver og mer. Det gjør det også.

Til tross for at Apple er laget av Apple, er den tilgjengelig på alle de tre hovedplattformene som inkluderer Apple, Linux og Windows som ytterligere øker dens nytteverdi i verden av å lære av rikelig data. Den primære fordelen som TURI oppretter tilbyr brukerne sine over andre tradisjonelle maskinlæring og analytiske biblioteker og rammer er at brukerne kan få tilgang. Personer som ikke er grundig flinke med komplekse maskinlæring og dataanalysekonsepter, kan benytte seg av dette biblioteket med relativt letthet og utføre oppgavene sine uten at det blir lagt ned en betydelig innsats for å lære inn og outs i disse algoritmene. En av hovedkonkurrentene til dette biblioteket er at Scikit Learn som er rikelig brukt i de fleste maskinlæringsoppgaver, men er noe sammensatt å lære og implementere.

Den viktigste forutsetningen for å starte med Turi Create er den forbannende kunnskapen om Python og dens programmeringens grunnleggende. Turi Create lar brukerne sine jobbe med forskjellige former for data inkludert tabelldata, tekstdata, grafer og mer. Ved å tilby de tilpassede datatypene for containere som ligner noen av de mest brukte datatypene som Dataframes, gjør dette biblioteket lagring og behandling av data veldig enkelt og enkelt.

Det skal bemerkes at Turi Create er tilgjengelig på følgende versjoner av Python: 2.7, 3.5, 3.6, 3.7, og 3.8. Det blir jobbet med å gjøre det tilgjengelig for nyere versjoner.

Installasjonsveiledning

For å starte med Turi Create Installation, må du først sikre at du kjører en versjon av Python fra den nevnte listen tidligere. Hvis du bruker en eldre eller nyere versjon, må du enten oppgradere eller nedgradere til en annen versjon for å kunne kjøre Turi Create. Ellers vil du få følgende feil hvis du prøver å installere den med en annen versjon av Python enn de som er nevnt:


Siden Turi Create er en Python -bibliotekpakke, kan den bare brukes gjennom Python Code. Det er grunnen til at vi, for å installere det, benytter oss av Python Package Manager kalt “Pip”. Du kan også bruke "Conda" til å installere dette biblioteket hvis du bruker Anaconda -plattformen for din Python -utvikling. For formålene med denne installasjonsveiledningen bruker vi PIP.

Merk: Det er alltid en god idé å installere en hvilken.

1. Kjør følgende kommando i terminalen for å installere TURI CREATE med PIP:

$ pip install Turicreate

Med dette skal Turi Create lastes ned og installeres på Linux -maskinen din ved hjelp av Pip Package Manager for Python.

Brukerhåndboken

Som nevnt tidligere, siden Turi Create er en Python -pakke, kan den brukes ved hjelp av Python -kode. For å begynne å jobbe med Turi Create, oppretter vi en Python -fil (.py) eller en Python -notatbok (.ipynb).

Vi starter med å importere TURI Create Into vårt arbeidsmiljø:

Importer turicreate som TC


Nå som vi importerte Turi Create, importerer vi et datasett for å jobbe med. Dette kan være et hvilket som helst datasett som passer kravene til hvilke typer data som Turi Create er i stand til å jobbe med. Vi bruker ADNI -datasettet for Alzheimers pasienter. Dette datasettet er et klassisk eksempel på klassifisering for overvåkede læringsoppgaver.

data = tc.Sframe.read_csv ("./12_months_joint.CSV ")


SFRAME -nøkkelordet er implementering av en datatype som er veldig nær dens funksjonalitet som en dataaframe. Når du laster inn dataene i en SFRAME fra en komma -separert verdifil, lagres dataene i form av en tabell med tabellfunksjoner som kolonnenavn og poster som rader.

Vi kan nå dele disse dataene i trenings- og testeprøvene ved å bruke metoden “Random_split” og spesifisere prosentandelen av dataene vi trenger i treningsutvalget.

Train_data, test_data = data.random_split (0.8)


Nå som dataene blir behandlet i trenings- og testeprøvene, kan vi starte med å implementere en binær klassifiserer på disse dataene slik at vi senere kan teste og bestemme ytelsen til vår modell.

binary_classifier = tc.LOGISTIC_CLASSIFIER.opprette (Train_Data, Target = 'Cov')


Med dette begynner modellen å lære og konvergerer sakte til den mest optimale løsningen som den er i stand til å finne. Vi kan få et sammendrag av modellen og lære ved å kjøre følgende kommando:

Binary_classifier.sammendrag()


Vi kan videre spørre modellen vi gjorde om å forutsi utgangene fra testdataene ved å bruke følgende kodebit:

Spådommer = binary_classifier.forutsi (test_data)


Vi kan sammenligne de forutsagte verdiene med de opprinnelige målverdiene i test_dataene for å finne ut ytelsen til denne modellen.

Vi kan videre bruke et annet bibliotek som matplotlib for å lage spesialiserte ytelsesvisualiseringer som forvirringsmatriser og grafer.

Konklusjon

Med mange komplekse maskinlæringsbiblioteker og pakker som er tilgjengelige å jobbe med, kan det bli en slitsom og uttømmende oppgave å implementere læringsalgoritmene enkelt. Biblioteker som Sklearn implementerer mest intelligente algoritmer, men de kommer med en læringskurve som de fleste ikke er komfortable med. Turi Create sikrer enkel implementering av de fleste av disse læringsteknikkene uten noen omfattende læringsøvelser. Den enkle algoritmiske implementeringen og enda enklere utførelse gjør det til et veldig enkelt bibliotek å anbefale når det gjelder maskinlæring og analyse. For nye nybegynnere og nybegynnere er dette biblioteket den beste løsningen for alle deres analytiske behov.