Installer Anaconda Python og Jupyter notatbøker for datavitenskap

Installer Anaconda Python og Jupyter notatbøker for datavitenskap

Komme i gang med Anaconda

For å forklare hva som er Anaconda, vil vi sitere definisjonen fra det offisielle nettstedet:

Anaconda er en gratis, lett å installere pakkeansvarlig, miljøsjef og Python-distribusjon med en samling på 1000+ open source-pakker med gratis samfunnsstøtte. Anaconda er plattform-agnostisk, så du kan bruke den enten du er på Windows, MacOS eller Linux.

Det er enkelt å sikre og skalere ethvert datavitenskapsprosjekt med Anaconda, da det ikke kan ta et prosjekt fra den bærbare datamaskinen direkte til distribusjonsklyngen. Et komplett sett med funksjoner kan også vises med det offisielle bildet:

Anaconda Enterprise

For å vise kort hva Anaconda er, er her noen raske punkter:

  • Den inneholder Python og hundrevis av pakker som er spesielt nyttige hvis du kommer i gang eller opplevd med datavitenskap og maskinlæring
  • Det kommer med Conda Package Manager og virtuelle miljøer som utvikler veldig enkelt
  • Det lar deg komme i gang med utvikling veldig raskt uten å kaste bort tiden din til å sette opp verktøy for datavitenskap og maskinlæring

Du kan installere Anaconda herfra. Den installerer automatisk Python på maskinen din, slik at du ikke trenger å installere den separat.

Anaconda vs Jupyter notatbøker

Hver gang jeg prøver å diskutere Anaconda med mennesker som er nybegynnere med Python og Data Science, blir de forvirrede mellom Anaconda og Jupyter -notatbøker. Vi vil sitere forskjellen i en linje:

Anaconda er Pakkesjef. Jupyter er en Presentasjonslag.

Anaconda prøver å løse Avhengighet helvete I Python-Where-forskjellige prosjekter har forskjellige avhengighetsversjoner-så ikke å gjøre forskjellige prosjektavhengigheter krever forskjellige versjoner, noe som kan forstyrre hverandre.

Jupyter prøver å løse spørsmålet om reproduserbarhet i analysen ved å muliggjøre en iterativ og praktisk tilnærming til å forklare og visualisere kode; Ved å bruke rik tekstdokumentasjon kombinert med visuelle representasjoner, i en enkelt løsning.

Anaconda ligner Pyenv, Venv og Minconda; Det er ment å oppnå et Python -miljø som er 100% reproduserbart i et annet miljø, uavhengig av andre versjoner av prosjektets avhengigheter er tilgjengelige. Det ligner litt på Docker, men begrenset til Python -økosystemet.

Jupyter er en Fantastisk presentasjonsverktøy for analytisk arbeid; Hvor du kan presentere kode i "blokker", kombineres med rike tekstbeskrivelser mellom blokker, og inkludering av formatert utgang fra blokkene, og grafer generert i en godt designet materie ved hjelp av en annen blokkkode.

Jupyter er utrolig bra i analytisk arbeid for å sikre reproduserbarhet I noens forskning, slik at hvem som helst kan komme tilbake mange måneder senere og visuelt forstå hva noen prøvde å forklare, og se nøyaktig hvilken kode som drev hvilken visualisering og konklusjon.

Ofte i analytisk arbeid vil du ende opp med tonnevis av halvfulle notatbøker som forklarer bevis-av-konseptideer, hvorav de fleste ikke vil lede noe sted i utgangspunktet. Noen av disse presentasjonene kan ha måneder senere-eller til og med år senere tilstedeværende et grunnlag å bygge fra for et nytt problem.

Bruke Anaconda og Jupyter Notebook fra Anaconda

Til slutt vil vi se på noen kommandoer som vi vil kunne bruke Anaconda, Python og Jupyter på Ubuntu -maskinen vår. Først vil vi laste ned installasjonsprogrammet fra Anaconda -nettstedet med denne kommandoen:

Curl -o -k https: // repo.Anaconda.com/arkiv/anaconda3-5.2.0-Linux-X86_64.sh

Vi må også sikre dataintegriteten til dette skriptet:

SHA256SUM Anaconda3-5.2.0-Linux-X86_64.sh

Vi får følgende utdata:

Sjekk Anaconda -integriteten

Vi kan nå kjøre Anaconda -skriptet:

Bash Anaconda3-5.2.0-Linux-X86_64.sh

Når du har godtatt vilkårene, må du gi et sted for installasjon av pakker eller bare treffe Enter for at den skal ta standardplassen. Når installasjonen er fullført, kan vi aktivere installasjonen med denne kommandoen:

kilde ~/.Bashrc

Til slutt, test installasjonen:

Conda List

Å lage et Anaconda -miljø

Når vi har en fullstendig installasjon på plass, kan vi bruke følgende kommando for å lage et nytt miljø:

conda create -name my_env python = 3

Vi kan nå aktivere miljøet vi gjorde:

Kilde Aktiver my_env

Med dette vil ledeteksten vår endre seg, og gjenspeiler et aktivt Anaconda -miljø. For å fortsette med å sette opp et Jupyter -miljø, fortsett med denne leksjonen som er en utmerket leksjon om hvordan du installerer Jupyter -notatbøker på Ubuntu og begynn å bruke dem.

Konklusjon: Installer Anaconda Python og Jupyter notatbøker for datavitenskap

I denne leksjonen studerte vi hvordan vi kan installere og begynne å bruke Anaconda -miljøet på Ubuntu 18.04 som er en utmerket miljøsjef å ha, spesielt for nybegynnere for datavitenskap og maskinlæring. Dette er bare en veldig enkel introduksjon av mange leksjoner som kommer for Anaconda, Python, Data Science and Machine Learning. Del tilbakemeldingene dine for leksjonen med meg eller til Linuxhint Twitter -håndtaket.