Python Seaborn Tutorial

Python Seaborn Tutorial
I denne leksjonen om Python Seaborn Library, vil vi se på forskjellige aspekter av dette datavisualiseringsbiblioteket som vi kan bruke med Python for å generere vakre og intuitive grafer som kan visualisere data i en form som virksomheten ønsker fra en plattform. For å gjøre denne leksjonen komplett, vil vi dekke følgende seksjoner:
  • Hva er Python Seaborn?
  • Typer tomter vi kan konstruere med sjøborn
  • Arbeide med flere tomter
  • Noen alternativer for Python Seaborn

Dette ser ut som mye å dekke. La oss komme i gang nå.

Hva er Python Seaborn Library?

Seaborn Library er en Python -pakke som lar oss lage infografikk basert på statistiske data. Som det er laget på toppen av matplotlib, så er den iboende kompatibel med den. I tillegg støtter den Numpy og Pandas datastruktur slik at plotting kan gjøres direkte fra disse samlingene.

Visualisering av komplekse data er noe av det viktigste Seaborn tar seg av. Hvis vi skulle sammenligne matplotlib med Seaborn, er Seaborn i stand til å gjøre disse tingene enkle som er vanskelige å oppnå med matplotlib. Det er imidlertid viktig å merke seg det Seaborn er ikke et alternativ til matplotlib, men et supplement til det. Gjennom denne leksjonen vil vi også benytte oss av matplotlib -funksjoner i kodebiten. Du vil velge å jobbe med SeaBorn i følgende brukscaser:

  • Du har statistiske tidsseriedata som skal plottes med representasjon av usikkerhet rundt estimatene
  • Å visuelt fastslå forskjellen mellom to undergrupper av data
  • For å visualisere de univariate og bivariate distribusjonene
  • Legger til mye mer visuell kjærlighet til matplotlib-plottene med mange innebygde temaer
  • For å passe og visualisere maskinlæringsmodeller gjennom lineær regresjon med uavhengige og avhengige variabler

Bare et notat før du starter er at vi bruker et virtuelt miljø for denne leksjonen som vi laget med følgende kommando:

Python -m Virtualenv Seaborn
Kilde Seaborn/Bin/Aktiver

Når det virtuelle miljøet er aktivt, kan vi installere Seaborn -biblioteket i det virtuelle Env, slik at eksempler vi oppretter neste kan utføres:

Pip installer sjøborn

Du kan også bruke Anaconda til å kjøre disse eksemplene som er enklere. Hvis du vil installere den på maskinen din, kan du se på leksjonen som beskriver “Hvordan installere Anaconda Python på Ubuntu 18.04 LTS ”og del tilbakemeldingene dine. La oss nå gå videre til forskjellige typer tomter som kan konstrueres med Python Seaborn.

Bruke Pokemon datasett

For å holde denne leksjonen praktisk, vil vi bruke Pokemon-datasett som kan lastes ned fra Kaggle. For å importere dette datasettet til programmet vårt, bruker vi Pandas Library. Her er all importen vi utfører i programmet vårt:

Importer pandaer som PD
fra matplotlib import pyplot som plt
Importer sjøborn som SNS

Nå kan vi importere datasettet til programmet vårt og vise noen av eksempeldataene med Pandas som:

df = pd.read_csv ('pokemon.csv ', index_col = 0)
df.hode()

Merk at for å kjøre ovennevnte kodebit, skal CSV -datasettet være til stede i samme katalog som selve programmet. Når vi har kjørt ovennevnte kodebit, vil vi se følgende utdata (i Anaconda Jupyters notisbok):

Plotting av lineær regresjonskurve

Noe av det beste med Seaborn er de intelligente plottefunksjonene det gir som ikke bare visualiserer datasettet vi gir det, men også konstruerer regresjonsmodeller rundt det. For eksempel er det mulig å konstruere en lineær regresjonsplott med en enkelt kodelinje. Slik gjør du dette:

sns.lmplot (x = 'angrep', y = 'forsvar', data = df)

Når vi har kjørt ovennevnte kodebit, vil vi se følgende utdata:

Vi la merke til få viktige ting i ovennevnte kodebit:

  • Det er dedikert plottingsfunksjon tilgjengelig i Seaborn
  • Vi brukte Seaborns montering og plottefunksjon som ga oss en lineær regresjonslinje som den modellerte seg selv

Ikke vær redd hvis du trodde vi ikke kan ha et plott uten den regresjonslinjen. Vi kan ! La oss prøve et nytt kodebit nå, lik den siste:

sns.lmplot (x = 'angrep', y = 'forsvar', data = df, fit_reg = falsk)

Denne gangen vil vi ikke se regresjonslinjen i plottet vårt:

Nå er dette mye tydeligere (hvis vi ikke trenger den lineære regresjonslinjen). Men dette er ikke bare over ennå. Seaborn lar oss lage annerledes dette plottet, og det er det vi skal gjøre.

Konstruering av boksplott

En av de største funksjonene i Seaborn er hvordan den lett aksepterer Pandas DataFrames -struktur for å plotte data. Vi kan ganske enkelt gi et dataafram til Seaborn -biblioteket slik at det kan konstruere et boksplott ut av det:

sns.Boxplot (data = df)

Når vi har kjørt ovennevnte kodebit, vil vi se følgende utdata:

Vi kan fjerne den første avlesningen av Total, da det ser litt vanskelig ut når vi faktisk planlegger individuelle kolonner her:

stats_df = df.slipp (['total'], akse = 1)
# Ny boksplot ved hjelp av stats_df
sns.boxplot (data = stats_df)

Når vi har kjørt ovennevnte kodebit, vil vi se følgende utdata:

Svermplott med sjøborn

Vi kan konstruere en intuitiv design svermplott med sjøborn. Vi vil igjen bruke DataFrame fra Pandas som vi lastet tidligere, men denne gangen vil vi ringe Matplotlibs showfunksjon for å vise plottet vi laget. Her er kodebiten:

sns.set_context ("papir")
sns.SwarmPlot (X = "Attack", Y = "Defense", Data = DF)
plt.forestilling()

Når vi har kjørt ovennevnte kodebit, vil vi se følgende utdata:

Ved å bruke en sjøkontekst, lar vi Seaborn tilsette et personlig preg og flytende design for plottet. Det er mulig å tilpasse denne plottet ytterligere med tilpasset skriftstørrelse som brukes til etiketter i plottet for å gjøre lesingen enklere. For å gjøre dette, vil vi sende flere parametere til SET_CONTEXT -funksjonen som fungerer akkurat som det de høres ut. For eksempel for å endre skriftstørrelsen på etikettene, vil vi bruke font for eksempel.størrelse parameter. Her er kodebiten for å gjøre modifiseringen:

sns.set_context ("papir", font_scale = 3, rc = "font.Størrelse ": 8," Axes.etikett ": 5)
sns.SwarmPlot (X = "Attack", Y = "Defense", Data = DF)
plt.forestilling()

Når vi har kjørt ovennevnte kodebit, vil vi se følgende utdata:

Fontstørrelsen for etiketten ble endret basert på parametrene vi ga og verdi tilknyttet skriften.størrelse parameter. En ting Seaborn er ekspert på er å gjøre plottet veldig intuitivt for praktisk bruk, og dette betyr at Seaborn ikke bare er en praksis Python -pakke, men faktisk noe vi kan bruke i våre produksjonsdistribusjoner.

Legger til en tittel til plott

Det er lett å legge til titler på plottene våre. Vi trenger bare å følge en enkel prosedyre for å bruke aksen-nivåfunksjonene der vi vil kalle set_title () Funksjon som vi viser i kodebiten her:

sns.set_context ("papir", font_scale = 3, rc = "font.Størrelse ": 8," Axes.etikett ": 5)
my_plot = sns.SwarmPlot (X = "Attack", Y = "Defense", Data = DF)
my_plot.set_title ("LH Swarm Plot")
plt.forestilling()

Når vi har kjørt ovennevnte kodebit, vil vi se følgende utdata:

På denne måten kan vi legge til mye mer informasjon i plottene våre.

Seaborn vs matplotlib

Da vi så på eksemplene i denne leksjonen, kan vi identifisere at matplotlib og sjøborn ikke kan sammenlignes direkte, men de kan sees på som å utfylle hverandre. En av funksjonene som tar Seaborn 1 skritt foran er måten Seaborn kan visualisere data statistisk.

For å lage beste av sjøborn -parametere, anbefaler vi på det sterkeste å se på den sjøbornede dokumentasjonen og finne ut hvilke parametere du skal bruke for å gjøre handlingen din så nær forretningsbehov som mulig.

Konklusjon

I denne leksjonen så vi på forskjellige aspekter ved dette datavisualiseringsbiblioteket som vi kan bruke med Python for å generere vakre og intuitive grafer som kan visualisere data i en form som virksomheten ønsker fra en plattform. Sjøformen er et av de viktigste visualiseringsbibliotekene når det gjelder datateknikk og presenterer data i de fleste visuelle former, definitivt en ferdighet vi trenger å ha under beltet, da det lar oss bygge lineære regresjonsmodeller.

Del tilbakemeldingene dine på leksjonen på Twitter med @SBMaggarwal og @linuxhint.