Dette ser ut som mye å dekke. La oss komme i gang nå.
Hva er Python Seaborn Library?
Seaborn Library er en Python -pakke som lar oss lage infografikk basert på statistiske data. Som det er laget på toppen av matplotlib, så er den iboende kompatibel med den. I tillegg støtter den Numpy og Pandas datastruktur slik at plotting kan gjøres direkte fra disse samlingene.
Visualisering av komplekse data er noe av det viktigste Seaborn tar seg av. Hvis vi skulle sammenligne matplotlib med Seaborn, er Seaborn i stand til å gjøre disse tingene enkle som er vanskelige å oppnå med matplotlib. Det er imidlertid viktig å merke seg det Seaborn er ikke et alternativ til matplotlib, men et supplement til det. Gjennom denne leksjonen vil vi også benytte oss av matplotlib -funksjoner i kodebiten. Du vil velge å jobbe med SeaBorn i følgende brukscaser:
Bare et notat før du starter er at vi bruker et virtuelt miljø for denne leksjonen som vi laget med følgende kommando:
Python -m Virtualenv SeabornNår det virtuelle miljøet er aktivt, kan vi installere Seaborn -biblioteket i det virtuelle Env, slik at eksempler vi oppretter neste kan utføres:
Pip installer sjøbornDu kan også bruke Anaconda til å kjøre disse eksemplene som er enklere. Hvis du vil installere den på maskinen din, kan du se på leksjonen som beskriver “Hvordan installere Anaconda Python på Ubuntu 18.04 LTS ”og del tilbakemeldingene dine. La oss nå gå videre til forskjellige typer tomter som kan konstrueres med Python Seaborn.
Bruke Pokemon datasett
For å holde denne leksjonen praktisk, vil vi bruke Pokemon-datasett som kan lastes ned fra Kaggle. For å importere dette datasettet til programmet vårt, bruker vi Pandas Library. Her er all importen vi utfører i programmet vårt:
Importer pandaer som PDNå kan vi importere datasettet til programmet vårt og vise noen av eksempeldataene med Pandas som:
df = pd.read_csv ('pokemon.csv ', index_col = 0)Merk at for å kjøre ovennevnte kodebit, skal CSV -datasettet være til stede i samme katalog som selve programmet. Når vi har kjørt ovennevnte kodebit, vil vi se følgende utdata (i Anaconda Jupyters notisbok):
Plotting av lineær regresjonskurve
Noe av det beste med Seaborn er de intelligente plottefunksjonene det gir som ikke bare visualiserer datasettet vi gir det, men også konstruerer regresjonsmodeller rundt det. For eksempel er det mulig å konstruere en lineær regresjonsplott med en enkelt kodelinje. Slik gjør du dette:
sns.lmplot (x = 'angrep', y = 'forsvar', data = df)Når vi har kjørt ovennevnte kodebit, vil vi se følgende utdata:
Vi la merke til få viktige ting i ovennevnte kodebit:
Ikke vær redd hvis du trodde vi ikke kan ha et plott uten den regresjonslinjen. Vi kan ! La oss prøve et nytt kodebit nå, lik den siste:
sns.lmplot (x = 'angrep', y = 'forsvar', data = df, fit_reg = falsk)Denne gangen vil vi ikke se regresjonslinjen i plottet vårt:
Nå er dette mye tydeligere (hvis vi ikke trenger den lineære regresjonslinjen). Men dette er ikke bare over ennå. Seaborn lar oss lage annerledes dette plottet, og det er det vi skal gjøre.
Konstruering av boksplott
En av de største funksjonene i Seaborn er hvordan den lett aksepterer Pandas DataFrames -struktur for å plotte data. Vi kan ganske enkelt gi et dataafram til Seaborn -biblioteket slik at det kan konstruere et boksplott ut av det:
sns.Boxplot (data = df)Når vi har kjørt ovennevnte kodebit, vil vi se følgende utdata:
Vi kan fjerne den første avlesningen av Total, da det ser litt vanskelig ut når vi faktisk planlegger individuelle kolonner her:
Når vi har kjørt ovennevnte kodebit, vil vi se følgende utdata:
Svermplott med sjøborn
Vi kan konstruere en intuitiv design svermplott med sjøborn. Vi vil igjen bruke DataFrame fra Pandas som vi lastet tidligere, men denne gangen vil vi ringe Matplotlibs showfunksjon for å vise plottet vi laget. Her er kodebiten:
sns.set_context ("papir")Når vi har kjørt ovennevnte kodebit, vil vi se følgende utdata:
Ved å bruke en sjøkontekst, lar vi Seaborn tilsette et personlig preg og flytende design for plottet. Det er mulig å tilpasse denne plottet ytterligere med tilpasset skriftstørrelse som brukes til etiketter i plottet for å gjøre lesingen enklere. For å gjøre dette, vil vi sende flere parametere til SET_CONTEXT -funksjonen som fungerer akkurat som det de høres ut. For eksempel for å endre skriftstørrelsen på etikettene, vil vi bruke font for eksempel.størrelse parameter. Her er kodebiten for å gjøre modifiseringen:
Når vi har kjørt ovennevnte kodebit, vil vi se følgende utdata:
Fontstørrelsen for etiketten ble endret basert på parametrene vi ga og verdi tilknyttet skriften.størrelse parameter. En ting Seaborn er ekspert på er å gjøre plottet veldig intuitivt for praktisk bruk, og dette betyr at Seaborn ikke bare er en praksis Python -pakke, men faktisk noe vi kan bruke i våre produksjonsdistribusjoner.
Legger til en tittel til plott
Det er lett å legge til titler på plottene våre. Vi trenger bare å følge en enkel prosedyre for å bruke aksen-nivåfunksjonene der vi vil kalle set_title () Funksjon som vi viser i kodebiten her:
sns.set_context ("papir", font_scale = 3, rc = "font.Størrelse ": 8," Axes.etikett ": 5)Når vi har kjørt ovennevnte kodebit, vil vi se følgende utdata:
På denne måten kan vi legge til mye mer informasjon i plottene våre.
Seaborn vs matplotlib
Da vi så på eksemplene i denne leksjonen, kan vi identifisere at matplotlib og sjøborn ikke kan sammenlignes direkte, men de kan sees på som å utfylle hverandre. En av funksjonene som tar Seaborn 1 skritt foran er måten Seaborn kan visualisere data statistisk.
For å lage beste av sjøborn -parametere, anbefaler vi på det sterkeste å se på den sjøbornede dokumentasjonen og finne ut hvilke parametere du skal bruke for å gjøre handlingen din så nær forretningsbehov som mulig.
I denne leksjonen så vi på forskjellige aspekter ved dette datavisualiseringsbiblioteket som vi kan bruke med Python for å generere vakre og intuitive grafer som kan visualisere data i en form som virksomheten ønsker fra en plattform. Sjøformen er et av de viktigste visualiseringsbibliotekene når det gjelder datateknikk og presenterer data i de fleste visuelle former, definitivt en ferdighet vi trenger å ha under beltet, da det lar oss bygge lineære regresjonsmodeller.
Del tilbakemeldingene dine på leksjonen på Twitter med @SBMaggarwal og @linuxhint.