Seaborn Boxplot

Seaborn Boxplot
Seaborn er en Python -modul for å lage numeriske visualiseringer. Det er basert på Matplotlib -biblioteket og samhandler omfattende med Pandas Header -filer. Seaborn hjelper brukere med å analysere og forstå dataene. Dets visualisering av funksjoner fungerer med datastruktur og matriser, inkludert hele poster, og gir den nødvendige semantiske kartleggingen og settet med assosiasjoner internt for å generere nyttige grafer. Datakilden, eksplisitt API, lar brukerne konsentrere seg om å tolke diagrammer i stedet for tekniske forhold til å presentere dem.

Seaborns plotting av interoperabilitet lar brukeren få tilgang til den i forskjellige scenarier, for eksempel utforskende analyse, faktisk interaktivitet i grafiske apper og arkivert utfall i en rekke grafiske og vektorrepresentasjoner.

En boksplott har en tendens til å holde statistiske data organisert slik at analyser innenfor parametere eller til og med på tvers av et sett med attributter er klarere. Hvis det er gitt, vises persentilene og kritiske verdiene for medianen i basisrammen til boksen. Datapunktene er horisontale linjer som går gjennom midten av hver boks, mens Whiskers representerer parallelle linjer som utvides til de mest overdreven datasettene, og CAPS representerer linjer trukket som går gjennom Whiskers 'kanter. Boxplot kan også brukes til å finne outliers i en gitt dataramme.

Vi lærer metodene for å tegne boksplotter av Seaborn -modulen i denne Linux Hint -opplæringen.

Bruk av Boxplot () -metode

Boxplot () -funksjonen brukes til å tegne en bokseplott. IRIS -blomsterstanden er importert i tilfellet nedenfor. Boksplottet viser etter hvert de laveste, høyeste, 1. persentil- og 3. persentilverdiene.

Importer sjøborn som SNS
Importer matplotlib.Pyplot som Plt
df = sns.LOAD_DATASET ('Iris')
trykk (df.hode())
sns.boxplot (y = df ["sepal_length"])
plt.forestilling()

I begynnelsen av programmet må vi importere bibliotekene. "Seaborn" -biblioteket importeres som SNS, og biblioteket "Matplotlib.Pyplot ”er importert som PLT. Da erklærer vi en variabel som heter “DF.”Vi ønsker å laste inn dataene, så vi har brukt lastdatasettet () -funksjonen. Datasettet lagres i "DF" -variabelen. Head () -funksjonen brukes. For å få de første N -oppføringene, bruker vi denne funksjonen. Avhengig av objektets posisjon, inneholder denne metoden bare de første N -postene. Det er i stand til effektivt å avgjøre om objektet inneholder passende slags data. Serien med oppføringer å velge.

Nå bruker vi Boxplot () -funksjonen, og vi har gitt Y-parameteren til denne funksjonen. En boksplott er en standardteknikk for å skildre flerdimensjonale data bestående av fem analyser: “minimal”.”For å vise den endelige grafen, PLT.Show () -metoden brukes.

Boxplot horisontalt

En horisontalt plott kan brukes som en boksplott. Vi skal tegne boksen i det horisontale planet som presentert i figuren. Vi bruker iris datarammen en gang til. Sjuene som vises er standardfargene; Imidlertid kan de endres.

Importer sjøborn som SNS
Importer matplotlib.Pyplot som Plt
df = sns.LOAD_DATASET ('Iris')
sns.Boxplot (y = df ["art"], x = df ["sepal_length"])
plt.forestilling()

Først av alt har vi integrert to overskriftsfiler. Overskriftsfilen Seaborn og Matplotlib.Pyplot. Lastdatasettet () brukes til å laste inn datasettet i plottet. I det påfølgende trinnet har vi lagt til Head () -metoden. Denne funksjonen returnerer de første fem rammene av datasettet etter konfigurasjon. Det er bare en inngangsparameter: serien med rader. Dette argumentet lar oss indikere antall verdier vi trenger.

La oss bruke Boxplot () -funksjonen, da den kan indikere ytterligere avvik og tilhørende verdier. Her har vi gitt X-Parameter og Y-parameter til denne funksjonen. Etiketten til y-aksen til plottet er tatt som navnet på arten, og etiketten til x-aksen til grafen er hentet fra sepal_length. Vi har brukt show () -funksjonen for å representere den resulterende plottet.

Tilpass fargene på boksen

Nyanser for boksen plottet kan tilpasses. Ved å spesifisere "palett" -attributtet, kan vi oppnå dette. Det har vært en rekke paletter, og paletten "magma" inkluderer et bredt spekter av magma.

Importer sjøborn som SNS
Importer matplotlib.Pyplot som Plt
df = sns.LOAD_DATASET ('Iris')
sns.Boxplot (y = df ["art"], x = df ["sepal_length"], palette = "magma")
plt.forestilling()

Vi spesifiserer en variant kalt “DF” etter å ha introdusert bibliotekene Seaborn og Matplotlib i programmet. Så har vi brukt Load Dataset () -metoden for å hente dataene. I "DF" -variabelen lagres datasettet. Metodehodet () vil bli brukt. Denne funksjonen vil bli brukt til å skaffe de første N -varene.

Nå bruker vi Boxplot () -metoden, som vi har tildelt X- og Y-parametere. Sammen med disse parametrene har vi spesifisert fargen på boksen. Vi har satt "magma" -fargen til parameteren "palett" i denne koden. Plt.Show () -metoden brukes til å illustrere den støpte grafen.

Juster størrelsen på boksen

Breddealternativet vil bli brukt til å endre størrelsen på de forskjellige boksplottene. Standardbredden er 1; derfor noe mindre enn det gjør boksene kortere.

Importer sjøborn som SNS
Importer matplotlib.Pyplot som Plt
df = sns.LOAD_DATASET ('Iris')
sns.Boxplot (x = df ["art"], y = df ["sepal_length"], bredde = 0.2)
plt.forestilling()

De nødvendige bibliotekene må lastes i starten av koden. Datasettet i grafikken lastes inn ved å bruke Load Dataset () -metoden. Head () -metoden har blitt brukt i det påfølgende trinnet. Som standard vil denne metoden gi de fem første delene av settet. Vi bruker Boxplot () -metoden for å tegne boksen. Denne funksjonen er tildelt X-Parameter og den allerede siterte y-parameteren. Bredden på boksen er også spesifisert.

Så vi har gitt denne funksjonen "bredde" -argumentet. Y-aksen til plottet er merket med navnet på arten, mens grafens x-aksen er merket med sepal lengde. Vi har brukt Show () -metoden for å representere utgangsplottet.

Konklusjon

I denne gjenstanden har vi sett på hvordan du tegner boksplotter ved hjelp av Seaborn Library. Vi har sett hvordan vi kan endre bredden og fargene på boksen. Den visuelle skildringen av å presentere sett med statistisk informasjon av deres persentil blir referert til som en boksplott. Den omslutter effektivt de innsamlede dataene ved hjelp av en boks og barer og gjør oss alle i stand til å evaluere sett direkte.