Seaborn Distplot

Seaborn Distplot

Et spredningsplott, også kjent som en distplot, viser variansen i det originale datasettet. Den totale spredningen av en sanntids dataparametere vises ved Distplot () -funksjonen til Seaborn Framework. Seaborn -biblioteket, i forbindelse med Matplotlib -biblioteket, blir brukt for å visualisere Distplot blant flere modifikasjoner. Dataene er representert ved å bruke et histogram så vel som en kurve i Distplot.

Seaborn -biblioteket inneholder en rekke metoder for å planlegge informasjonen og vise datasvingningene. Distplot er opprettet ved hjelp av Seaborn -pakkeens Distplot () -metode. Distplott illustrerer enhetsparametrene for enhetsmodeller, det vil si den statistiske spredningen av en parameter kontra spredningsforholdet.

Datasettparameteren sendes til Distplot () -metoden, som returnerer en graf med spredningsforholdet. For å bestemme muligheten for spredning av de avhengige variablene over flere datasett, kan Distplot () -metoden til Seaborn -biblioteket kombineres med KDE -plottet. Begrepet KDE er forkortet som kjernetetthetsestimat. La oss diskutere Seaborn Distplot i detalj:

Eksempel 1:

Følgende grafikk illustrerer en enkel spredning i dette trinnet. Ved hjelp av tilfeldig.Randn (), genererer det tilfeldig. Den fungerer når vi spesifiserer attributtene manuelt.

1
2
3
4
5
6
7
Importer matplotlib.Pyplot som Plt
Importer sjøborn som SNS, numpy som NP
sns.sett (rc = "figur.Figsørrelse ": (10, 6)); NP.tilfeldig.frø (2)
x = np.tilfeldig.Randn (200)
AX = Sns.Distplot (x)
plt.forestilling()


Først av alt introduserte vi de tre toppfilene. Matplotlib.Pyplot -overskriftsfilen importeres som PLT. Seaborn blir introdusert som SNS. Og Numpy blir introdusert som NP. Så benyttet vi de to funksjonene fra de forskjellige bibliotekene. Set () -funksjonen brukes for å spesifisere størrelsen på plottet. Så vi ga parameteren til "FigSize". Denne funksjonen er relatert til Seaborn Library.

Vi benyttet Randn () -funksjonen til overskriftsfilen Numpy Library. Verdien lagres i "x" "-variabelen. Distplot () -metoden brukes for å tegne grafen. Denne funksjonen inneholder verdien av X -variabelen som argumentasjon. Til slutt, PLT.Show () -metoden brukes til å representere plottet.

Eksempel 2:

Distplottet vises på en rekke måter. For å illustrere de fire variantene samtidig, bruker vi subplot () -funksjonen til Pylab Framework Method. Vi kan generere en helt distinkte visualiseringer ved å endre argumentene til Distplot () -funksjonen. Brukere vil samhandle med noen av disse argumentene for å endre fargetone, layout og andre aspekter.

I begynnelsen av programmet må vi importere noen viktige biblioteker. Hver pyplotmetode endrer et visuelt i et visst aspekt. Seaborn er en matplotlib-basert visuell analytisk pakke. Numpy er en Python -modul for en mye brukt numerisk beregning. Pylab er et bibliotek som integrerer metoder fra Numpy og Matplotlib -pakker for å skape et integrert utviklingsmiljø.

I neste trinn spesifiserer vi størrelsen på figuren. Så vi bruker SET () -metoden til Seaborn Library. Sammen med dette bruker vi metodene frø () og randn (). Begge disse funksjonene er inkludert i Numpy Library. I dette tilfellet tegner vi de fire forskjellige distplottene. Vi påkaller DistPlot () -metodene separat i fire delplotter. For å tegne det første delplottet, setter vi ganske enkelt dimensjonene og bruker deretter Distplot () -funksjonen til Seaborn Library. For det andre delplottet gir vi parametrene "teppe" og "hist" til Distplot () -funksjonen.


For å tegne den tredje delplottet bruker vi Displot () -metoden etter å ha definert dimensjonene. Her setter vi den "falske" verdien til den "vertikale" variabelen. Tilsvarende vil vi for den siste tegne en KDE -graf, så vi bruker KDEplot () -funksjonen til Seaborn Library. Verdien av "skygge" -parameteren er gitt som "sann". Og verdien av "fargen" er satt som "b". På slutten, for å vise disse delplottene, PLT.Show () -metoden brukes.

Eksempel 3:

I histogrammet viser vi noen ganger den vanlige datarammen til Seaborn -modulen. Fordi dette er et så enormt datasett, vil bare en oppføring være nok.

1
2
3
4
5
6
Importer matplotlib.Pyplot som Plt
Importer sjøborn som SNS
titanic = sns.LOAD_DATASET ('Titanic')
Age1 = Titanic ['Age'].dropna ()
sns.Distplot (Age1)
plt.forestilling()


Her innlemmer vi “PLT” og “SNS” -bibliotekene. "PLT" -biblioteket importeres av matplotlib.Pyplot og "SNS" -biblioteket importeres av Seaborn Library. Her henter vi datarammen til Titanic, så vi kalte Load_Dataset () -metoden på Seaborn Library. I neste trinn med å skildre displottet brukte vi Distplot () -metoden. Endelig illustreres grafen ved å bruke PLT.show () funksjon.

Eksempel 4:

Det er også mulig å justere størrelsen på søppelkassene og eliminere linjen. I dette tilfellet vil vi spesifisere størrelsen på søppelkassene, samt gjøre grensen til KDE gjennomsiktig ved å påkalle Distplot () -funksjonen.

1
2
3
4
5
6
7
Importer matplotlib.Pyplot som Plt
Importer sjøborn som SNS
titanic = sns.LOAD_DATASET ('Titanic')
Age1 = Titanic ['Age'].dropna ()
sns.DistPlot (Age1, Bins = 30, KDE = True)
plt.forestilling()


Etter å ha importert de nødvendige overskriftsfilene, matplotlib.Pyplot og Seaborn, vi har tenkt å få Titanic Data Set. Dermed brukte vi Seaborn Librarys Load Dataset () -metode. Vi kalte DistPlot () -funksjonen for å tegne grafen. Det er tre parametere i denne metoden. Distplot () -funksjonen lar oss definere søppelstørrelsen og verdien av "KDE". Verdien av "kde" er satt til "sann" i dette tilfellet. Da, ved å bruke PLT.vis () metode, grafen blir sett.

Konklusjon

Vi demonstrerte hvordan vi tegner distploter ved å bruke Seaborn -biblioteket i denne artikkelen. Vi har sett en rekke eksempler relatert til dette gitte emnet. Distplot () -funksjonen til Seaborn -biblioteket lar brukerne vise et histogram som har en linje. Dette kan illustreres på flere forskjellige måter. Seaborn brukes ofte i forbindelse med matplotlib, som er et visualiseringsrammeverk. En distplot er en graf som viser en enkeltvariat spredning av dataene. HIST -metoden for matplotlib er integrert ved kDeplot () -metoden i Distplot () -metoden.