Kerneltetthetsestimering (KDE) er en teknikk for å skildre betinget fordeling av lineære og ikke-lineære inngangsparametere. KDEPLOT () -metoden returnerer en mye mindre kompleks, bedre semantisk grafikk når vi vil vise mange dispersjoner. Ulike datasett kunne sees ved å bruke en grafisk presentasjon i KDE. Det er en mye mer effektiv form for visuell analyse. Kerneltetthetsestimering (KDE) er en prediktiv modell for databehandling og visualisering av den bakre sannsynligheten for en diskret variabel. Analysen gjør ingen forutsetninger angående datasettet, inkludert om det gjenspeiler kravene til en standard eller noen sannsynlighet.
Kjernetetthetsestimat er en forenklet histogramversjon som ikke inkluderer distribusjonslinjen og respektive terminalpunkter. Å lage distinkte figurer for datasettene og kombinere disse for å lage en komplett form gir en utbedret linje for den bakre fordelingen av et originalt datasett.
Seaborn er et programmeringsrammeverk som matplotlib. Seaborn kan brukes til visualisering med pandaer og numpy moduler. Dataanalytikere bruker verktøysett for å lage relevante og tiltalende analytiske, grafiske representasjoner. Ved hjelp av KDEplot () -metoden til Seaborn -biblioteket kan vi trekke beskrivende og inferensiell statistisk grafikk.
Vi vil undersøke hvordan du bruker sjøborn for å visualisere KDE -grafene. For å illustrere KDE -grafoppsettet, vil denne artikkelen bruke noen få forekomster fra de originale dataene.
Eksempel 1
Vi kan validere modellen ved hjelp av Seaborn -pakken ved å ringe standard KDEplot () -metoden. Vi samlet 2500 sekvensdata med den randomiserte modulen i følgende scenario. Plasserte disse i en numpy dataramme siden Seaborn -pakken utelukkende samhandler med Numpy -modulen og Pandas -modulen. Seaborneksemplet for denne forekomsten er festet nedenfor:
Vi begynner programmet ved å innlemme de nødvendige overskriftsfilene. Seaborn -overskriftsfilen vil bli integrert som SN, Matplotlib.Pyplot vil bli integrert som PLT, og Numpy vil bli integrert som NP. I det påfølgende trinnet har vi indikert datasettet med 2500 oppføringer. Dette kan oppnås ved å bruke RANDN () -metoden til Numpy Library.
Vi har brukt KDEplot () -funksjonen for å tegne en KDE -graf. Denne funksjonen er relatert til Seaborn -pakken. Vi har gitt datarammen, fargen og skyggen som argumentene til KDEplot () -funksjonen. Her setter vi verdien av skygge som 'sann' og verdien av farger som 'lilla'. Denne koden blir avsluttet ved å kalle showet () funksjonen til matplotlib.Pyplot -modul. Denne funksjonen representerer den endelige plottet.
Eksempel nr. 2
Ved å bruke KDEPLOT () -funksjonen og sjøborn -rammen, kan vi videre representere settet med datas diagonalt eller invertere den resulterende grafen. For å snu skjermen, benyttet vi grafparameteren vertikal = True. Seaborneksemplet for denne forekomsten er festet nedenfor:
Først importerte vi bibliotekene: Seaborn, Matplotlib.pyplot, og numpy. Vi må definere 1000 -samlingene med data. Numpy Librarys Randn () -funksjon kan brukes til å oppnå dette. For å lage et KDE -kart, benyttet vi KDEplot () -metoden. Seaborn -modulen er koblet til denne funksjonen. KDEplot () -metoden har forskjellige argumenter: en dataramme, en farge og en nyanse. Vi vil at plottet skal trekkes vertikalt i dette tilfellet. Som et resultat benyttet vi det 'vertikale' argumentet og satte verdien til 'sann'.
Vi justerte skyggeverdien til 'True' og fargeverdien til 'grønn'. Denne koden vil bli avsluttet med å utføre matplotlib.Pyplot Module's show () -funksjon. Den endelige grafikken er avbildet ved hjelp av denne metoden.
Eksempel nr. 3
Vi tar de to parametrene inn i KDEplot () -funksjonen til Seaborn -pakken for å konstruere den multivariate regresjonen KDE -plottet for avhengige parametere. KDEPLOT () -funksjonen brukes til å plotte data. I den påfølgende koden vil vi vise hvordan du får en multivariat regresjon KDE -plot. Seaborneksemplet for denne forekomsten er festet nedenfor:
Toppfilene må inkluderes i begynnelsen av skriptet. PD vil bli importert av Pandas Library, SNS ville bli importert av Seaborn Library, og PLT vil bli importert ved hjelp av Matplotlib.Pyplot. Sammen med alle disse inkluderer vi en matplotlib inline -modul.
I neste trinn vil vi definere datasettene for både x-aksen og y-aksen. Vi definerer settene ved å ringe Randn () -metoden til Numpy Library. Nå har vi påkalt KDEplot () -funksjonen for å tegne KDE -grafen. Vi har gitt datasettene til begge aksene som parametere for denne metoden. SHOW () -funksjonen brukes til å illustrere det resulterende diagrammet:
Eksempel 4
Koden vår vil bruke 'CBAR' i dette sammenhengsargumentet. Hvis verdien av 'CBAR' er sann, brukes en fargestang på en multivariat regresjonsgraf for å fremheve Hue -representasjonen. Dessverre tillater det på en eller annen måte ikke visualiseringer med en fargeparameter. Seaborneksemplet for denne forekomsten er festet nedenfor:
Etter å ha introdusert de nødvendige bibliotekene, pandaer, sjøborn, numpy og matplotlib.Pyplot, både x-aksen og Y-aksen datarammer er spesifisert. Settene er definert mens du bruker Numpy Librarys Randn () -funksjon. Vi har ringt KDEplot () -verktøyet for å tegne KDE -grafen. Denne metoden er en komponent i Seaborn -pakken. Parametrene for denne metodikken er datasettene fra begge aksene. Vi har gitt "CBAR" -argumentet til KDEplot () -metoden. Show () -metoden vil bli brukt til å visualisere den oppnådde grafen.
Konklusjon
I denne artikkelen har vi brukt KDE -grafpresentasjonen med Pandas -modulen og Seaborn -pakken. I et 1D KDE -diagram har vi observert hvordan vi skildrer den sannsynlige modellen til en og mange variabler. Vi snakket om hvordan vi skildrer et 2D -datasett ved å bruke KDE -oppsettet med Seaborn Framework. Vi ga også KDEplot () -metoden med noen parametere for å observere hvordan de påvirket kartet.