Seaborn plot DataFrame

Seaborn plot DataFrame
“Seaborn hjelper til med datautforskning og forståelse. Kartleggingsfunksjonene fungerer med datarammer og matriser som inneholder hele datasett, og utfører den nødvendige statistiske aggregering og semantisk kartlegging internt for å bygge nyttige grafer. De statistiske assosiasjonene kan sees ved hjelp av sjøborn. Statistisk analyse brukes til å finne ut hvordan parametere i et datasett forholder seg til hverandre og hvordan denne forbindelsen påvirkes av andre variabler. Denne statistiske analysen hjelper til med visualisering av trender samt identifisering av forskjellige funksjoner i datasettet.

Som standard brukes Pandas DataFrame til å laste inn datasettet. Denne DataFrame brukes av en hvilken som helst Pandas DataFrame -funksjon. Dataframes er rektangulære rutenett som inneholder data og gir enkel visning av dataene. Hver kolonne i rutenettet er en vektor som holder data for en enkelt variabel, og hver rad i rutenettet har verdier av en forekomst. Dette betyr at verdiene i en dataframes rader ikke trenger å være av samme datatype; De kan være aritmetiske, tekst, logiske eller noe annet. Dataframes er todimensjonale kommenterte datakontainere med forskjellige slags kolonner som kommer pakket med Pandas-modulen for Python.

Biblioteket i Seaborn inkluderer noen viktige datasett. Datasettene laster opp automatisk etter at SeaBorn er installert. Det nødvendige datasettet kan lastes ved hjelp av den påfølgende funksjonen.

LOAD_DATASET ()

Denne funksjonen gir deg rask tilgang til et begrenset antall eksempler på datasett som du kan bruke til å dokumentere sjøborn eller lage repeterbare eksempler for feilrapportering. Normal bruk krever ikke det.”

Eksempel 1

I vårt første eksempel bruker vi boksen for å forestille postene. Vi har sjøborn og matplotlib -moduler for å plotte linjens plot. Deretter blir en variabel erklært som data, og i den variabelen kalles Seaborn Load_Dataset. Load_dataset tar tips datarammen, som er som standard til stede i Python. Nå kan vi ringe noen av kolonnene fra Titanic Dataset for gjengivelse av plottet. Boksplottet tar x som et argument som vi har satt total_bill -kolonnen fra eksemplet datasett titanic.

Importer sjøborn som SNS
Importer matplotlib.Pyplot som Plt
Data = SNS.LOAD_DATASET ("TIPS")
sns.boxplot (data ['total_bill'])
plt.forestilling()

Titanic Data Frame Boxplot er visualisert i følgende figur.

Eksempel 2

Vi kan plotte datarammen med noen av de sjøbornede tomtene. I dette eksemplet har vi en fiolinplott for å lage Seaborn Data Frame Plot. En boksplott og en fiolinplott er sammenlignbar. Den sammenligner fordelingen av mange kvantitative datapunkter mellom en eller flere kategorifaktorer.

Når vi bruker Seaborn Load_Dataset -funksjonen, så må vi importere Python Seaborn -modulen, og for plottet har vi en matplotlib -modul. Der styler vi bakgrunnen for plottet til et mørkt rutenett. Deretter kalles LOAD_DATASET -funksjonen, hvor vi igjen har brukt eksemplet datasett -tips.

Fra eksemplet datasett tips tar vi to kolonner, total_bill og tid, for x- og y -aksene til plottet. For å bruke disse kolonnene for plottet, har vi en sjøborn fiolinplott her som tar X som total_bill for aksen og y som tid for y -aksen. Disse spesifiserte kolonnene blir sammenlignet med hverandre i plottet.

Importer sjøborn som SNS
Importer matplotlib.Pyplot som Plt
sns.sett (style = 'darkgrid')
df = sns.LOAD_DATASET ("TIPS")
sns.fiolinplot (x = "total_bill", y = "tid", data = df)
plt.forestilling()

Datarammen visualiseres i følgende figur.

Eksempel 3

Her har vi vist DataFrame -plottet med Point Plot. Et punktplott kan indikere estimering med konfidensintervaller ved å bruke spredt plottgrafikk. Poenget bestemmer en estimert statistisk betydning for et datapunkt basert på punktets plassering av spredningsplottet og inkluderer feilstenger for å indikere usikkerhetsnivået.

I det følgende skriptet har vi satt Style Dark Grid for bakgrunnen for plottet. Deretter har vi en LOAD_DATASET -funksjon, denne gangen har vi et iris -datasett for å generere plottet. Vi har gitt kolonnene Sepal_Length og Sepal_Width til X- og Y -parameteren for Point Plot.

Gimport Seaborn
Importer matplotlib.Pyplot som Plt
Seaborn.SET (Style = 'WhiteGrid')
Data = Seaborn.LOAD_DATASET ("Iris")
Seaborn.Pointplot (x = "sepal_length", y = "sepal_width", data = data)
plt.forestilling()

Punktplottet til datasett -iris vises som følger:

Eksempel 4

Den todimensjonale Pandas DataFrame er passende for statistisk struktur med merkede akser som kan varieres og er størrelsesmutabel (rader og kolonner). For å lage pandas dataramme, må lengdene på alle matriser være like. Hvis en indeks er definert, skal den ha samme lengde som matriser. Hvis ingen indeks er satt i rekkevidde (n), brukes n som standard, som er lengden på matrisen.

I det gitte kodebiten har vi importert Pandas modul, og så har vi kalt Pandas DataFrame Constructor, der de to matriser er spesifisert som List1 og List2. Vi har en samling tilfeldige tall i en rekke like lengde. For å lage grafen over dataene ovenfor, har vi en KDE -plot. Det viser sannsynlighetstettheten til en kontinuerlig variabel på forskjellige nivåer. Vi kan også lage en egen graf for flere prøver, noe som gjør datavisualisering enklere. Dataegenskapen kalles med feltene den har inne i DataFrame.

Importer matplotlib.Pyplot som Plt
Importer sjøborn som SNS
Importer pandaer
data = pandaer.DataFrame ("List1": [23, 30, 14, 15, 20],
"List2": [19, 20, 16, 26, 11])
sns.KDEPLOT (Data ['List1'], Data ['List2'])
plt.forestilling()

KDE -plottet viser sammenligningen av Pandas Dataframe inne i figuren.

Konklusjon

Nå har du en kort artikkel fra Seaborn Pot Data Frame Here. Vi kan lage datarammen av oss selv med Pandas dataramme. Dataframene i pandaer er sterke leserdatasett som du bør bruke for å få en dypere forståelse av informasjonen din. Vi kan også bruke de innebygde datarammer fra Seaborn Exemple ved å bruke LOAD_DATASET-funksjonen. Denne datarammen kan plottes med hver sjøborn -plott, da vi har vist de mange eksemplene som plottet datarammer.