Som standard brukes Pandas DataFrame til å laste inn datasettet. Denne DataFrame brukes av en hvilken som helst Pandas DataFrame -funksjon. Dataframes er rektangulære rutenett som inneholder data og gir enkel visning av dataene. Hver kolonne i rutenettet er en vektor som holder data for en enkelt variabel, og hver rad i rutenettet har verdier av en forekomst. Dette betyr at verdiene i en dataframes rader ikke trenger å være av samme datatype; De kan være aritmetiske, tekst, logiske eller noe annet. Dataframes er todimensjonale kommenterte datakontainere med forskjellige slags kolonner som kommer pakket med Pandas-modulen for Python.
Biblioteket i Seaborn inkluderer noen viktige datasett. Datasettene laster opp automatisk etter at SeaBorn er installert. Det nødvendige datasettet kan lastes ved hjelp av den påfølgende funksjonen.
LOAD_DATASET ()Denne funksjonen gir deg rask tilgang til et begrenset antall eksempler på datasett som du kan bruke til å dokumentere sjøborn eller lage repeterbare eksempler for feilrapportering. Normal bruk krever ikke det.”
Eksempel 1
I vårt første eksempel bruker vi boksen for å forestille postene. Vi har sjøborn og matplotlib -moduler for å plotte linjens plot. Deretter blir en variabel erklært som data, og i den variabelen kalles Seaborn Load_Dataset. Load_dataset tar tips datarammen, som er som standard til stede i Python. Nå kan vi ringe noen av kolonnene fra Titanic Dataset for gjengivelse av plottet. Boksplottet tar x som et argument som vi har satt total_bill -kolonnen fra eksemplet datasett titanic.
Importer sjøborn som SNSTitanic Data Frame Boxplot er visualisert i følgende figur.
Eksempel 2
Vi kan plotte datarammen med noen av de sjøbornede tomtene. I dette eksemplet har vi en fiolinplott for å lage Seaborn Data Frame Plot. En boksplott og en fiolinplott er sammenlignbar. Den sammenligner fordelingen av mange kvantitative datapunkter mellom en eller flere kategorifaktorer.
Når vi bruker Seaborn Load_Dataset -funksjonen, så må vi importere Python Seaborn -modulen, og for plottet har vi en matplotlib -modul. Der styler vi bakgrunnen for plottet til et mørkt rutenett. Deretter kalles LOAD_DATASET -funksjonen, hvor vi igjen har brukt eksemplet datasett -tips.
Fra eksemplet datasett tips tar vi to kolonner, total_bill og tid, for x- og y -aksene til plottet. For å bruke disse kolonnene for plottet, har vi en sjøborn fiolinplott her som tar X som total_bill for aksen og y som tid for y -aksen. Disse spesifiserte kolonnene blir sammenlignet med hverandre i plottet.
Importer sjøborn som SNSDatarammen visualiseres i følgende figur.
Eksempel 3
Her har vi vist DataFrame -plottet med Point Plot. Et punktplott kan indikere estimering med konfidensintervaller ved å bruke spredt plottgrafikk. Poenget bestemmer en estimert statistisk betydning for et datapunkt basert på punktets plassering av spredningsplottet og inkluderer feilstenger for å indikere usikkerhetsnivået.
I det følgende skriptet har vi satt Style Dark Grid for bakgrunnen for plottet. Deretter har vi en LOAD_DATASET -funksjon, denne gangen har vi et iris -datasett for å generere plottet. Vi har gitt kolonnene Sepal_Length og Sepal_Width til X- og Y -parameteren for Point Plot.
Gimport SeabornPunktplottet til datasett -iris vises som følger:
Eksempel 4
Den todimensjonale Pandas DataFrame er passende for statistisk struktur med merkede akser som kan varieres og er størrelsesmutabel (rader og kolonner). For å lage pandas dataramme, må lengdene på alle matriser være like. Hvis en indeks er definert, skal den ha samme lengde som matriser. Hvis ingen indeks er satt i rekkevidde (n), brukes n som standard, som er lengden på matrisen.
I det gitte kodebiten har vi importert Pandas modul, og så har vi kalt Pandas DataFrame Constructor, der de to matriser er spesifisert som List1 og List2. Vi har en samling tilfeldige tall i en rekke like lengde. For å lage grafen over dataene ovenfor, har vi en KDE -plot. Det viser sannsynlighetstettheten til en kontinuerlig variabel på forskjellige nivåer. Vi kan også lage en egen graf for flere prøver, noe som gjør datavisualisering enklere. Dataegenskapen kalles med feltene den har inne i DataFrame.
Importer matplotlib.Pyplot som PltKDE -plottet viser sammenligningen av Pandas Dataframe inne i figuren.
Konklusjon
Nå har du en kort artikkel fra Seaborn Pot Data Frame Here. Vi kan lage datarammen av oss selv med Pandas dataramme. Dataframene i pandaer er sterke leserdatasett som du bør bruke for å få en dypere forståelse av informasjonen din. Vi kan også bruke de innebygde datarammer fra Seaborn Exemple ved å bruke LOAD_DATASET-funksjonen. Denne datarammen kan plottes med hver sjøborn -plott, da vi har vist de mange eksemplene som plottet datarammer.