Seaborn gruppert bar plot

Seaborn gruppert bar plot
“Seaborn er basert på Matplotlib, Pythons kjernevisualiseringspakke. Det gjør det mulig for programmerere å lage en grafisk visualisering ved hjelp av Pythons plottespråk, og det tilbyr også et verktøy for å laste inn dataene i R eller Matplotlib. Du kan også bruke dataene for å lære hvordan data brukes, forstå virksomheten til analyseprosjektet ditt, eller få et grundig grep om de forskjellige måtene. Du kan begynne med å bruke pandaer for å utforske dataene.”

Hva er den sjøborn grupperte barplottet

Den grupperte barplottet er en form for et diagram som visualiserer verdiene til mange variabler samtidig ved å gruppere stenger sammen. Denne artikkelen viser deg hvordan du designer den grupperte barplottet sett nedenfor i Python ved å bruke Seaborn Visualization Package. Før alt dette må man forstå følgende konsepter:

Når vi har to parametere, hvorav den ene er antall og de andre kategoriske, er stolpediagrammer ideelle. Korrelasjonen mellom dem kan avsløres ved hjelp av en barplot. En bar plot er en visualiseringsteknikk der en gruppe er representert av rektangulære vertikale stenger på x-aksen og deres handlinger på y-aksen. I de fleste tilfeller representerer x-aksen aggregeringen av kategorivariabelen som skal plottes, mens y-aksen representerer den samlede numeriske verdien. Vi kan se Y-aksen plottet med gjennomsnittet av de distinkte kategorifunksjonene. En stolpeplott viser et estimat av den numeriske variabelenes sentrale tendens med mange avhengige variabler.

Når du arbeider med flere kategorivariabler, er en gruppert barplot nyttig. Grupperte bardomter er enkle å lage med Pythons sjøkartpakke.

DataFrame Groupby () -metoden i pandaer brukes til å dele ut elementer i klynger som består av et sett med kriterier. Pandas kan deles langs hvilken som helst akse. Det abstrakte konseptet med gruppering er tildelingen av etiketter til grupper. Pandas Groupby -funksjon brukes til å gruppere data i kategorier og utføre denne funksjonen på hver kategori.

Eksempel 1

Her har vi den enkle implementeringen av en gruppert barplott. Til å begynne med har vi en matplotlib som PLT, og Seaborn -modulen som SNS er lagt til i Python -skriptfilen. Deretter har vi valgt et eksempel på datasett "tips" fra Python innebygde datasett. Vi har lastet dette datasettet i SeaBorn -funksjonen som representerer SNS.LOAD_DATASET (). Bruke kolonnene fra det lastede datasettet “TIP” i Groupby-funksjonen, som grupperte to-kolonne størrelse og kjønn fra tips-eksemplet datasettet.

Sammen med Groupby -funksjonen har vi kalt aggregeringsfunksjonen. Aggregeringsfunksjonen brukes på kolonnen “Total_bill.”Aggregeringsfunksjonen utfører gjennomsnittlig operasjon på den definerte kolonnen. Deretter kalles Barplot -metoden her, som tar kategoriske parametere X og Y for plottaksene. Vi har kategoriske verdier i forskjellige fargetoner ved å bruke Hue -alternativet som sex.

Importer matplotlib.Pyplot som Plt
Importer sjøborn som SNS
df = sns.LOAD_DATASET ('TIPS')
df = df.Groupby (['størrelse', 'sex']).AGG (Mean_Total_Bill = ("Total_Bill", 'Mean')))
df = df.reset_index ()
sns.barplot (x = "størrelse",
y = "mean_total_bill",
Hue = "Sex",
data = df)
plt.forestilling()

Følgende er den grupperte Barplot -visualiseringen.

Eksempel 2

Vi har endret kolonnefeltene bare for å vise deg visualiseringen av grupperte stangplott med de forskjellige tilfellene. Vi har brukt de samme datasett -tipsene for den grupperte bar -plottet og lagt den til den sjøborn Load_Dataset -funksjonen.

Deretter, innenfor Groupby -funksjonen, har vi passert de to kolonnes størrelse og tid denne gangen og samlet gjennomsnittet av kolonnen Total_bill. Etter dette har vi satt parametrene X, Y og Hue for Barplot. X-parameteren er for x-aksen, som er angitt med størrelseskolonnen, og y-aksen er satt med kolonnen "gjennomsnitt" som aggregeringen brukes. Hue -parameteren er satt med Time -egenskapen her fra TIPS -datasettet.

Importer matplotlib.Pyplot som Plt
Importer sjøborn som SNS
df = sns.LOAD_DATASET ('TIPS')
df = df.Groupby (['størrelse', 'tid']).AGG (Mean = ("Total_bill", 'Mean'))
df = df.reset_index ()
sns.barplot (x = "størrelse",
y = "mener",
Hue = "Time",
data = df)
plt.forestilling()

Den andre grupperte barplottet er også gjengitt med suksess med aggregeringsfunksjonen i følgende figur.

Eksempel 3

Denne er det tredje eksemplet illustrasjonen av den grupperte barplottet, men med en annen dataprøve. Vi har tatt et eksempel på datasettet fra Python, som er representert som “Anagrams.”Vi konstruerer den grupperte bardiagrammet for Anagrams Data -kolonnene.

For det første har vi lastet den inne i den variable Load_Dataset -funksjonen til Seaborn -pakken, som er lagret i variabelen DF. I løpet av Groupby -funksjonen sendes NUM1 og ATTNR -kolonnene for å bli gruppert, og aggregeringsfunksjonen har inngangskolonnen NUM2, som returnerer gjennomsnittet fra kolonne NUM2. Barplottet påberopes her, som feltnum1 og Attnr er satt til X- og Y -inngangene. Hue -egenskapen er satt med ATTNR -kolonnen.

Importer matplotlib.Pyplot som Plt
Importer sjøborn som SNS
df = sns.LOAD_DATASET ('Anagrams')
df = df.Groupby (['num1', 'Attnr']).AGG (Mean_Num2 = ("num2", 'Mean'))
df = df.reset_index ()
sns.Barplot (x = "num1",
y = "mean_num2",
Hue = "Attnr",
data = df)
plt.forestilling()

Eksempel 4

Vi bruker tilleggsparametrene for den grupperte barplottet. For dette har vi tatt prøvedatasettet Titanic for å generere den grupperte barplottet. Vi har satt konteksten for plottet ved å overføre papirinngangen til den. Den brukes til å justere størrelsen og etikettene for plottet. Deretter har vi definert en variabel titanic som det titaniske datasettet er lastet.

Barplottet kalles inne, og vi har satt x- og y -parametrene sammen med Hue -alternativet, som har WHO -kolonneverdiene. Palettalternativet brukes også til å stille inn fargene for plottet. Vi har en magma -palett her for den grupperte barplottet. CapSize, Metning, Errcolor, Errwidth og CI -alternativet er også definert for gruppert barplot.

Importer numpy som NP
Importer pandaer som PD
Importer matplotlib.Pyplot som Plt
Importer sjøborn som SNS
sns.set_context ('papir')
titanic = sns.LOAD_DATASET ('Titanic')
sns.barplot (x = 'klasse', y = 'overlevd', fargetone = 'hvem', data = titanic,
palette = 'magma',
Capsize = 0.05,
Metning = 8.5,
errcolor = 'grå', errwidth = 2,
ci = 'sd'
)
plt.forestilling()

Her er visualiseringen av den grupperte barplottet gruppert etter hele kolonnen som overlevde i skipet.

Konklusjon

Det er den generelle oversikten over artikkelen Seaborn Grouped Bar Plot. Vi har gått gjennom mange eksempler for å planlegge en gruppert bardiagram med sjøborn og pyton i denne opplæringen. Vi begynte med enkle grafer ved å bruke de forskjellige datarammene for de grupperte stolpottene og tilpasse dem ytterligere med tilleggsalternativene.