Forutsetning
Hvis du er en ny Python -bruker, må du først sette opp miljøet for å vise utdataene fra boksen. Du kan bruke hvilken som helst Python -tolk for å utføre koden. I denne opplæringen vil jeg bruke Spyder3 For å utføre koden. Hvis du ikke har installert Pandas og Seaborn Biblioteker før, så bør du kjøre følgende kommando fra terminalen for å installere disse bibliotekene:
$ pip3 installer Pandas SeabornBoksplott med pandaer
De Boxplot () Metode av Pandas brukes til å generere boksplottfigurer basert på datarammen. Denne metoden inneholder mange argumenter; Noen av disse argumentene brukes i eksemplene nedenfor. Denne delen av opplæringen vil inneholde to eksempler som vil vise deg hvordan du lager boksplott i Pandas. Du kan bruke tilfeldig genererte data i Numpy -biblioteket, eller dataene fra en CSV -fil, for å generere en boksplott i Pandas.
Eksempel 1: Boksplott basert på tilfeldige verdier
Boksplottene i følgende eksempel ble generert ved bruk av Numpy og Pandas. Numpy-biblioteket brukes i skriptet for å lage et datarammeobjekt ved å generere en todimensjonal rekke tilfeldige verdier som inneholder 5 rader og 5 kolonner. Innholdet i datarammen vil bli skrevet ut ved hjelp av hodet() metode. Neste, The Boxplot () Metoden brukes til å generere boksplott med blå farge, fontstørrelse 10 og en 30-graders roterende vinkel for å vise kolonneverdiene.
#!/usr/bin/env python3Produksjon
Følgende utgang vises etter å ha utført koden.
Eksempel 2: Boksplott basert på CSV -data
Boksplottene i følgende eksempel ble generert fra CSV -data. Opprett en CSV -fil som heter bank.CSV Bruke følgende data.
bank.CSV
SL, klientnavn, konto_type, kjønn, balanseI det følgende skriptet, Matplotlib Bibliotek ble brukt til å sette opp figurstørrelsen på boksen og for å vise utgangsinline. Alle poster over banken.CSV filen ble lastet inn ved hjelp av read_csv () Metode av Pandas. De første 8 postene av datarammen ble deretter skrevet ut ved hjelp av hode() metode. De Boxplot () Metoden ble brukt i følgende uttalelse for å tegne boksen Plot -figuren ved hjelp av rød farge basert på 'Kontotype' med kolonnen som heter 'Balansere.'
#!/usr/bin/env python3Produksjon
Følgende utgang vises etter å ha utført koden.
Boksplott med sjøborn
Et annet bibliotek med Python som ofte brukes til å tegne bokser er biblioteket Seaborn. En av de viktige funksjonene ved dette biblioteket er at det har mange innebygde prøvedatasett for å teste forskjellige oppgaver. De to neste eksemplene vil dekke bruken av to forskjellige prøvedatasett for å tegne boksplott ved hjelp av Seaborn bibliotek.
Eksempel 3: Boksplott basert på X -parameter
Følgende eksempel bruker et eksempeldatasett, kalt 'diamanter, ' fra Seaborn bibliotek for å generere boksen. Her er nettstilen definert ved hjelp av set_style () metode. De LOAD_DATASET () metoden brukes til å laste inn dataene til 'diamanter ' Datasett. De fem første postene er skrevet ut fra datasettet og Boxplot () Metoden brukes deretter til å tegne boksen 'dybde,'Med blå farge.
# Importer Seaborn Library for å generere boksenProduksjon
Følgende utgang vises etter å ha utført koden.
Eksempel 4: Boksplott basert på X- og Y -parametere
Følgende eksempel bruker eksemplet datasettet som heter 'flyreiser'For å tegne boksen. Her både X- og Y -parametrene til boksen () Metoden brukes til å tegne figuren. De andre uttalelsene ligner på forrige eksempel.
# Importer Seaborn Library for å generere boksenProduksjon
Følgende utgang vises etter å ha utført koden.
Konklusjon
Når du jobber med en stor mengde data, kan det være lurt å oppsummere dataene ved å bruke et diagram, for eksempel en boksplott. Denne opplæringen brukte flere eksempler for å vise deg hvordan du kan generere boksplott med to Python -biblioteker.