Hvordan plotte data i Pandas Python

Hvordan plotte data i Pandas Python
Datavisualisering spiller en viktig rolle i dataanalyse. Pandas er et sterkt dataanalysebibliotek i Python for datavitenskap. Det gir forskjellige alternativer for datavisualisering med .plot () -metode. Selv om du er en nybegynner, kan du enkelt plotte dataene dine ved hjelp av Pandas Library. Du må importere pandaene og matplotlib.Pyplot -pakke for datavisualisering.

I denne artikkelen vil vi utforske forskjellige dataplottmetoder ved å bruke Pandas Python. Vi har utført alle eksempler på Pycharm Source Code Editor ved å bruke Matplotlib.Pyplot -pakke.

Plotting i Pandas Python

I pandas, den .Plot () har flere parametere som du kan bruke basert på dine behov. For det meste, ved å bruke den 'snille' parameteren, kan du definere hvilken type plott du vil opprette.

Syntaksen for å plotte data ved hjelp av Pandas Python

Følgende syntaks brukes til å plotte en dataaframe i Pandas Python:

# Importer pandaer og matplotlib.Pyplot -pakker
Importer pandaer som PD
Importer matplotlib.Pyplot som Plt
# Forbered data for å opprette DataFrame
data_frame =
'Column1': ['Field1', 'Field2', 'Field3', 'Field4',…],
'Column2': ['Field1', 'Field2', 'Field3', 'Field4', ...]

var_df = pd.DataFrame (Data_Frame, Columns = ['Column1', 'Column2])
Print (variabel)
# Plotting Bar Graph
var_df.plott.Bar (x = 'kolonne1', y = 'kolonne2')
plt.forestilling()

Du kan også definere plottetypen ved å bruke den snille parameteren som følger:

var_df.plot (x = 'kolonne1', y = 'kolonne2', kind = 'bar')

Pandas dataframes objekter har følgende plotmetoder for plotting:

  • Spredning plotting: plott.spre()
  • Bar ploting: plott.bar (), plot.Barh () der H representerer horisontale stenger plott.
  • Linjeplotting: plott.linje()
  • PIE -plotting: plott.pai()

Hvis en bruker bare bruker plott () -metoden uten å bruke noen parameter da, oppretter den standardlinjegrafen.

Vi vil nå utdype noen større typer plotting i detalj ved hjelp av noen eksempler.

Spredt plotting i pandaer

I denne typen plotting har vi representert forholdet mellom to variabler. La oss ta et eksempel.

Eksempel

For eksempel har vi data om korrelasjon mellom to variabler BNP_Growth og Oil_Price. For å plotte forholdet mellom to variabler, har vi utført følgende kode på vår kildekodeditor:

Importer matplotlib.Pyplot som Plt
Importer pandaer som PD
BDP_CAL = PD.Dataramme(
'BDP_Growth': [6.1, 5.8, 5.7, 5.7, 5.8, 5.6, 5.5, 5.3, 5.2, 5.2],
'Oil_price': [1500, 1520, 1525, 1523, 1515, 1540, 1545, 1560, 1555, 1565]
)
df = pd.DataFrame (GDP_CAL, Columns = ['Oil_Price', 'GDP_Growth'])
trykk (DF)
df.plot (x = 'oil_price', y = 'gpp_growth', kind = 'spred', color = 'rød')
plt.forestilling()

Linjekart som plottet i pandaer

Linjekartplottet er en grunnleggende type plotting der gitt informasjon vises i en datapunkter -serie som er videre koblet sammen med segmenter av rette linjer. Ved hjelp av linjekartene kan du også vise trender med informasjon overtid.

Eksempel

I det under-nevnte eksemplet har vi tatt dataene om det siste års inflasjonsrate. Først må du utarbeide dataene og deretter opprette DataFrame. Følgende kildekode plotter linjegrafen for tilgjengelige data:

Importer pandaer som PD
Importer matplotlib.Pyplot som Plt
Infl_cal = 'år': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Infl_rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame (Infl_cal, Columns = ['Year', 'Infl_rate'])
Dataramme.plot (x = 'år', y = 'infl_rate', kind = 'line')
plt.forestilling()

I eksemplet ovenfor må du angi typen = 'linje' for linjekart.

Metode 2# Bruke plott.Linje () Metode

Eksemplet ovenfor kan du også implementere ved hjelp av følgende metode:

Importer pandaer som PD
Importer matplotlib.Pyplot som Plt
inf_cal = 'år': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Inflasjon_rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame (Inf_cal, Columns = ['Inflation_rate'], Index = [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011])
Dataramme.plott.linje()
plt.tittel ('Inflasjonsrate sammendrag av siste 11 år')
plt.ylabel ('inflasjon_rate')
plt.xlabel ('år')
plt.forestilling()

Følgende linjegraf vises etter å ha kjørt ovennevnte kode:

Bardiagram plotting i pandaer

Stangdiagrammet som brukes til å representere de kategoriske dataene. I denne typen tomter er de rektangulære stengene med forskjellige høyder plottet ut basert på den gitte informasjonen. Stangdiagrammet kan plottes i to forskjellige horisontale eller vertikale retninger.

Eksempel

Vi har tatt leseferdighetsraten til flere land i følgende eksempel. DataFrames er opprettet der 'country_names' og 'literacy_rate' er de to kolonnene i en dataaframe. Ved hjelp av pandaer kan du plotte informasjonen i stanggrafformen som følger:

Importer pandaer som PD
Importer matplotlib.Pyplot som Plt
lit_cal =
'Country_names': ['Pakistan', 'USA', 'Kina', 'India', 'UK', 'Østerrike', 'Egypt', 'Ukraina', 'Saudia', 'Australia',
'Malaysia'],
'litr_rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame (lit_cal, kolonner = ['country_names', 'litr_rate'])
print (data_frame)
Dataramme.plott.bar (x = 'country_names', y = 'litr_rate')
plt.forestilling()

Du kan også implementere eksemplet ovenfor ved hjelp av følgende metode. Sett typen = "Bar" for Bar Chart Plotting i denne linjen:

Dataramme.plot (x = 'country_names', y = 'litr_rate', kind = 'bar')
plt.forestilling()

Horisontalt bardiagram plotting

Du kan også plotte dataene på horisontale søyler ved å utføre følgende kode:

Importer matplotlib.Pyplot som Plt
Importer pandaer som PD
data_chart = 'litr_rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
df = pd.DataFrame (Data_Chart, Columns = ['LitR_Rate'], Index = ['Pakistan', 'USA', 'China', 'India', 'UK', 'Østerrike', 'Egypt', 'Ukraina', 'Saudia' , 'Australia',
'Malaysia'])
df.plott.Barh ()
plt.Tittel ('Literacy rate in Uland Countries')
plt.ylabel ('country_names')
plt.xlabel ('litr_rate')
plt.forestilling()

I DF.plott.Barh (), BARH brukes til horisontal plotting. Etter å ha kjørt ovennevnte kode, vises følgende søylediagram på vinduet:

Kakediagram plotting i pandaer

Et kakediagram representerer dataene i en sirkulær grafisk form der data vises i skiver basert på den gitte mengden.

Eksempel

I det følgende eksempel har vi vist informasjonen om 'Earth_Material' i forskjellige skiver på kakediagrammet. Lag først DataFrame, og ved å bruke pandaene, vis alle detaljer på grafen.

Importer pandaer som PD
Importer matplotlib.Pyplot som Plt
material_per = 'Earth_Part': [71,18,7,4]
DataFrame = PD.DataFrame (Material_per, Columns = ['Earth_Part'], Index = ['Water', 'Mineral', 'Sand', 'Metals'])
Dataramme.plott.PIE (y = 'Earth_Part', FigSize = (7, 7), Autopct = '%1.1f %% ', startangle = 90)
plt.forestilling()

Ovennevnte kildekode plotter kakegrafen over tilgjengelige data:

Konklusjon

I denne artikkelen har du sett hvordan du planlegger dataframmer i Pandas Python. Ulike typer plotting utføres i artikkelen ovenfor. Å plotte flere typer som boks, hexbin, hist, kde, tetthet, område, etc., Du kan bruke den samme kildekoden bare ved å endre plottet.