Pandas beskriver

Pandas beskriver

Pandaene beskriver () -funksjonen lar deg få det statistiske sammendraget av dataene i Pandas DataFrame. Funksjonen returnerer statistisk informasjon om dataene, inkludert statistisk middel, standardavvik, min og maksimale verdier osv.

Funksjonssyntaks

Funksjonssyntaks er som vist nedenfor:

1
Dataramme.Beskriv (prosentiler = ingen, inkluderer = ingen, ekskluder = ingen, DateTime_IS_Numeric = FALSE)

Funksjonsparametere

Funksjonen godtar følgende parametere:

  1. Prosentiler - lar deg få en spesifikk persentil av dataene i en dataaframe. Prosentilverdien varierer fra 0 til 1.
  2. inkludere - Angir en liste over datatyper som skal ha i resultatet satt med aksepterte verdier, inkludert ingen og alle.
  3. utelukke - Liste over datatyper som skal utelukkes i resultatsettet.
  4. DATETIME_IS_NUMERIC - lar funksjonen behandle datetime -objekter som numeriske.

Funksjonsretur

Funksjonen returnerer en dataaframe med hver rad som holder typen av den statistiske egenskapen til kolonnene.

Eksempel

Tenk på eksemplet nedenfor som illustrerer den primære bruken av beskrivelsesfunksjonen () i pandaer

1
2
3
4
5
6
Importer pandaer som PD
df = pd.Dataramme(
"First_name": ['Fracis', 'Bernice', 'Debra'],
"Last_name": ['Barton', 'Wyche', 'Wade'],
indeks = [1,2,3])
df.beskrive()

I eksemplet over begynner vi med å importere Pandas -biblioteket. Vi oppretter deretter en enkel DataFrame og kaller beskrivingsmetoden ().

Ovennevnte kode skal returnere en grunnleggende informasjonssammendrag om DataFrame. Et eksempelutgang er som vist

Legg merke til hvordan funksjonen returnerer grunnleggende statistisk informasjon som antall verdier, hvor mange som er unike, toppverdien osv.

Eksempel nr. 2

Tenk på eksemplet nedenfor som returnerer den statistiske sammendraget av en Pandas -serie:

1
2
S = PD.Serie ([10,20,30])
s.beskrive()

I dette eksemplet skal funksjonen returnere en utgang som vist:

I dette tilfellet returnerer funksjonen grunnleggende sammendragsinformasjon som standard gjennomsnitt, 25., 50. og 75. persentiler, og maksimal verdi i serien.

Eksempel nr. 3

For å beskrive en spesifikk kolonne i en Pandas DataFrame, bruk syntaks som vist nedenfor:

1
Dataramme.kolonne_navn.beskrive()

Eksempel 4

For å ekskludere en spesifikk datatype fra resultatet, bruk syntaks som er vist:

1
df.Beskriv (ekskluder = [NP.data-type])

Eksempel 5

For å beskrive alle kolonnene i en dataaframe, uavhengig av datatypen, kjører du koden:

1
df.beskriv (inkluderer = 'alle')

Konklusjon

I denne artikkelen diskuterte vi hvordan du bruker beskrivelsesfunksjonen i pandaer.