Pandas teller distinkt

Pandas teller distinkt
Denne artikkelen vil utforske forskjellige måter og metoder for å bestemme antall unike elementer i en Pandas DataFrame.

Eksempeldata

Før vi diskuterer hvordan du kan bestemme antall unike verdier i en DataFrame, trenger vi eksempler på data.

Et eksempelkode vises nedenfor:

# Importer pandaer
Importer pandaer som PD
df = pd.Dataramme(
'Lønn': [120000, 100000, 90000, 110000, 120000, 100000, 56000],
'Avdeling': ['Game Developer', 'Database Developer', 'Front-end Developer', 'Full-Stack Developer', 'Database Developer', 'Security Researcher', 'Cloud-Engineer'],
'Rangering': [4.3, 4.4, 4.3, 3.3, 4.3, 5.0, 4.4],
indeks = ['Alice', 'Michael', 'Joshua', 'Patricia', 'Peter', 'Jeff', 'Ruth'])
df

Koden over skal opprette et eksempel på dataaframe som vi kan bruke i denne opplæringen. Den resulterende tabellformen for dataene er som vist:

#1 Pandas unik metode

Den unike () -funksjonen er den første metoden vi kan bruke for å bestemme antall unike verdier i en dataframe.

Funksjonen tar en serie som inngangen og returnerer en liste over de unike verdiene.

For å beregne de unike elementene i lønnskolonnen, kan vi for eksempel gjøre:

Print (PD.unik (df ['lønn']))

Koden over skal returnere de unike varene i kolonnen 'lønn'.

[120000 100000 90000 110000 56000]

Hvis du vil ha antall unike verdier, kan du få lengden på listen som vist:

Print (F "Unike elementer: Len (PD.unik (df ['lønn'])) ")

Koden over skal returnere:

Unike varer: 5

#2 Pandas nunique funksjon

Nunique () -funksjonen lar deg få antall unike verdier langs en spesifisert akse.

Et eksempel er som vist:

print (f "[antall unike elementer/kolonne] \ n df.nunique (akse = 0) ")

Koden over skal returnere antall unike elementer i hver kolonne. Den resulterende utgangen er som vist:

[Antall unike elementer/kolonne]
Lønn 5
Avdeling 6
Rating 4
DTTYPE: INT64

Du kan også hente antall unike elementer i en bestemt kolonne som vist:

trykk (df.lønn.nunique ())

Ovennevnte skal returnere antall unike elementer i lønnskolonnen.

#3 Pandas Value_Counts ()

Pandas gir oss også verdien av verdien_count (). Denne funksjonen returnerer antall unike verdier i en spesifisert kolonne.

Et eksempel er som vist:

res = liste (df.lønn.Value_Counts ())
Print (F "Unike elementer: Len (res)")

Value_Counts () -funksjonen returnerer antallet hver verdi i kolonnen. Vi konverterer deretter resultatet til en liste og får lengden.

Dette skal få antall unike elementer i kolonnen:

Unike varer: 5

Konklusjon

Denne artikkelen diskuterte forskjellige metoder og teknikker vi kan bruke for å bestemme antall unike verdier i en Pandas dataaframe.