Pandas bruker funksjon på kolonnen

Pandas bruker funksjon på kolonnen
I denne artikkelen vil vi utforske de forskjellige måtene du kan bruke en funksjon over en gitt kolonne.

Eksempel på DataFrame.

Vi har gitt en prøve CSV -fil som inneholder en prøve DataFrame. Du kan bruke denne DataFrame til å følge med eller bruke datasettet ditt.

Eksempel på CSV -fil.

Når du har lastet ned, kan du laste inn DataFrame som vist:

Importer pandaer som PD
df = pd.read_csv ('filmer.csv ', index_col = [0])
df

Ovennevnte skal returnere en dataaframe som vist:

Bruk funksjon på en kolonne ved hjelp av prikknotasjonen

Vi kan bruke en anonym funksjon på en DataFrame -kolonne ved hjelp av Pandas Apply -funksjonen.

I eksemplet nedenfor deler vi IMDB_RATING -kolonnen med 10.

res = df.IMDB_RATING.Bruk (Lambda X: X / 10)
res

Dette skal returnere resultatet av å dele hver rad med 10.

Bruk funksjon på en kolonne ved hjelp av [] operatøren

Hvis du ikke ønsker at DOT -notasjonen skal bruke en funksjon på en bestemt kolonne, kan du bruke den firkantede brakettnotasjonen som vist:

res = df ['imdb_rating'].Bruk (Lambda X: X / 10)
res

Koden over skal returnere resultatet av å dele hver rad i kolonnen 'IMDB_RATING' med 10.

Bruk brukerdefinert funksjon.

Vi kan også bruke Apply () -funksjon for å bruke en brukerdefinert funksjon på en kolonne. Et eksempel er som vist:

DEF prosent (x):
Retur (x / 10) * 100
Prosent_df = df.IMDB_RATING.Bruk (prosent)
Prosent_df

I dette eksemplet har vi en funksjon som beregner hver rads prosentverdi.

Vi bruker prikknotasjonen på målkolonnen for å bruke den tilpassede funksjonen på kolonnen.

Merk: Vi kaller ikke funksjonen, men passerer den som en parameter.

Bruke en reduksjonsfunksjon på en kolonne

Vi kan også bruke en reduksjonsfunksjon på en kolonne på samme måte. Et eksempel er som vist:

Importer numpy som NP
AVG = DF.Bruk (np.gjennomsnitt)
avg

Eksemplet ovenfor skal bruke den numpy gjennomsnittsfunksjonen på DataFrame.

Lukking

I denne artikkelen diskuterte vi forskjellige måter du kan bruke en funksjon på en kolonne i en Pandas Dataframe. Utforsk dokumentene for å lære mer.