Omdøp kolonner i en Pandas dataaframe

Omdøp kolonner i en Pandas dataaframe

Hver dag håndterer folk enorme data som vi kalte big data. I den store data inneholder det noen ganger kolonnenavn eller noen ganger uten kolonnenavn. Kolonnenavnene er der, men de inneholder irrelevante navn eller noen uønskede tegn som mellomrom osv. Så vi må først forhåndsprosessere de enorme dataene før du starter analysen. Så først og fremst krever vi å gi nytt navn til kolonnenavnene.

Dataramme er radorienterte tabelldata som har rader og kolonner. Vi kan også si at DataFrame er en samling av forskjellige kolonner, og hver kolonne er av forskjellige typer som streng, numerisk osv.

$ pandaer.Dataramme

En pandas Dataramme kan opprettes ved hjelp av følgende konstruktør

$ pandaer.DataFrame (data = ingen, indeks = ingen, kolonner = ingen, dtype = ingen, kopi = falsk)

Metode 1: Bruke Rename () -funksjon:

Syntaks:

df.gi nytt navn (kolonner = d, inplace = falsk)

Vi opprettet en Dataramme (DF), som vi vil bruke for å vise forskjellige nytt navn () metoder.

I det ovennevnte Dataramme, Vi kan se at vi har fire kolonner ['Navn', 'Age', 'Favorite_Color', 'Grade'].

Pandaene har en innebygd funksjon som heter Rename () som kan endre kolonnenavnet Instant. For å bruke dette, må vi passere en nøkkel (det opprinnelige navnet på kolonnen) og verdien (det nye navnet på kolonnen) skjemaet til å gi nytt navn under kolonneattributtet. Vi kan også bruke et annet alternativ på plass til True som gjør endringer direkte til det eksisterende Dataramme Som standard er det falskt.

Fra det ovennevnte resultatet kan vi se at navnene på kolonnene endret seg.

Metode 2: Bruke listemetode

Pandas Dataramme har også gitt et attributtnavn -kolonne som hjelper oss med å få tilgang til alle kolonnenavn på en Dataramme. Så ved å bruke denne kolonnens attributt, kan vi også gi nytt navn til kolonnenavnet. Vi må passere en ny liste over kolonner og tilordne kolonnens attributt som vist nedenfor:

Den viktigste ulempen med å bruke listemetoden for å gi nytt navn.

Metode 3: Gi nytt navn til kolonnenavnet ved hjelp av read_csv -filen

Vi kan også gi nytt navn til kolonnene under selve read_csv selv. For det må vi lage en liste over kolonner og passere listen som en parameter til navnsattributtet mens vi leser CSV.

Vi bruker den ene attributthodet = 0, noe som betyr at vi overstyrer de foregående kolonnene i .CSV -fil med de nye kolonnene som vi passerer gjennom navnene.

I det ovennevnte .CSV -metode, vi gir nytt navn til kolonnene mens vi bruker listen, og vi passerer alle nye kolonner inne i den listen. Men noen ganger trenger vi bare å gi nytt navn til noen få kolonner. Deretter må vi bruke brukerkolens attributt og nevne indeksverdiene for disse kolonnene inne i det som vist nedenfor:

I det ovennevnte gir vi bare nytt navn.

Metode 4: Bruke kolonnene.str.erstatte()

Denne metoden brukes i utgangspunktet når vi ønsker å endre noen setninger til noen andre setninger og ikke ønsker å endre hele kolonnen som gir nytt navn til plass til understreking osv.

Fra det ovennevnte resultatet kan vi se at nå overstyrer mellomrom med understreken.

Ovennevnte metode har også anlegget til indeksen (DF.indeks.str.erstatte()).

Metode 5: Omdøpningskolonner ved bruk av set_axis ()

Denne metoden brukes til å gi nytt navn til indeksen sammen med kolonnen som vist nedenfor:

Konklusjon

I denne artikkelen viser vi forskjellige metoder for hvordan du skal gi nytt navn til kolonnene. Den beste metoden som jeg vurderer er Rename () -metoden der vi bare må passere kolonnene som vi ønsker å gi nytt navn i ordboken (nøkkel, verdi) format. Kolonnens attributt er den enkleste metoden, men den viktigste ulempen med det er at vi må passere alle kolonnene selv om vi bare vil gi nytt navn til noen få kolonner. Vi kan også gi nytt navn til kolonner mens vi leser selve CSV -filen, noe som også er et godt alternativ. Kolonnene.str.erstatte () er det beste alternativet bare når vi ønsker å erstatte noen tegn med andre tegn.