Pandas trim hvitrom fra kolonnen

Pandas trim hvitrom fra kolonnen
Denne korte artikkelen vil diskutere hvordan du kan trimme ledende eller etterfølgende Whitespace -tegn fra en Pandas DataFrame.

Eksempel på DataFrame

For illustrasjonsformål vil vi bruke prøven DataFrame vist nedenfor:

Importer pandaer som PD
df = pd.Dataramme(
"Product_name": ['Product_1', 'Product_2 \ t', 'Product_3 \ n', '\ nproduct_4 \ t', 'Product_5'],
"Pris": [10.00, 20.50, 100.30, 500.25, 101.30]
)

Dataframe ovenfor inneholder hvitromstegn som Newline -tegn, mellomrom og faner.

Fjern ledende hvitromstegn

Vi kan bruke Lstrip -funksjonen for å fjerne ledende Whitespace -tegn fra en DataFrame -kolonne for å fjerne ledende Whitespace -tegn fra en DataFrame -kolonne som vist:

df.Produktnavn.str.Lstrip ()

Lstrip -funksjonen skal fjerne de ledende Whitespace -tegnene fra produktnavn -kolonnen.

Koden over skal returnere:

Legg merke til at det ledende rommet og nye linjens hvitespace -tegn blir fjernet.

Fjern etterfølgende Whitespace -tegn.

Vi kan bruke rstrip () -funksjonen for å fjerne etterfølgende Whitespace -tegn fra en kolonne.

Et eksempel er som vist:

df.Produktnavn.str.rstrip ()

Her bør koden over fjerne de etterfølgende hvitrommetegnene. Et eksempel på returverdien er som vist:

Fjern både ledende og etterfølgende Whitespace -tegn

Ved hjelp av Strip () -funksjonen kan du også fjerne både ledende og etterfølgende Whitespace -tegn fra en kolonne ved hjelp av Strip () -funksjonen.

Et eksempelbruk er som vist:

df.Produktnavn.str.stripe ()

I dette tilfellet skal funksjonen returnere:

Legg merke til hvordan de ledende og etterfølgende hvitromstegnene fjernes fra kolonnen.

Bruker erstatning

Du kan også bruke erstatningsfunksjonen () for å fjerne Whitespace -tegn fra en kolonne.

For å erstatte alle fane -tegn fra en kolonne, kan vi for eksempel gjøre:

df.Produktnavn.str.erstatte ('\ t', ")

I dette tilfellet vil funksjonen ta fanekarakterene og erstatte dem med den spesifiserte verdien.

Den resulterende utgangen er som vist:

For å fjerne plass og Newline -tegn:

df.Produktnavn.str.erstatt ('\ n', ") // Fjern Newline
df.Produktnavn.str.erstatte (",") // Fjern mellomrom

Avslutte

Denne artikkelen viser deg forskjellige måter å fjerne ledende og etterfølgende Whitespace -tegn fra en Pandas DataFrame.