Pandas delte kolonner med avgrensning

Pandas delte kolonner med avgrensning
“Pandas” er en Python -pakke. Den er fleksibel og har et uttrykksfullt datastrukturert design å jobbe med data på forskjellige måter. Panda dataframes er også bra for å manipulere dataene. Det meste av tiden jobber vi med data som har en kolonne som inneholder en avgrenset strengverdi, for eksempel “x, y, z”, og vi vil at de skal være i separate kolonner. Dette er mulig ved å bruke en funksjon av pandaer som vi vil diskutere i denne artikkelen. Vi lærer å dele en tekstkolonne i separate kolonner individuelt. For den pandasfunksjonen til den delte kolonnen av avgrenseren skal brukes. Syntaksen er liksom Python String “Str ()” -funksjonen. Men pandaene deles etter kolonne, deler dataene til hele DataFrame. For implementering av koden bruker vi “Spyder” -verktøyet. Ettersom det er Python språkvennlig programvare.

Syntaks

Str.dele()

Ovennevnte syntaks brukes til å dele opp teksten i kolonner i en DataFrame. Det fungerer ved å dele opp kolonnen ved å avgrense i forskjellige kolonner. Vi implementerer syntaksen til Pandas -serien “Str.split () "-funksjon på" adresse "-kolonnen og pass den med" komma "for separasjon av kolonnen vi vil dele.

Parametere

Det er noen parametere vi vil bruke senere i eksemplene på Panda Split -kolonne av avgrensning:

Utvide: Den utvider strengverdien til en egen kolonne.

Forhold: Hvis "sant", returnerer datarammen; Hvis "falsk", returnerer serien/indeksen (strenger).

“N” begrenser antallet av en splittelse i utgangen.

Følgende er måtene Pandas splittet av avgrenser kan utføres:

  • Pandas delt kolonne av avgrensning (legg til en ny kolonne i “DF”).
  • Pandas delt kolonne av avgrensning (inne i en liste).
  • Pandas Split -kolonne ved å avgrense angi antall splitter.

Opprette DataFrame for eksemplene implementering av Pandas Split -kolonne av avgrensning

Etter å ha åpnet verktøyet “Spyder”, importer Pandas -biblioteket som “PD”. Begynn nå å lage "DF". "DF" er forkortelsen av "DataFrame". "DF" har den komplette adressen til noen områder i de forskjellige landene som: "5632 Main Street, Park, Canada"; “2525 Downtown, Salt Mine, Italia”; “7896 Sky View, Apartment, Mexico”; og “3988” Sunshine Road, Villa, Japan ”. Her ser vi at dataene er atskilt med kolonne. I de neste eksemplene vil vi lære å dele opp de "kommaene" områdene i kolonnene separat ved å bruke Pandas Split med avgrensningsfunksjon.

Utgangen viser DataFrame -opprettelsen av dataene som er gitt i koden.

Eksempel 01: Pandas delt kolonne med avgrensning i flere kolonner

I dette eksemplet vil vi dele opp tekstdata -kolonnene i flere kolonner av avgrensning av Pandas Split -funksjonen. Dataframe består av adressene til gatene som: “5623 Main Street, Shopping Mall, Tyrkia”; “4585 Downtown, School Area, Frankrike”; “0032 Sky View, College, Indonesia”; og “1125 Sunshine Next, University, Kina”. Alle disse adressene er av forskjellige områder vi vil skille de tekst "kommaene" i en egen kolonne. Vi kan si at vi kan ta det som separatorgjenkjenningsoperatøren å dele seg. Vi vil bruke Pandas Split -funksjonen på "Adressen". Deretter vil komma i dette tilfellet dele seg. Vi må også sørge for å passere parametrene som "utvide" for den "sanne" verdien.

Utgangen viser de separate kolonnene i adressen i "0" -kolonnen. I kolonnen “1” har vi områdene spesielt og i “2” -kolonnen har vi landsnavnene. Det opprettes en godt presentert og organisert DataFrame.

Eksempel 02: Pandas delt kolonne med avgrenser inne i en liste

Vi vil opprette en DataFrame for eksemplet implementering av Pandas Split -kolonne av avgrensning denne gangen “Inside a List”. Dataframe er som “7854 Main Street, Tire Shop”; “8009 Downtown, Sweet Shop, Tokyo”; “1003 Sky View, Ice Cream Shop, Sri Lanka”; og “7009 solskinn neste, videregående skole, Afrika”. Nå vil vi ikke passere parameteren True i dette eksemplet for å gjøre splittelsen inne i kolonnen.

Her i utgangen gjøres splittingen i kolonnene. Men dette viste seg ikke å vise opprettelsen av separate kolonner fordi splittelsen er inne i en liste. Hvis vi vil dele opp i en egen kolonne, vil det siste eksemplet vise.

Eksempel 03: Pandas delt kolonne av avgrensning (legg til en ny kolonne til “DF”)

I dette eksemplet vil vi legge til en annen kolonne i DataFrame ved siden av de separate kolonnene som kan gjøres enkelt med Pandas Split -kolonne og ved avgrensningsfunksjon. DataFrame er det samme som det siste eksemplet. Nå har vi valgt "tilstanden" som en tilleggskolonne. Vi har hele DataFrame og enda en kolonne i en egen kolonne. På denne måten, hvis vi ønsker å endre eller utføre noen analyse av den spesifikke datamengden, kan vi ha det separat uten å påvirke originaldataene.

Displayet har atskilt kolonner og legger til kolonnen "tilstand" i en egen kolonne av seg selv. Dette er fire etter fire kolonner som betyr 2 rader og 2 kolonner.

Eksempel 04: Pandas delt kolonne ved å avgrense spesifisere antall splitter

I eksempel 01 ovenfor har vi gjort delingen av tekstkolonnene ved å oppgi adressen ved forekomsten av avgrenseren "komma", noe som resulterte i tre kolonneres separasjon. Tilsvarende kan vi spesifisere antall splitter vi ønsker. I dette tilfellet vil vi lære å gjøre det. Dataframe består av adressene som: “4585 12th Street, dagligvarebutikk, New York ”,“ 7000 Portlands, Airport, Italia ”; “4555 13th Gate, jernbanestasjon, Spania ”; og “7777 Commercial Next, Candy Shop, Australia”. “N = 1” betegner at vi ønsker å dele ut dataframet en gang. Splittelsen vil skje ved første forekomst de andre venstre kolonnene vil bli sett sammen.

Utgangen viser delingen av DataFrame ved å bruke Pandas Split -kolonnen med avgrensningsfunksjon og ved å betegne N som “1”. Så splittingen gjøres bare en gang. Byene og delstatene er i den andre kolonnen, og den første forekomsten av adressene er i den første kolonnen.

Konklusjon

Pandas -funksjonen delt kolonne av avgrenseren er nyttig og effektiv. Så mange ganger etter behovet, ønsker vi å ha dataene i en bestemt kolonne eller konvensjon etter behovet. Så alt dette kan gjøres ved å bruke Pandas Split -kolonnen av avgrenseren. Vi har utført slike funksjoner som flere kolonnesplitting, splitting inne i kolonnen, splitting og lagt til en ny kolonne, og til slutt splittet ved å spesifisere antall splitter.