Syntaks
Str.dele()Ovennevnte syntaks brukes til å dele opp teksten i kolonner i en DataFrame. Det fungerer ved å dele opp kolonnen ved å avgrense i forskjellige kolonner. Vi implementerer syntaksen til Pandas -serien “Str.split () "-funksjon på" adresse "-kolonnen og pass den med" komma "for separasjon av kolonnen vi vil dele.
Parametere
Det er noen parametere vi vil bruke senere i eksemplene på Panda Split -kolonne av avgrensning:
Utvide: Den utvider strengverdien til en egen kolonne.
Forhold: Hvis "sant", returnerer datarammen; Hvis "falsk", returnerer serien/indeksen (strenger).
“N” begrenser antallet av en splittelse i utgangen.
Følgende er måtene Pandas splittet av avgrenser kan utføres:
Opprette DataFrame for eksemplene implementering av Pandas Split -kolonne av avgrensning
Etter å ha åpnet verktøyet “Spyder”, importer Pandas -biblioteket som “PD”. Begynn nå å lage "DF". "DF" er forkortelsen av "DataFrame". "DF" har den komplette adressen til noen områder i de forskjellige landene som: "5632 Main Street, Park, Canada"; “2525 Downtown, Salt Mine, Italia”; “7896 Sky View, Apartment, Mexico”; og “3988” Sunshine Road, Villa, Japan ”. Her ser vi at dataene er atskilt med kolonne. I de neste eksemplene vil vi lære å dele opp de "kommaene" områdene i kolonnene separat ved å bruke Pandas Split med avgrensningsfunksjon.
Utgangen viser DataFrame -opprettelsen av dataene som er gitt i koden.
Eksempel 01: Pandas delt kolonne med avgrensning i flere kolonner
I dette eksemplet vil vi dele opp tekstdata -kolonnene i flere kolonner av avgrensning av Pandas Split -funksjonen. Dataframe består av adressene til gatene som: “5623 Main Street, Shopping Mall, Tyrkia”; “4585 Downtown, School Area, Frankrike”; “0032 Sky View, College, Indonesia”; og “1125 Sunshine Next, University, Kina”. Alle disse adressene er av forskjellige områder vi vil skille de tekst "kommaene" i en egen kolonne. Vi kan si at vi kan ta det som separatorgjenkjenningsoperatøren å dele seg. Vi vil bruke Pandas Split -funksjonen på "Adressen". Deretter vil komma i dette tilfellet dele seg. Vi må også sørge for å passere parametrene som "utvide" for den "sanne" verdien.
Utgangen viser de separate kolonnene i adressen i "0" -kolonnen. I kolonnen “1” har vi områdene spesielt og i “2” -kolonnen har vi landsnavnene. Det opprettes en godt presentert og organisert DataFrame.
Eksempel 02: Pandas delt kolonne med avgrenser inne i en liste
Vi vil opprette en DataFrame for eksemplet implementering av Pandas Split -kolonne av avgrensning denne gangen “Inside a List”. Dataframe er som “7854 Main Street, Tire Shop”; “8009 Downtown, Sweet Shop, Tokyo”; “1003 Sky View, Ice Cream Shop, Sri Lanka”; og “7009 solskinn neste, videregående skole, Afrika”. Nå vil vi ikke passere parameteren True i dette eksemplet for å gjøre splittelsen inne i kolonnen.
Her i utgangen gjøres splittingen i kolonnene. Men dette viste seg ikke å vise opprettelsen av separate kolonner fordi splittelsen er inne i en liste. Hvis vi vil dele opp i en egen kolonne, vil det siste eksemplet vise.
Eksempel 03: Pandas delt kolonne av avgrensning (legg til en ny kolonne til “DF”)
I dette eksemplet vil vi legge til en annen kolonne i DataFrame ved siden av de separate kolonnene som kan gjøres enkelt med Pandas Split -kolonne og ved avgrensningsfunksjon. DataFrame er det samme som det siste eksemplet. Nå har vi valgt "tilstanden" som en tilleggskolonne. Vi har hele DataFrame og enda en kolonne i en egen kolonne. På denne måten, hvis vi ønsker å endre eller utføre noen analyse av den spesifikke datamengden, kan vi ha det separat uten å påvirke originaldataene.
Displayet har atskilt kolonner og legger til kolonnen "tilstand" i en egen kolonne av seg selv. Dette er fire etter fire kolonner som betyr 2 rader og 2 kolonner.
Eksempel 04: Pandas delt kolonne ved å avgrense spesifisere antall splitter
I eksempel 01 ovenfor har vi gjort delingen av tekstkolonnene ved å oppgi adressen ved forekomsten av avgrenseren "komma", noe som resulterte i tre kolonneres separasjon. Tilsvarende kan vi spesifisere antall splitter vi ønsker. I dette tilfellet vil vi lære å gjøre det. Dataframe består av adressene som: “4585 12th Street, dagligvarebutikk, New York ”,“ 7000 Portlands, Airport, Italia ”; “4555 13th Gate, jernbanestasjon, Spania ”; og “7777 Commercial Next, Candy Shop, Australia”. “N = 1” betegner at vi ønsker å dele ut dataframet en gang. Splittelsen vil skje ved første forekomst de andre venstre kolonnene vil bli sett sammen.
Utgangen viser delingen av DataFrame ved å bruke Pandas Split -kolonnen med avgrensningsfunksjon og ved å betegne N som “1”. Så splittingen gjøres bare en gang. Byene og delstatene er i den andre kolonnen, og den første forekomsten av adressene er i den første kolonnen.
Konklusjon
Pandas -funksjonen delt kolonne av avgrenseren er nyttig og effektiv. Så mange ganger etter behovet, ønsker vi å ha dataene i en bestemt kolonne eller konvensjon etter behovet. Så alt dette kan gjøres ved å bruke Pandas Split -kolonnen av avgrenseren. Vi har utført slike funksjoner som flere kolonnesplitting, splitting inne i kolonnen, splitting og lagt til en ny kolonne, og til slutt splittet ved å spesifisere antall splitter.