Denne artikkelen vil illustrere hvordan du får alle radene i en Pandas dataaframe som inneholder en gitt substring.
Eksempel på DataFrame
I dette eksemplet vil vi bruke en prøve DataFrame gitt i lenken nedenfor:
1 | Filmer datasett.CSV |
Når den er lastet ned, last inn DataFrame som vist;
1 | df = pd.read_csv ('filmer.CSV ') |
Sjekk om kolonnen inneholder
La oss identifisere radene som inneholder en spesifikk substring. For dette vil vi bruke funksjonen Contacts () i pandaer.
For å sjekke om noen tittel inneholder strengen 'Captain' i det medfølgende DataFrame, kan vi gjøre følgende:
1 | print (df ['tittel'].str.inneholder ('kaptein')) |
Ovennevnte kode skal sjekke om alle radene inneholder den spesifiserte substring og returnerer de tilsvarende boolske verdiene.
For matchende rader, bør funksjonen returnere sant og usant hvis annet.
Hente rader som samsvarer.
Selv om eksemplet ovenfor fungerer, returnerer det ikke raden og dens verdier. Vi kan utvide det ved å bruke verdiene deres som indekser for DataFrame.
Et eksempel er som vist:
1 | print (df [df ['tittel'].str.inneholder ('kaptein')]) |
Funksjonen skal returnere de matchende radene og deres tilsvarende verdier i dette tilfellet.
Sjekk flere forhold.
Vi kan filtrere resultatene videre ved å sjekke om radene inneholder 'Captain' og 'America.'
Ta eksempelkoden vist nedenfor:
1 2 | new_df = df [df ['tittel'].str.Inneholder ('Captain') & DF ['Tittel'].str.inneholder ('Amerika')] new_df |
Vi bruker & operatøren til å kombinere to boolske forhold i dette eksemplet.
Den resulterende DataFrame er som vist:
Du kan også sjekke om en rad inneholder 'Captain' eller 'America'.
1 2 | new_df = df [df ['tittel'].str.inneholder ('kaptein') | df ['tittel'].str.inneholder ('Amerika')] new_df |
Dette skal returnere en tittel som inneholder enten strengen 'Captain' eller 'America'. De resulterende dataene er som vist:
Konklusjon
I denne artikkelen diskuterte vi å sjekke om en rad inneholder en substring i en pandas dataaframe. Vi dekket også hvordan du får radene som samsvarer med en spesifikk substring.