Pandaer fjerner rader med tilstand

Pandaer fjerner rader med tilstand
Denne artikkelen vil diskutere hvordan du bruker Pandas drop () -funksjonen for å slette rader som samsvarer med en spesifikk tilstand.

Eksempel på DataFrame

I denne opplæringen vil vi bruke et eksempel på DataFrame med dataene nedenfor som er lagret i filmer.CSV -fil:

,Tittel, Release_year, IMDB_RATING
0, Iron Man, 2008,7.9
1, The Incredible Hulk, 2008,6.6
2, Iron Man 2,2010,6.9
3, Thor, 2011,7.0
4, Captain America: The First Avenger, 2011,6.9
5, The Avengers, 2012,8.0
6, Iron Man 3,2013,7.1
7, Thor: The Dark World, 2013,6.8
8, Captain America: The Winter Soldier, 2014,7.8
9, Guardians of the Galaxy, 2014,8.0
10, Avengers: Age of Ultron, 2015,7.3
11, Ant-Man, 2015,7.3
12, Captain America: Civil War, 2016,7.8
13, Doctor Strange, 2016,7.5
14, Guardians of the Galaxy: Volum 2,2017,7.6
15, Spiderman: Homecoming, 2017,7.4
16, Thor: Ragnarok, 2017,7.9
17, Black Panther, 2018,7.3
18, Avengers: Infinity War, 2018,8.4
19, Ant-Man and the Wasp, 2018,7.0
20, Captain Marvel, 2019,6.8
21, Avengers: Endgame, 2019,8.4
22, Spider-Man: Far From Home, 2019,7.4
23, Black Widow, 2021,6.7
24, Shang-Chi, 2021,7.4
25, Spiderman: No Way Home, 2021,8.4
26, Doctor Strange: In the Multiverse of Madness, 2022,7.5
Når den er lastet ned, last inn CSV -filen som vist nedenfor:
Importer pandaer som PD
df = pd.read_csv ('filmer.csv ', index_col = [0])
df

Slett rader basert på kolonnetilstand

For å slette rader basert på en enkelt tilstand i en spesifisert kolonne, kan vi bruke Drop () -funksjonen. Hvis vi for eksempel vil slette noen rader der Release_year er under 2012, kan vi gjøre:

df = df.Drop (DF [DF ['Release_year'] < 2012].index, inplace=False)
df

I dette eksemplet kommanderer vi slippfunksjonen for å slette alle radene der verdien i kolonnen 'Release_year' er mindre enn 2012. Parameteren 'inplace' forhindrer at funksjonen endrer den originale DataFrame. Dette skulle komme tilbake:

Hvis du la merke til det, har radene i output.

Slett rader basert på flere forhold.

Vi kan også koble mer enn én tilstand når vi fjerner rader. For eksempel å fjerne radene der rangeringen er større enn 7.3 Og utgivelsesåret er større enn 2018, vi kan gjøre:

df.slipp (df [(df ['Release_year']> 2018) & (df ['IMDB_RATING']> = 7.3)].indeks, inplace = falsk)
df

Koden over lar oss bruke Ampersand -operatøren til å kombinere flere forhold.

Lukking

Artikkelen demonstrerer hvordan du bruker Pandas drop () -funksjonen for å fjerne rader som samsvarer med enkelt eller flere forhold i en Pandas DataFrame.