Filtrer rader i DataFrame

Filtrer rader i DataFrame
Hvis vi vil filtrere radene fra DataFrame, kan vi bruke filter () -funksjonen og spesifisere tilstanden inne i den. Basert på tilstanden kan vi filtrere radene. For dette må vi bruke filter () -funksjonen.

I denne R -opplæringen vil vi filtrere radene ved hjelp av filter () -funksjonen.

La oss lage en dataaframe med fire rader og fem kolonner.

#Lag et dataaframmarked som har 4 rader og 5 kolonner.
Markeds = data.Ramme (Market_id = C (1,2,3,4), Market_Name = C ('M1', 'M2', 'M3', 'M4'), Market_Place = C ('India', 'USA', 'India ',' Australia '), Market_Type = C (' dagligvare ',' Bar ',' Grocery ',' Restainent '), Market_SquareFeet = C (120.342.220.110)))
#Display Market
trykk (marked)

Resultat:

La oss filtrere radene i denne DataFrame.

Syntaks:

Filter (DataFrame_Object, tilstand)

Parametere:
Det tar to parametere:

  1. DataFrame_Object er DataFrame
  2. Tilstand brukes til å filtrere radene

Vi kan spesifisere forholdene ved hjelp av relasjonelle og logiske operatører.

Eksempel 1:
I dette eksemplet vil vi spesifisere tilstanden på Market_id -kolonnen.

Vi filtrerer radene ved å velge verdiene i denne kolonnen større enn 3.

#Lag et dataaframmarked som har 4 rader og 5 kolonner.
Markeds = data.Ramme (Market_id = C (1,2,3,4), Market_Name = C ('M1', 'M2', 'M3', 'M4'), Market_Place = C ('India', 'USA', 'India ',' Australia '), Market_Type = C (' dagligvare ',' Bar ',' Grocery ',' Restainent '), Market_SquareFeet = C (120.342.220.110)))
#return rader bare når verdiene i markeds_id -kolonnen er større enn 3
Print (Filter (Market, Market_id> 3))

Resultat:

Vi kan se at radene er filtrert og brukt den større enn (>) operatøren på Market_id -kolonnen.

Eksempel 2:
I dette eksemplet vil vi spesifisere tilstanden på markedet for markeds_id og markedsplasser.

Vi vil filtrere radene ved å velge verdiene i Market_id -kolonnen større enn 2 og markedsverdien “India”.

#Lag et dataaframmarked som har 4 rader og 5 kolonner.
Markeds = data.Ramme (Market_id = C (1,2,3,4), Market_Name = C ('M1', 'M2', 'M3', 'M4'), Market_Place = C ('India', 'USA', 'India ',' Australia '), Market_Type = C (' dagligvare ',' Bar ',' Grocery ',' Restainent '), Market_SquareFeet = C (120.342.220.110)))
#return rader bare når verdiene i markedet er større enn 3 og stedet er India
Print (Filter (Market, Market_id> 2 & Market_Place == 'India'))

Resultat:

Vi kan se at radene blir filtrert og brukt den større enn (>) operatøren på Market_id -kolonnen og == Operatøren på Market_Place -kolonnen kombinert med OR (&) -operatøren.

Eksempel 3:
I dette eksemplet vil vi spesifisere tilstanden på markedet for markeds_id og markedsplasser.

Vi vil filtrere radene ved å velge verdiene i Market_id -kolonnen større enn 2 eller Market_place “India”.

#Lag et dataaframmarked som har 4 rader og 5 kolonner.
Markeds = data.Ramme (Market_id = C (1,2,3,4), Market_Name = C ('M1', 'M2', 'M3', 'M4'), Market_Place = C ('India', 'USA', 'India ',' Australia '), Market_Type = C (' dagligvare ',' Bar ',' Grocery ',' Restainent '), Market_SquareFeet = C (120.342.220.110)))
#return rader bare når verdiene i markedet er større enn 3 eller sted er India
Print (Filter (Market, Market_id> 2 | Market_Place == 'India'))

Resultat:

Vi kan se at radene blir filtrert og brukt den større enn (>) operatøren på Market_id -kolonnen og == -operatøren på Market_place -kolonnen kombinert med OR (|) OROPERATOR.

Eksempel 4:
I dette eksemplet vil vi spesifisere tilstanden på markedet for markedsplassen.

Vi vil filtrere radene ved å velge verdiene i markedskolonnen slik at verdiene er i "India" eller "USA" ved å bruke % i % operatør.

#Lag et dataaframmarked som har 4 rader og 5 kolonner.
Markeds = data.Ramme (Market_id = C (1,2,3,4), Market_Name = C ('M1', 'M2', 'M3', 'M4'), Market_Place = C ('India', 'USA', 'India ',' Australia '), Market_Type = C (' dagligvare ',' Bar ',' Grocery ',' Restainent '), Market_SquareFeet = C (120.342.220.110)))
#return rader bare når verdiene i markedsplassen bare er India og USA
Print (Filter (Market, Market_Place % i % C ('India', 'USA'))))

Resultat:

Vi kan se at radene blir filtrert og brukt % i % operatør for å sjekke verdier som er "India" eller "USA".

Konklusjon

I denne artikkelen diskuterte vi de fire forskjellige eksemplene for å filtrere DataFrame ved å spesifisere de forskjellige forholdene ved bruk av relasjonelle operatører, logiske operatører og % i % operatør.