I denne R -opplæringen vil vi filtrere radene ved hjelp av filter () -funksjonen.
La oss lage en dataaframe med fire rader og fem kolonner.
#Lag et dataaframmarked som har 4 rader og 5 kolonner.
Markeds = data.Ramme (Market_id = C (1,2,3,4), Market_Name = C ('M1', 'M2', 'M3', 'M4'), Market_Place = C ('India', 'USA', 'India ',' Australia '), Market_Type = C (' dagligvare ',' Bar ',' Grocery ',' Restainent '), Market_SquareFeet = C (120.342.220.110)))
#Display Market
trykk (marked)
Resultat:
La oss filtrere radene i denne DataFrame.
Syntaks:
Filter (DataFrame_Object, tilstand)
Parametere:
Det tar to parametere:
Vi kan spesifisere forholdene ved hjelp av relasjonelle og logiske operatører.
Eksempel 1:
I dette eksemplet vil vi spesifisere tilstanden på Market_id -kolonnen.
Vi filtrerer radene ved å velge verdiene i denne kolonnen større enn 3.
#Lag et dataaframmarked som har 4 rader og 5 kolonner.
Markeds = data.Ramme (Market_id = C (1,2,3,4), Market_Name = C ('M1', 'M2', 'M3', 'M4'), Market_Place = C ('India', 'USA', 'India ',' Australia '), Market_Type = C (' dagligvare ',' Bar ',' Grocery ',' Restainent '), Market_SquareFeet = C (120.342.220.110)))
#return rader bare når verdiene i markeds_id -kolonnen er større enn 3
Print (Filter (Market, Market_id> 3))
Resultat:
Vi kan se at radene er filtrert og brukt den større enn (>) operatøren på Market_id -kolonnen.
Eksempel 2:
I dette eksemplet vil vi spesifisere tilstanden på markedet for markeds_id og markedsplasser.
Vi vil filtrere radene ved å velge verdiene i Market_id -kolonnen større enn 2 og markedsverdien “India”.
#Lag et dataaframmarked som har 4 rader og 5 kolonner.
Markeds = data.Ramme (Market_id = C (1,2,3,4), Market_Name = C ('M1', 'M2', 'M3', 'M4'), Market_Place = C ('India', 'USA', 'India ',' Australia '), Market_Type = C (' dagligvare ',' Bar ',' Grocery ',' Restainent '), Market_SquareFeet = C (120.342.220.110)))
#return rader bare når verdiene i markedet er større enn 3 og stedet er India
Print (Filter (Market, Market_id> 2 & Market_Place == 'India'))
Resultat:
Vi kan se at radene blir filtrert og brukt den større enn (>) operatøren på Market_id -kolonnen og == Operatøren på Market_Place -kolonnen kombinert med OR (&) -operatøren.
Eksempel 3:
I dette eksemplet vil vi spesifisere tilstanden på markedet for markeds_id og markedsplasser.
Vi vil filtrere radene ved å velge verdiene i Market_id -kolonnen større enn 2 eller Market_place “India”.
#Lag et dataaframmarked som har 4 rader og 5 kolonner.
Markeds = data.Ramme (Market_id = C (1,2,3,4), Market_Name = C ('M1', 'M2', 'M3', 'M4'), Market_Place = C ('India', 'USA', 'India ',' Australia '), Market_Type = C (' dagligvare ',' Bar ',' Grocery ',' Restainent '), Market_SquareFeet = C (120.342.220.110)))
#return rader bare når verdiene i markedet er større enn 3 eller sted er India
Print (Filter (Market, Market_id> 2 | Market_Place == 'India'))
Resultat:
Vi kan se at radene blir filtrert og brukt den større enn (>) operatøren på Market_id -kolonnen og == -operatøren på Market_place -kolonnen kombinert med OR (|) OROPERATOR.
Eksempel 4:
I dette eksemplet vil vi spesifisere tilstanden på markedet for markedsplassen.
Vi vil filtrere radene ved å velge verdiene i markedskolonnen slik at verdiene er i "India" eller "USA" ved å bruke % i % operatør.
#Lag et dataaframmarked som har 4 rader og 5 kolonner.
Markeds = data.Ramme (Market_id = C (1,2,3,4), Market_Name = C ('M1', 'M2', 'M3', 'M4'), Market_Place = C ('India', 'USA', 'India ',' Australia '), Market_Type = C (' dagligvare ',' Bar ',' Grocery ',' Restainent '), Market_SquareFeet = C (120.342.220.110)))
#return rader bare når verdiene i markedsplassen bare er India og USA
Print (Filter (Market, Market_Place % i % C ('India', 'USA'))))
Resultat:
Vi kan se at radene blir filtrert og brukt % i % operatør for å sjekke verdier som er "India" eller "USA".
Konklusjon
I denne artikkelen diskuterte vi de fire forskjellige eksemplene for å filtrere DataFrame ved å spesifisere de forskjellige forholdene ved bruk av relasjonelle operatører, logiske operatører og % i % operatør.