I denne R -opplæringen vil vi se hvordan vi skal utføre aggregeringsoperasjonene ved å gruppere dataene og returnere minimumsverdiene i de grupperte radene.
Denne operasjonen må utføres på en dataaframe. La oss opprette DataFrame med syv rader og fem kolonner.
#Create et dataaframmarked som har 7 rader og 5 kolonner.
Markeds = data.Ramme (Market_id = C (1,2,1,4,3,4,5), Market_name = C ('M1', 'M2', 'M3',
'M4', 'M3', 'M4', 'M3'), Market_place = C ('India', 'USA', 'India', 'Australia',
'USA', 'India', 'Australia'), Market_Type = C ('Grocery', 'Bar', 'Grocery',
'Restainent', 'dagligvare', 'Bar', 'dagligvare'), Market_SquareFeet = C (120.342.220.110.342.220.110))))
#Display The Market DataFrame
trykk (marked)
Resultat
Nå returnerer vi minimumsverdiene i en kolonne ved å gruppere de lignende verdiene i en annen kolonne.
Metode 1: Aggregat ()
Her bruker vi aggregatfunksjonen () som tar tre parametere.
Syntaks
Aggregate (DataFrame_Object $ gruppert, liste (DataFrame_Object $ Grouping), Fun = Min)
Parametere:
- Den første parameteren tar variabelen (gruppert) som returnerer minimumsverdiene per gruppe.
- Den andre parameteren tar en enkelt eller flere kolonner (gruppering) i en liste slik at verdiene er gruppert i disse kolonnene.
- Den tredje parameteren tar moro, som tar Min -funksjonen for å returnere minimumsverdiene i de grupperte verdiene.
Eksempel 1
I dette eksemplet grupperer vi verdiene i kolonnen Market_Place og får minimumsverdiene i Market_SquareFeet -kolonnen gruppert av Market_place -kolonnen.
#Create et dataaframmarked som har 7 rader og 5 kolonner.
Markeds = data.Ramme (Market_id = C (1,2,1,4,3,4,5), Market_name = C ('M1', 'M2', 'M3',
'M4', 'M3', 'M4', 'M3'), Market_place = C ('India', 'USA', 'India', 'Australia', 'USA',
'India', 'Australia'), Market_Type = C ('Grocery', 'Bar', 'Grocery', 'Restainent',
'dagligvare', 'Bar', 'dagligvare'), Market_SquareFeet = C (120,342,220,110,342,220,110)))
#Få minimum kvadratmeter i gruppen ved å gruppere Market_place
Print (Aggregate (Market $ Market_SquareFeet, List (Market $ Market_Place), Fun = Min))
Resultat
Vi kan se at de lignende verdiene (Australia, India og USA) i Market_place -kolonnen er gruppert og returnert minimum av grupperte verdier i markedet for markedet.
Eksempel 2
I dette eksemplet grupperer vi verdiene i kolonnen Market_Type og får minimumsverdiene i markedet for markeds_squarefeet gruppert av Market_Type -kolonnen.
#Create et dataaframmarked som har 7 rader og 5 kolonner.
Markeds = data.Ramme (Market_id = C (1,2,1,4,3,4,5), Market_name = C ('M1', 'M2', 'M3',
'M4', 'M3', 'M4', 'M3'), Market_place = C ('India', 'USA', 'India', 'Australia', 'USA',
'India', 'Australia'), Market_Type = C ('Grocery', 'Bar', 'Grocery', 'Restainent',
'dagligvare', 'Bar', 'dagligvare'), Market_SquareFeet = C (120,342,220,110,342,220,110)))
#Få minutt på kvadratmeter i gruppen ved å gruppere Market_Type
Print (Aggregate (Market $ Market_SquareFeet, List (Market $ Market_Type), Fun = Min))
Resultat
Vi kan se at de lignende verdiene (bar, dagligvarebutikk og restaurant) i kolonnen Market_Type er gruppert og returnert minimum av de grupperte verdiene i Market_Square Feet -kolonnen.
Eksempel 3
I dette eksemplet grupperer vi verdiene i markedet for markeds_type og markedsplasser og får minimumsverdiene i markedet for markedet_squarefeet gruppert av Market_Type og Market_place Columns.
#Create et dataaframmarked som har 7 rader og 5 kolonner.
Markeds = data.Ramme (Market_id = C (1,2,1,4,3,4,5), Market_name = C ('M1', 'M2', 'M3',
'M4', 'M3', 'M4', 'M3'), Market_place = C ('India', 'USA', 'India', 'Australia', 'USA',
'India', 'Australia'), Market_Type = C ('Grocery', 'Bar', 'Grocery', 'Restainent',
'dagligvare', 'Bar', 'dagligvare'), Market_SquareFeet = C (120,342,220,110,342,220,110)))
#Få minimum kvadratmeter i gruppen ved å gruppere Market_place og Market_Type
Print (Aggregate (Market $ Market_SquareFeet, List (Market $ Market_Place, Market $ Market_Type), Fun = Min))
Resultat
Vi kan se at de lignende verdiene fra de to kolonnene ble gruppert og returnert minimumsverdiene i hver gruppert verdi i Market_Square Feet -kolonnen.
Metode 2: DPLYR
Her bruker vi Group_by () -funksjonen med Summarise_at () -funksjonen som er tilgjengelige i DPLYR -biblioteket for å utføre Group_by () -funksjonen med Min -operasjonen.
Syntaks
DataFrame_Object%>% group_by (gruppering)%>% oppsummering_at (vars (gruppert), liste (navn = min))
Hvor:
- gruppe_by () tar en parameter, i.e. grupperingskolonne
- Summarise_at () tar to parametere:
- Den første parameteren tar variabelen (gruppert) som returnerer minimumsverdiene per gruppe.
- Den andre parameteren tar Min -funksjonen gjennom listen.
Til slutt oppsummerer vi først med min og laster den inn i gruppen. Deretter laster vi den grupperte kolonnen i DataFrame -objektet.
Det returnerer en Tibble.
Eksempel 1
I dette eksemplet grupperer vi verdiene i kolonnen Market_Place og får minimumsverdiene i Market_SquareFeet -kolonnen gruppert av Market_place -kolonnen.
Bibliotek ("DPLYR")
#Få minimum kvadratmeter i gruppen ved å gruppere Market_place
Print (Market %> % group_by (Market_place) %> % Summarise_at (vars (Market_squareFeet), liste (navn = min))))
Resultat
Vi kan se at de lignende verdiene (Australia, India og USA) i markedskolonnen er gruppert og returnert minimum fra hver gruppert verdi i markedet for markedet.
Eksempel 2
I dette eksemplet grupperer vi verdiene i kolonnen Market_Type og får minimumsverdiene i markedet for markeds_squarefeet gruppert av Market_Type -kolonnen.
Bibliotek ("DPLYR")
#få minimum kvadratmeter i gruppen ved å gruppere markeds_type
Print (Market %> % GROUP_BY (Market_Type) %> % Summarise_at (vars (Market_squareFeet), liste (navn = min))))
Resultat
Vi kan se at de lignende verdiene (bar, dagligvarebutikk og restaurant) i kolonnen Market_Type er gruppert og returnert minimumsverdiene i hver gruppert verdi i markedet for markedet.
Konklusjon
Det er mulig å gruppere enkelt- eller flere kolonner med de andre numeriske kolonnene for å returnere minimumsverdien fra den numeriske kolonnen ved å bruke aggregat () -funksjonen. Tilsvarende kan vi bruke GroupBy () Funciton med Summarise_at () -funksjonen til å gruppere de lignende verdiene i en kolonne og returnere minimumsverdiene fra de grupperte verdiene med hensyn til en annen kolonne.