Denne operasjonen må utføres på en dataaframe. La oss opprette DataFrame med syv rader og fem kolonner.
#Create et dataaframmarked som har 7 rader og 5 kolonner.Resultat
Nå returnerer vi gjennomsnittsverdiene til en kolonne ved å gruppere de lignende verdiene i en annen kolonne.
Metode 1: Aggregat ()
Her bruker vi aggregatfunksjonen () som tar tre parametere.
Syntaks
Aggregate (DataFrame_Object $ gruppert, liste (DataFrame_Object $ Grouping), Fun = Mean)Parametere
Eksempel 1
I dette eksemplet grupperer vi verdiene i kolonnen Market_Place og får gjennomsnittsverdiene i Market_SquareFeet -kolonnen gruppert etter Market_place -kolonnen.
Resultat
Vi kan se at de lignende verdiene (Australia, India og USA) i markedskolonnen er gruppert og returnert gjennomsnittet av de grupperte verdiene i Market_square Feet Column.
Eksempel 2
I dette eksemplet grupperer vi verdiene i kolonnen Market_Type og får gjennomsnittsverdiene i markedet for markeds_squarefeet gruppert av Market_Type -kolonnen.
Resultat
Vi kan se at de lignende verdiene (bar, dagligvarebutikk og restaurant) i kolonnen Market_Type er gruppert og returnert gjennomsnittet av de grupperte verdiene i markedet for markedet_square føtter.
Eksempel 3
I dette eksemplet grupperer vi verdiene i markedet for markeds_type og Market_place og får gjennomsnittsverdiene i markedet for markedet_squarefeet gruppert av Market_Type og Market_place Columns.
Resultat
Vi kan se at de lignende verdiene fra de to kolonnene ble gruppert og returnert gjennomsnittet av de grupperte verdiene i Market_Square Feet -kolonnen.
Metode 2: DPLYR
Her bruker vi Group_by med Summarise_at () som er tilgjengelige i DPLYR -biblioteket for å utføre Group_by med gjennomsnittlig operasjon.
Syntaks
DataFrame_Object%>% group_by (gruppering)%>% oppsummering_at (vars (gruppert), liste (navn = gjennomsnitt))Hvor:
gruppe_by () tar en parameter, i.e. grupperingskolonne
Summarise_at () tar to parametere:
Til slutt oppsummerer vi først med gjennomsnittet og lastes inn i gruppen. Deretter laster vi den grupperte kolonnen i DataFrame -objektet.
Det returnerer en Tibble.
Eksempel 1
I dette eksemplet grupperer vi verdiene i kolonnen Market_Place og får gjennomsnittsverdiene i Market_SquareFeet -kolonnen gruppert etter Market_place -kolonnen.
Resultat
Vi kan se at de lignende verdiene (Australia, India og USA) i markedskolonnen er gruppert og returnert gjennomsnittet av de grupperte verdiene i Market_square Feet Column.
Eksempel 2
I dette eksemplet grupperer vi verdiene i kolonnen Market_Type og får gjennomsnittsverdiene i markedet for markeds_squarefeet gruppert av Market_Type -kolonnen.
Resultat
Vi kan se at de lignende verdiene (bar, dagligvarebutikk og restaurant) i kolonnen Market_Type er gruppert og returnert gjennomsnittet av de grupperte verdiene i markedet for markedet_square føtter.
Konklusjon
Det er mulig å gruppere enkelt- eller flere kolonner med andre numeriske kolonner for å returnere gjennomsnittet av den numeriske kolonnen ved å bruke aggregat () -funksjonen. Tilsvarende kan vi bruke GroupBy () -funksjonen med Summarise_at () -funksjonen for å gruppere de lignende verdiene i en kolonne og returnere gjennomsnittet av de grupperte verdiene med hensyn til en annen kolonne.