Geometrisk gjennomsnittlig pandaer

Geometrisk gjennomsnittlig pandaer
Å jobbe med Python -programmeringsspråket gjør alt enkelt og enklere. Python -programmeringsspråket ble designet for å gjøre utviklerens liv enklere, og det er grunnen til at til og med nybegynnere og nybegynner Python -utviklere blir forelsket i programmering og utvikling. Det er et av de beste programmeringsspråkene for dataanalyse. Dessuten gir Python -programmeringsspråket biblioteker som kan utføre matematisk og statistisk beregning.

Geometriske midler er en av Python Pandas -funksjonene som brukes til å beregne det geometriske gjennomsnittet av et gitt sett med tall, liste eller dataframe. Denne artikkelen er designet for å demonstrere hvordan du finner det geometriske middelet ved bruk av pandaer i Python.

Hva betyr geometrisk?

Det geometriske gjennomsnittet er gjennomsnittet av settet med tall som vanligvis blir referert til som sammensatt årlig vekstrate. Det brukes der en liste over tall må multipliseres sammen. Med enkle ord er det gjennomsnittsverdien av settet med tall. For å beregne det geometriske middel.

Hvordan finne geometrisk middel ved bruk av pandaer i python?

Det er flere måter vi kan implementere for å beregne de geometriske midlene ved å bruke pandaer i Python. Imidlertid skal vi diskutere de fire enkleste og enkleste måtene å finne det geometriske middelet ved å bruke pandaer i Python.

Metode 1: Manuell beregning av geometrisk middel

Den første metoden er veldig enkel, men kjedelig. Det er akkurat som å beregne det geometriske middelet på en kalkulator, ta produktet av alle tallene og deretter ta den første roten til produktet. La oss nå se en eksempelkode for å lære den manuelle metoden.

Eksempel 1

I dette eksemplet vil vi ganske enkelt gi 5 tall og ta produktet med * (multiplikasjonstegn), og deretter vil vi dele produktet med 5 ettersom 5 er antall observasjoner. La oss nå se koden:

Tall = 10 * 20 * 1 * 5 * 6
n = 5
gm = (tall) ** (1/n)
Print ('Det manuelt beregnede geometriske gjennomsnittet er:' + Str (GM))

Legg merke til at produktet av 10 * 20 * 1 * 5 * 6 er 6000, og den første roten til 6000 er 5.69. Se utgangen nedenfor:

Metode 2: Bruke en sløyfe for å beregne det geometriske middelverdien

Den alternative metoden for den manuelle prosessen er å oppgi alle tallene i en liste og bruke løkken til å beregne produktet. Se eksemplet nedenfor for å forstå bedre.

Eksempel 2

I dette eksemplet vil vi ganske enkelt legge alle tallene i en liste og bruke 'for' -løkken for å beregne produktet av tallene som er gitt på listen og bruke formelen for geometriske midler. Se koden nedenfor.

Produkt = 1
tall = [10, 20, 1, 5, 6]
n = len (tall)
for jeg i tall:
produkt = (produkt)*(i)
gm = (produkt) ** (1/n)
Print ('Det manuelt beregnede geometriske gjennomsnittet er:' + Str (GM))

Etter å ha brukt 'for' -sløyfen, får du følgende resultat. Nå, hvis du merker, er resultatet det samme som i forrige eksempel. La oss gå videre til den tredje metoden.

Metode 3: Bruk scipy og pandaer for å beregne de geometriske midlene

Pandas Library in Python er usedvanlig flott med statistisk og matematisk beregning. Det gir nesten alle funksjoner for vitenskapelige, statistiske og matematiske beregninger. Pandas gir en Gmean () -funksjon for å finne det geometriske gjennomsnittet av et sett med tall. I eksemplet nedenfor vil vi demonstrere hvordan du bruker Gmean () -funksjonen for å beregne de geometriske midlene ved hjelp av scipy og pandaer.

Eksempel 3

Dette eksemplet er veldig enkelt; Vi vil bare importere 'statistikk' bibliotek med scipy og bruke gmean () -funksjonen på et sett med tall. Se koden nedenfor:

fra scipy importstatistikk
GM = statistikk.Gmean ([10, 20, 1, 5, 6])
Print ('Det manuelt beregnede geometriske gjennomsnittet er:' + Str (GM))

Som vi har brukt det samme settet med tall, så skal utgangen være den samme som i de forrige eksemplene. Se utgangen nedenfor.

Merk at Gmean () -funksjonen ga samme resultat som i eksemplene ovenfor, som betyr at Gmean () er i stand til å utføre beregningen av et par kodelinjer med bare Gmean () -funksjonen samtale.

La oss nå lage en dataaframe og deretter bruke scipy og pandaer på det for å se hvordan gmean () oppfører seg med dataframes. Først vil vi lage et datafram og deretter kalle Gmean () -funksjonen for å beregne det geometriske gjennomsnittet av en dataaframe. Se koden nedenfor:

Fra Pandas importer DataFrame
Fra scipy.statistikk.mstats importerer gmean
liste1 = 'tall': [10, 20, 1, 5, 6]
DF = DataFrame (liste1)
gm = gmean (df.loc [:, 'tall'])
Print ('Det manuelt beregnede geometriske gjennomsnittet er:' + Str (GM))

Se utgangen nedenfor. Legg merke til at som før genereres det samme resultatet. La oss nå flytte til den fjerde og den siste metoden.

Metode 4: Bruk Numpy for å beregne det geometriske middelverdien

Denne metoden handler om å beregne det geometriske middelet ved å bruke den innebygde funksjonen levert av Numpy Library. Se eksemplet nedenfor for å lære hvordan du bruker den numpy innebygde funksjonen i Python-koden.

Eksempel 4

I dette eksemplet vil vi ganske enkelt opprette en tilpasset funksjon for å beregne det geometriske middelet ved hjelp av numpy innebygde log () og gjennomsnittlige () funksjoner. Den tilpassede funksjonen og Gmean () -funksjonen er begge designet for å utføre den samme funksjonen slik at de skal gi samme resultat. Se koden nedenfor for å lære hvordan du definerer den tilpassede Python -funksjonen som kan beregne det geometriske middelet for deg.

Her vil vi bruke log () -funksjonen for å finne loggen til settet med tallene først, så vil vi bruke den normale middelverdien () -funksjonen, og etter det brukes exp () -funksjonen for å konvertere den normale gjennomsnittet inn i geometrisk middel. Se koden nedenfor for å ha en bedre forståelse.

Importer numpy som NP
def g_mean (x):
a = np.logg (x)
Return NP.exp (a.mener())
GM = G_MEAN ([10, 20, 1, 5, 6])
Print ('Det manuelt beregnede geometriske gjennomsnittet er:' + Str (GM))

Som vi har gitt de samme dataene som input, så skal utgangen være den samme igjen. Se utgangen nedenfor.

Konklusjon

I denne artikkelen har vi lært om hvordan vi beregner de geometriske midlene i Python. Vi har demonstrert fire forskjellige metoder for å beregne det geometriske gjennomsnittet i Python. Den første metoden er manuell, den andre metoden bruker 'for' -sløyfen, den tredje metoden bruker scipy og pandaer, og den siste metoden bruker den numpy tilpassede funksjonen for å beregne de geometriske midlene.