Python medianfunksjon

Python medianfunksjon

“Når det gjelder statistisk dataanalyse, er Python et veldig godt likt språk. Statistikkpakkens median () -metode vil bli brukt for å bestemme medianverdien til en uordnet liste. At datasettet ikke trenger å bli ordnet før det blir gitt som et argument til median () -metoden, er funksjonens viktigste fordel. Medianen er tallet som deler et sett med data eller betingede sannsynligheter i to halvdeler.

Medianverdien har en betydelig fordel i forhold til gjennomsnittet fordi den er mindre påvirket av utrolig større eller mindre figurer. Kanskje er medianverdien til stede i det gitte settet, eller den vil ikke vesentlig avvike fra datasettet. Det midterste tallet i et merkelig datasett er medianelementet. Gjennomsnittet av de to midtre elementene bestemmer mediannummeret for enhver jevn samling av varer. Vi vil diskutere hvordan du får medianverdien i Python.”

Eksempel nr. 1

La oss undersøke hvordan vi vil bruke en innebygd metode i Python for å bestemme medianverdien. Det har vært en statistikkpakke i Python. Denne pakken tilbyr relevant statistisk og prediktiv analyse relatert til kvantitative teknikker. Median () -metoden er en av denne pakkens bemerkelsesverdige teknikker. Denne parameteren definerer medianen til et bestemt datasett, som navnet skulle indikere. Først må vi integrere statistikkrammen i programmet. Her er en forekomst av hvordan du kan konstatere medianverdien til en gitt tallsekvens.

Importer statistikk
d_1 = [3, -21, 13, 76, 97, 54, 57, -31]
trykk ("Medianen kan sees på som: % s"
% (statistikk.median (D_1))))

Først av alt kommer vi til å importere den nødvendige overskriften File Statistics. Denne modulen omhandler matematiske funksjoner. I neste linje vil en variabel med navnet "D_1" bli erklært. Innenfor denne variabelen vil vi definere 8 verdier. Disse verdiene inneholder både positive og negative tall. Vi ønsker å skaffe medianen av disse verdiene. For å avslutte koden, har vi kalt Print () -metoden for å vise medianverdien. For å finne ut medianverdien, vil vi bruke den innebygde median () -metoden til statistikkbiblioteket.

Eksempel nr. 2

I Python kan vi bruke median () -funksjonen for å bestemme listenes medianverdi. Verdiene i listen trenger derfor ikke være i noen spesifikk sekvens, og listen kan være hvilken som helst lengde. Metoden vil returnere gjennomsnittet av de to midtre oppføringene hvis samlingen har til og med elementer på listen. Det midterste heltallet av statistiske data returneres etter median () -metoden. I dette tilfellet vil vi se hvordan vi bruker median () -metoden for å validere medianverdien til forskjellige datasett.

fra statistikk import median
fra brøkdeler importerer brøkdel som FR
d_1 = (21, 23, 24, 45, 77, 99, 1)
d_2 = (1.4, 4.7, 4.0, 81.8)
d_3 = (fr (11, 21), fr (4, 82),
FR (12, 9), FR (6, 5))
d_4 = (-9, -7, -4, -2, -33)
d_5 = ​​(-2, -5, -9, -5, 1, 6, 8, 1)
Print ("1. median er % s" % (median (d_1))))
Print ("2. median er % s" % (median (D_2)))
Print ("3. median er % s" % (median (D_3)))
Print ("4. median er % s" % (median (d_4))))
Print ("5. median er % S" % (median (D_5)))

Vi begynner koden ved å integrere medianpakken fra statistikkoverskriftsfilen. Tilsvarende vil brøkmodulen bli integrert som FR. Vi vil definere fem lister som inneholder forskjellige verdier. Den første listen er lagret i en variabel “D_1”. Denne listen har syv positive tall. Den andre listen består av noen flytende punkttall. Disse verdiene holdes i en variabel “D_2”. Her vil vi lage en liste over brøkverdier.

For å definere brøknumrene. Vi bruker FR () -metoden. Den fjerde listen er lagret i variabelen “D_4”. Her spesifiserer vi settet med alle negative verdier. For å lagre elementene på den 5. listen, erklærer vi en variabel “D_5”. Denne tupelen har noen verdier av positive så vel som negative tall. Nå vil vi skrive ut medianverdiene til alle de rett over datasettene. Så vi kaller metoden Print () for alle disse settene henholdsvis. For å skaffe medianverdiene, bruker vi median () -metoden på datasettene.

Eksempel nr. 3

Nå, hvis vi må lage medianmetoden fra bunnen av, er dette en effektiv metode. Men når det gjelder sparetid, vil vi bruke en innebygd metode for grunnleggende matematiske beregninger. Brukere må forstå hvordan de skal bestemme medianen hvis de har tenkt å anvende medianuttrykket.

def get_median (l):
ls_sorted = l.sortere()
Hvis len (l) % 8 != 0:
M11 = int ((Len (L) +1)/25 - 1)
Returner L [M11]
ellers:
m_1 = int (len (l)/2 - 1)
m_2 = int (len (l)/2)
return (l [m_1]+l [m_2])/2
L = [13, 16, 94, 19, 21, 35, 3, 6]
trykk (get_median (l))

Her vil vi definere get_median () -funksjonen for å få datasettet. Deretter vil vi sortere den nødvendige datalisten. Dette kan gjøres ved å bruke sort () -funksjonen. Vi vil bruke if-ests-setningen. Innenfor denne uttalelsen finner vi først lengden på datasettet ved å bruke Len () -metoden. Lengden på datasettet vil være viktig å finne fordi det viser om den definerte listen vil være merkelig eller til og med i lengde.

For å sjekke dette bruker vi (!=) operatør. Hvis de totale verdiene på listen er rare, vil vi trekke 1 når indeksnummeret starter på 0. Videre vil vi spesifisere elementene på listen; Disse elementene vil bli lagret i en variabel “L”. Til slutt kaller vi metoden Print () for å vise medianverdien til den nødvendige listen. Innenfor denne funksjonen passerer vi funksjonen get_median () som en parameter til denne funksjonen. Ved å bruke denne metoden vil vi skaffe oss medianverdien på listen.

Konklusjon

I denne håndboken har vi snakket om forskjellige metoder som brukes til å beregne medianverdien. Målingen av et datasetts relevans er medianverdien. Hver gang den gjennomsnittlige beregningen gir unøyaktige funn, er det nyttig. Bruk Pythons innebygde median () -metode som er assosiert med statistikkpakken for å få median. Metoden velger midtpunktet og vender det tilbake hvis listenes lengde er merkelig. Metoden velger de to mellomtallene i et jevnt sett, beregner gjennomsnittet og presenterer deretter utfallet. I denne guiden har vi utført noen eksempler der vi bruker den innebygde metoden median () for å få medianverdien på listen. Og i et av tilfellene har vi bestemt medianverdien til flere datasett.