Statistikkmodul
Statistikkmodulen gir enkle funksjoner for beregning av statistikken over et datasett. De hevder at de ikke konkurrerer med Numpy, Scipy eller annen programvare som SPSS, SAS og Matlab. Og det er faktisk en veldig enkel modul. Det gir ikke parametriske eller til og med ikke-parametriske tester. I stedet kan det brukes til å gjøre noen enkle beregninger (selv om jeg tror at til og med Excel kan gjøre det samme). De hevder videre at de støtter int, float, desimaler og brøk.
Statistikkmodulen kan måle (1) gjennomsnitt og mål for sentral beliggenhet, (2) målinger av spredning, og (3) statistikk for forholdet mellom to innganger.
Statistikk.mener()
Statistikkmodulen inneholder et stort antall funksjoner. Vi vil ikke dekke hver enkelt, men heller noen få av dem. I dette tilfellet er datasettet plassert i en liste. Listen sendes deretter til funksjonen.
For heltall:
hoved-.PY importstatistikkNår du kjører sistnevnte, får du:
hoved-.PY 3.5For brøk er terminologien litt annerledes. Du må importere modulen som heter brøk. Du må også plassere brøkdelen i parentes og skrive en hovedstad F foran den. Således 0.5 ville være lik F (1,2). Dette er ikke mulig for store datasett!
hoved-.PY importstatistikkNår du kjører sistnevnte, får du:
hoved-.PY 617/840I de fleste forskningsarbeid er den vanligste typen antall som oppstår desimalverdien, og det er mye vanskeligere å oppnå med statistikkmodulen. Du må først importere desimalmodulen og deretter sette hver desimalverdi i anførselstegn (som er absurd og upraktisk hvis du har store datasett).
hoved-.PY importstatistikkNår du kjører sistnevnte, får du:
hoved-.Py 2.813333333333333333333333333333Statistikkmodulen tilbyr også FMEAN, geometrisk middel og harmonisk middel. Statistikk.median () og statistikk.modus () ligner på statistikk.mener().
Statistikk.varians () og statistikk.Stdev ()
I forskning er veldig sjelden prøvestørrelsen din så stor at den tilsvarer eller omtrent tilsvarer befolkningsstørrelsen. Så vi ser på prøvevarians og prøvestandardavvik. Imidlertid tilbyr de også en populasjonsvarians og et populasjonsstandardavvik.
Nok en gang, hvis du vil bruke desimaler, må du importere desimalsmodulen, og hvis du vil bruke brøk, må du importere brøkmodulen. Dette, når det gjelder statistisk analyse, er ganske absurd og veldig upraktisk.
hoved-.PY importstatistikkNår du kjører sistnevnte, får du:
hoved-.PY 7.14426666666666666666666666667Alternativt kan standardavviket beregnes ved å gjøre:
hoved-.PY importstatistikkNår du kjører sistnevnte, får du:
hoved-.Py 2.672876103875124748889421932Pearson korrelasjon
Av en eller annen grunn, selv om forfatterne av statistikkmodulen ignorerte ANOVA-tester, t-tester, osv. ... inkluderer de korrelasjon og enkel lineær regresjon. Husk at Pearson korrelasjon er en spesifikk type korrelasjon som bare brukes hvis dataene er normale; Det er dermed en parametrisk test. Det er en annen test som kalles Spearman -korrelasjon som også kan brukes hvis dataene ikke er normale (som har en tendens til å være tilfelle).
hoved-.PY importstatistikkNår du kjører sistnevnte, får du:
hoved-.Py 0.9960181677345038Lineær regresjon
Når en enkel lineær regresjon blir utført, chucks ut en formel:
y = skråning * x + avskjæringExcel gjør dette også. Men det mest denne modulen kan gjøre er å skrive ut verdien av skråningen og avskjæringen du kan lage linjen på nytt. Excel og SPSS tilbyr grafer for å gå med ligningen, men ingenting av det med statistikkmodulen.
hoved-.PY importstatistikkNår du kjører sistnevnte, får du:
hoved-.py skråningen er 0.9111784209749394Samvariasjon
I tillegg kan statistikkmodulen måle samvariasjon.
hoved-.PY importstatistikkNår du kjører sistnevnte, får du:
hoved-.PY 4.2797199999999999Selv om Python tilbyr en modul som heter Statistics -modulen, er det ikke for avansert statistikk! Husk at hvis du faktisk vil analysere datasettet ditt, kan du gå med en annen modul enn statistikkmodulen! Ikke bare er det for enkelt, men også alle funksjonene som den tilbyr lett kan finnes i Excel også. Videre er det bare to tester - Pearson -korrelasjonen og enkel lineær regresjon - som denne modulen tilbyr når det gjelder tester. Det er ingen ANOVA, ingen t-test, ingen chi-square eller noe av lignende! Og hva mer, hvis du trenger å bruke desimaler, må du påkalle desimalmodulen, som kan være frustrerende for store og veldig store datasett. Du vil ikke fange noen som trenger ekte statistisk arbeid som gjøres ved hjelp av denne modulen (gå med SPSS hvis du trenger avanserte ting), men hvis det er enkelt moro du leter etter, så er denne modulen noe for deg.
Glad koding!