Scipy kurtose

Scipy kurtose
Python er populært som programmeringsspråk for generell formål som fungerer for flere applikasjoner. Dette språket inkluderer objektorienterte, matematiske operasjoner, datastrukturer og funksjonell programmering. Scipy er en bibliotekpakke som Python sørger for dataanalyse og for å utføre de forskjellige maskinlæringsoperasjonene som inkluderer algoritmer, optimisatorer, integrasjon, interpolasjon og differensialligninger. Scipy tilbyr funksjonen Kurtosis fra modulen "Statistikk". Kurtosis er kjent for å være mål på hvordan en poengsum eller informasjonen er fordelt på toppen og halen på distribusjonen i sammenligning med normalfordelingstoppen.

Fremgangsmåte:

Artikkelen følger Scipy Kurtosis () -metoden for å finne ut hvordan informasjonen distribueres på halene eller hvor tung fordelingen av fordelingen er fra normalfordelingen. Fenomenet og metoden for å kalle scipys kurtose med dens gitte inngangsparametere er forklart i denne artikkelen. Python -programmet som vi vil bruke til å kjøre og utføre Python -kodene, er "Google Collab". Det er en online open source-plattform som muliggjør rask utførelse av programmet ved å tilby de allerede installerte pakkene til alle bibliotekene i Python.

Syntaks:

For å kalle Kurtosis () -funksjonen i programmet vårt, må vi kjenne syntaksen for funksjonen, og bør også være godt klar over inngangsargumentet som funksjonen tar for å få funksjonen til å fungere ordentlig og returnere den nødvendige utgangen. Kurtosis () -funksjonen i Python -skriptet kan skrives som:

$ scipy.statistikk.Kurtosis (A, Axis = 0, Fisher = True, Bias = True)

"A" i parameterlisten definerer dataene eller matrisen hvis kurtose vi ønsker å beregne. Axis er aksen som vi ønsker å finne kurtosen. Den endelige parameteren i parameterlisten er Fisher. Hvis denne parameteren er satt til boolsk sann, beregner dette Fisher Kurtosis. Ellers, når det gjelder falsk, finner den Pearsons kurtose.

Returverdi:

Returverdien av kurtosefunksjonen er verdien av selve kurtosen. Hvis det er positivt, betyr dette at det eksisterer nok antall outliers i distribusjonen. Og i tilfelle av den negative verdien for kurtosen, forteller den at fordelingen er mer ensartet sammenlignet med normalfordelingen.

Eksempel 1:

La oss løse et eksempel for kurtose med parametrene som vi diskuterte i syntaks. For å bruke kurtosefunksjonen, må vi definere de tilfeldige variablene som dataene for kurtosefunksjonen, slik at kurtosen kan se etter fordelingen av observasjonene på halene og toppverdiene. For å definere de tilfeldige variablene, eksisterer det en annen metode, “Norm. RVS ”, som er et attributt fra“ Scipy Statistics ”-modulen. Så vi importerer normen fra statistikken som “fra Scipy. Statistikk importerer norm ”. For å generere de tilfeldige variablene med størrelsen “4000” ved hjelp av normfunksjonen, skriver du “Statistikk. norm. bobil (størrelse = 4000, random_state = 5) ”.

Hver gang vi får tilgang til attributtet fra modulen til det spesifikke biblioteket siden vi brukte "Norm" -attributtet til "statistikk" -modulen fra "Scipy" -biblioteket, kaller vi alltid attributtet med prefikset til den modulen der vi importerte den for funksjonen som skal fungere ordentlig. Vi lagrer disse tilfeldig genererte dataene i en variabel som heter “Data_”. Nå er det på tide å beregne kurtosen for disse tilfeldig genererte dataene. Vi kan gjøre det ved å bare sende denne parameteren til inngangsparameteren til Kurtosis () -funksjonen med en annen spesifisert parameter.

Vi importerer kurtosefunksjonen fra “Scipy. statistikk ”. Deretter bruker vi denne importerte kurtosemodulen i programmet. Vi kaller kurtosen med prefiksstatistikken som "Statistikk. Kurtosis (data_, fisher = true) ”. Legg merke til at vi gir "data_" som en input -matrise og spesifiserer fiskeren til boolsk "sann" for å beregne Fisher Kurtosis. Kjør og utfør følgende definerte kode for å se etter kurtoseverdien i utdataene til programmet:

Utgangen fra funksjonen er en negativ verdi som er lik "0.0322 16 ”. Dette betyr at sannsynlighetstetthetsfunksjonen er mer ensartet i distribusjon sammenlignet med normalfordelingen.

Eksempel 2:

Vi utfører nå Pearsons kurtose for å sjekke halenes fordeling av dataene. Vi starter dette eksemplet ved å lage et nytt prosjekt i “Google Collab”. Deretter begynner vi å skrive programmet ved å importere noen viktige biblioteker og deres avhengige moduler til prosjektet. Vi importerer "kurtosen" og "normen .RVS ”fra Scipy Statistikkmodulen. Normen.RVS tillater oss å generere de tilfeldige variablene. Deretter sender vi disse dataene til kurtosemetoden.

Nå kaller vi “Statistikk. norm. bobil (størrelse = 5000, random_state = 5) ”metode. Dette genererer distribusjonen for de 5000 tilfeldige variablene. Vi sender disse dataene til kurtosefunksjonen som inngangsarray. Deretter, denne gangen, setter vi Fisher -parameterverdien som er lik den boolske "falske". Deretter viser vi resultatene fra programmet. Programmet for dette eksemplet vises i følgende figur:

Etter å ha utført det tidligere nevnte programmet, fikk vi utgangsverdien for at kurtosen var den positive verdien som er motsatt av verdien av kurtosen når vi setter fiskeren til den boolske sanne. Denne positive verdien for kurtosen sier at det eksisterer flere outliers i distribusjonen av disse dataene. Derfor er den ikke mer ensartet i forhold til normalfordelingen.

Konklusjon

Metoden for å implementere Scipy Kurtosis -funksjonen blir forklart og praktisk demonstrert i denne artikkelen. Vi brukte kurtose for å finne målet på hvordan dataene er distribuert i toppen og de halede verdiene for distribusjonen. Vi beregnet både Pearsons og Fisher Kurtosis for å vite om forskjellen som begge disse metodene har i utgangene sine.