Scipy Crosstab

Scipy Crosstab

Python -programmeringsspråk tilbyr en rekke utrolige biblioteker som gir en lang liste over nyttige funksjoner. Ved hjelp av disse bibliotekene og funksjonene kan enhver praktisk anvendelse enkelt administreres. I denne artikkelen vil vi forklare krysningsfunksjonen som er tilgjengelig i Scipy Library. Scipy Library er et av de mest brukte bibliotekene i Python -programmeringsspråket, da det gir funksjoner for alle slags statistiske og matematiske operasjoner. Crosstab er et annet Scipy Librarys funksjon som vi vil diskutere i denne guiden. La oss komme i gang!

Hva er Crosstab?

Crosstab står for kryss -tabulering som brukes til å lage en beredskapstabell med to eller flere faktorer ved å telle frekvensene til de tilsvarende par. Med enkle ord returnerer den en tabell som inneholder tellingen for hver unike kombinasjon av elementene i to eller flere datasett. Den kan brukes til å utføre kraftig dataanalyse ved å bygge en sammendragstabell.

I denne artikkelen vil vi demonstrere noen eksempler for å vise deg hvordan du bruker Crosstab -funksjonen i et Python -program. Med disse eksemplene vil du kunne forstå funksjonen på en bedre måte og vil kunne implementere den i programmene dine. Før du går videre til delen av eksemplene, la oss forstå syntaksen til Crosstab -funksjonen.

Hva er syntaksen til krysningsfunksjonen?

Crosstab -funksjonen er levert av Scipy -biblioteket i statistikkpakken og beredskapsklassen. Syntaksen til Crosstab -funksjonen er som følger:


Parameterdatasettene* representerer sekvensen av datasett hvis kryss -tabulering skal beregnes. Størrelsen på eller varene skal samsvare med alle datasett. Nivåene og sparsomme parametere er valgfrie parametere. Hvis de ikke er gitt, vil standardverdien bli brukt. Nivået argumentet inneholder listen over elementer som skal telles i datasettene. Antallet "nivåer" og antall datasett skal være det samme.

Verdiene gitt i nivåets parameter telles i datasettene. Hvis det ikke eksisterer tilsvarende verdier i datasettet, vil de bli ignorert, og tellingen deres vil ikke bli returnert i den resulterende matrisen. Sparparameteren har en sann eller falsk verdi, noe som indikerer om du vil returnere en sparsom matrise eller ikke. Det er usant som standard.

Crosstab -funksjonen returnerer to elementer - den ene er en lengde av lengde og den andre er tell. "Tuple of Length" inneholder sekvensen av elementer som telles. "Count" -elementet inneholder tellingen for hvert beredskapspar som også er kjent som en beredskapstabell. Nå som vi lærte syntaksen til Crosstab -funksjonen, la oss se noen eksempler for å forstå hvordan Crosstab -funksjonen kan implementeres i et Python -program.

Eksempel 1:

La oss starte med et enkelt eksempel slik at vi ikke har noe problem med å forstå den grunnleggende arbeidet med Crosstab -funksjonen. Vurder prøvekoden i følgende kodebit:

Fra scipy.statistikk.Beredskap Import Crosstab
A = ['A', 'A', 'A', 'B', 'B', 'B', 'A', 'A', 'A', 'B', 'B', 'B' ]
x = ['x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z' ]
(Avals, XVALS), Count = Crosstab (A, X)
Print ('Array 1 inneholder:', Avaler)
Print ('\ Narray 2 inneholder:', XVALS)
trykk ('\ n antallet Crosstab er: \ n', tell)


Først importeres Scipy -biblioteket sammen med statistikkpakken og beredskapsklassen til programmet for å ringe Crosstab -funksjonen. Etter det er to matriser av samme lengde gitt. Begge blir sendt til Crosstab -funksjonen. Tre variabler er erklært, hver har et unikt resultat fra krysningsfunksjonen. La oss nå se resultatet av Crosstab -funksjonen i følgende:


Den første matrisen inneholder 2 unike elementer - A og B. Mens den andre matrisen inneholder tre unike elementer - X, Y og Z. Antallet av beredskap er [[2, 2, 2] [2, 2, 2]] som betyr at paret (a, x) oppstår to ganger, paret (a, y) forekommer to ganger, paret (a, z ) forekommer to ganger, paret (b, x) forekommer to ganger, paret (b, y) forekommer to ganger, og paret (b, z) oppstår to ganger.

Eksempel 2:

Som vi diskuterte i forrige eksempel, aksepterer Crosstab så mange datasett som du kan gi. Det beregner beredskapstabellen for alle datasettene. I forrige eksempel ga vi bare 2 datasett. La oss legge til en til og se resultatet av Crosstab -funksjonen. Tenk på følgende prøvekode:

Fra scipy.statistikk.Beredskap Import Crosstab
A = ['A', 'A', 'A', 'B', 'B', 'B', 'A', 'A', 'A', 'B', 'B', 'B' ]
x = ['x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z' ]
P = [0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1]
(Avals, XVALS, PVALS), Count = Crosstab (A, X, P)
Print ('Array 1 inneholder:', Avaler)
Print ('\ Narray 2 inneholder:', XVALS)
trykk ('\ Narray 3 inneholder:', PVALs)
trykk ('\ n antallet Crosstab er: \ n', tell)


La oss nå se følgende utdata for å forstå hvordan resultatet av krysningene endres:


Siden vi hadde tre datasett, inneholder det første datasettet to unike elementer - A og B. Det andre datasettet inneholder tre unike elementer - x, y og z. Og det tredje datasettet inneholder to unike elementer - 0 og 1. Vi har følgende par (a, x, 0), (a, x, 1), (a, y, 0), (a, y, 1), (a, z, 0), (a, z, 1), (b, x, 0), (b, x, 1), (b, y, 0), (b, y, 1), (b, z, 0), (b, z, 1) , med teller [[[2 0] [0 2] [2 0]] [[0 2] [2 0] [0 2]]].

Eksempel 3:

Som vi vet, tar Crosstab to valgfrie parametere - den ene er nivåer og den andre er sparsom. I dette eksemplet vil vi veilede deg om hvordan du eksplisitt kan gi nivåparametrene og hvordan Crosstab -funksjonen administrerer den. Tenk på følgende eksempel:

Fra scipy.statistikk.Beredskap Import Crosstab
A = ['A', 'A', 'A', 'B', 'B', 'B', 'A', 'A', 'A', 'B', 'B', 'B' ]
x = ['x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z' ]
opt = ['a', 'b', 'x', 'y', 'z']
(Avals, XVALS), Count = Crosstab (A, X, Nivåer = (OPT, OPT))
Print ('Array 1 inneholder:', Avaler)
Print ('\ Narray 2 inneholder:', XVALS)
trykk ('\ n antallet Crosstab er: \ n', tell)


Som vi tidligere har diskutert, bør antallet nivåer være det samme som antall datasett. Så vi gir nivåene = (opt, opt) for å matche antall datasett. La oss se beredskapstabellen i følgende utgang:

Eksempel 4:

Det andre valgfrie argumentet for krysningsfunksjonen er sparsom. I dette eksemplet vil vi eksplisitt definere den sparsomme parameteren som sant for å få den sparsomme matrisen som resultat. Vurder prøvekoden i følgende kodebit:

Fra scipy.statistikk.Beredskap Import Crosstab
A = ['A', 'A', 'A', 'B', 'B', 'B', 'A', 'A', 'A', 'B', 'B', 'B' ]
x = ['x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z' ]
opt = ['a', 'b', 'x', 'y', 'z']
(Avals, XVALS), Count = Crosstab (A, X, Nivåer = (OPT, OPT), SPARSE = TRUE)
Print ('Array 1 inneholder:', Avaler)
Print ('\ Narray 2 inneholder:', XVALS)
Print ('\ n the Sparse Matrix is: \ n', count)
trykk ('\ n antallet crosstab er: \ n', telle.EN)


Her er utgangen fra Crosstab -funksjonen som inneholder alle nødvendige og valgfrie parametere:

Konklusjon

Denne artikkelen er en rask oversikt over Crosstab -funksjonen levert av Scipy Library. Crosstab står for kryss -tabulering. Det brukes til å få beredskapstabellen for de gitte dataene. Det tar en liste over datasett, teller beredskapen til elementene som er gitt i datasettet, og returnerer utvalget av teller. Ved hjelp av eksempler lærte vi hvordan vi kan gi de forskjellige parametrene til funksjonen og få ønsket resultat av den.