Pandas Value Count

Pandas Value Count

Bruk funksjonen "Values_count ()" i Python Panda for å telle antall unike verdier og strenger. Den returnerer objektene som vises hyppigst på listen. Ved å bruke sin parameter, kan "sorter indeks" med "verdi_count" telle verdiene og bestille indeksen i enten stigende eller sekvensrekkefølge.

Syntaksen til count_Values ​​() -metoden

Eksempel 1: Tell strengen ved å bruke count_Value () -funksjonen

I dette eksemplet skal vi telle strengen til de gitte dataene i programmet ved å bruke "count_value ()" -funksjonen. En sekvens som inneholder tellingene av distinkte verdier er resultatet av "Value_Counts ()" -teknikken. Denne metoden returnerer derfor antall unike oppføringer i hver kolonne i en DataFrame for en gitt kolonne. Når du prøver å bestemme hyppigheten av gyldige verdier som eksisterer i kolonner om en bestemt kolonne i pandaer, brukes “Count ()”. Mens verdien “Count_Value ()” brukes til å bestemme tellingene i en serie.

For å sette koden i verk, bruker vi “Spyder” -verktøyet. Vi må først importere Pandas bibliotek som "PD" før vi kan utføre koden. I dette eksemplet “PD.Indeks ”brukes til å opprette en indeksliste. Denne listen blir referert til som "person". Verdiene vi laget for denne listen er “Watson”, “Emma”, “Enna”, ”Watson”, “Jhon”, “Smith”, “Jack”, “Emma”, “Isabella” og “Daniel”. Vi initialiserer variabelen “ID” for å beholde indeksen. Derfor “PD.Indeks ”påberopes for å opprette denne dataaframe.

For å telle strengene i denne koden, vil vi nå bruke “ID.Value_Counts () ”-funksjon. Det vil gi oss flere tellinger for hver streng som brukes i indekslisten. Siden visse strenger i indekslisten gjentas, kan vi enkelt telle antall ganger de gjentas ved å bruke "value_count ()". Vi vil nå bruke "print ()" -funksjonen for å vise "ID.count_value ”på skjermen.

To kolonner, indekslisten og antall tellinger brukes til å vise resultatene. Indekslisten vises med "Navn: Person" og datatypen for denne indeksen er "INT64". Den viste strengens nummer foran strengene, som det kan sees. Watson vises med en "2" foran den fordi ordet brukes to ganger i strengen. I likhet med hvordan “Emma” vises to ganger på listen, vises “2” foran den. "Enna" vises bare en gang i listen slik at "1" vises foran "Enna" resten vil følge samme prosedyre.

Eksempel 2: Bruke metoden for verdiskall (), for å telle antall heltallverdier

I denne illustrasjonen samler vi indeksens antall verdier. Sammenlignet med det foregående eksemplet, som viser hvordan du finner antall strenger, vil vi bestemme det totale antall verdier i dette tilfellet.

Vi må importere Pandas -biblioteket først. Først må vi generere indekslisten ved å bruke “PD.Indeks ”. Vi har noen verdier i form av tall i denne listen. Vi legger til heltallverdiene til indeksverdiene. Verdiene er “61”, “28”, ”28”, “98”, “52”, “43”, “52”, “98”, “1”, “4”, “9” og “61”. Deretter tildeles variabelen "ID" for å lagre den opprettede indeksen. "Print ()" -metoden brukes deretter til å vise denne indekslisten.

Etter det bruker vi nå “Value_Counts ()” for å telle antall heltallverdier som er til stede i indekslisten. Det vil gi tellingen av hver verdi som er inkludert i indekslisten. Den vil vise “1” i utgangen hvis et tall brukes bare en gang og viser antall gjentatte tall foran dette tallet hvis tallet brukes mer enn en gang. Nå skal vi vise “ID.Value_count ”ved å bruke" print () "-funksjonen.

Som sett vises en indeksliste med en rad på skjermen på skjermen. Denne listen viser tallet “61”, “28”, “28”, “98”, “52”, “43”, “52”, “96”, “1”, “4”, “9” og “ 61 ”med sin datatype“ Int64 ”. Indekslisten er den første kolonnen i den følgende linjen, mens den andre kolonnen viser antall heltallverdier. Denne rammen definerer tallene “61”, “28”, “98” og “52” bruker to ganger i indekslisten; Mens tallene “43”, “1”, “4” og “9” bruker en enkelt tid i indekslisten. "Count_Value ()" -funksjonen viser først gjentatte verdier før du går videre til enkeltverdier.

Eksempel 3: Bruke verdi_count for å telle antall heltallverdier og sortere dem i stigende rekkefølge

I dette eksemplet vil vi telle antall heltallverdier som er til stede i en DataFrame -kolonne og sortere dem ved å bruke heltallverdierens indekser. Ved å bestå en funksjon som sorterer i henhold til den nødvendige interne listeindeksen som et nøkkelord, brukes "Sort ()" -funksjonen til å utføre denne varianten av sortering.

Når vi ser på det tredje eksemplet i denne artikkelen, er det første vi trenger å gjøre å importere Pandas -biblioteket som "PD". Følgende trinn er å generere en dataaframe. DataFrame heter “Data”. Denne DataFrame inneholder en kolonne som heter “Numbers”. Vi har lagt til noen få heltallverdier til "tall" -kolonnen. Verdiene er “1”, “2”, ”4”, “8”, “8”, “1” og “0”. Bruker “PD.DataFrame ”Vi genererer nå DataFrame. Etter det bruker vi nå “print ()” -funksjonen for å vise DataFrame “Data” på skjermen.

Nå er vi “data.Tall.Value_count () ”for å telle tallene som er til stede i kolonnen“ nummer ”for denne dataaframe. Det vil bekrefte hvert nummer for å bestemme hvor mange det er gjentatt, og hvis det har det, vil den vise denne informasjonen som en ny kolonne i utgangsbildet. Deretter skriver vi ut uttalelsen “count_values” og viser “dataene.Antall.Verditall () ”ved hjelp av“ print () ”-metoden. Vi påkaller nå “Value_Count ()” -funksjonen og dens “sort_index” -parameter. Sortering er metoden for å sette data i en spesifisert rekkefølge for å gjøre dataene enklere å finne. Indeksen for telleverdier vil deretter bli sortert enten sekvensielt eller stigende. Dette resultatet lagres i den initialiserte variabelen “ID”. Til slutt, ved å bruke "print ()" -funksjonen, viser vi det endelige resultatet på skjermen.

Tre rammer vises i resultatresultatet. Den første viser dataaframe som vi opprettet med en enkelt kolonne "tall". Med indeksen viser denne kolonnen sine verdier. Antallet for DataFrame vises i den andre linjen under uttalelsen Count_Values. Tallene som ikke gjentas vises i kolonnen etter de gjentatte tallene. Det er enkelt å se at tallene "1" og "8" vises to ganger på listen over "tall" -kolonnen. “INT64” vises som datatype. Den siste fasen er å sortere indeksen for telleverdier, som nå er plassert i stigende rekkefølge. Nå er indeksen “0”, “1”, “2”, “4” og “8”.

Konklusjon

"Value_Count ()" -funksjonen brukes til å telle alle heltallverdiene eller strengene som er inneholdt i DataFrames kolonner eller indeksliste. I de to første eksemplene, “PD.Indeks ”ble brukt til å generere en indeksliste. For å bestemme tellingen bruker vi heltallverdier i den andre listen og strengverdiene i den første indekslisten. I det tredje eksemplet oppretter vi en DataFrame og bruker "Value_Count ()" med sin parameter "Index_sort". Strategiene som brukes i artikkelen er relativt grunnleggende og brukervennlige.