Pandas konverterer kolonne til int

Pandas konverterer kolonne til int
“Databehandling og vurdering blir gjort tilgjengelig av Python -programvarepakken kjent som Pandas. En datatype er en underliggende byggestein som dataspråk bruker for å forstå hvordan du lagrer og endrer data. Når en Pandas -dataramme opprettes med utvendige data, er numeriske kolonner vanligvis betegnet som datatypeobjekter i stedet for Int eller Float, noe som gjør det utfordrende å utføre numeriske beregninger på dem.

Vi viser deg hvordan du konverterer en Pandas -kolonne til en int i dette stykket og vil diskutere forskjellige metoder for å oppnå ønsket utgang i dette stykke skriving.”

Eksempel 1: Konverter Pandas -kolonnen til å bruke Pandas astype () -funksjonen

Den første tilnærmingen vi skal ansette her for å konvertere Pandas DataFrame til Int bruker AstType () -metoden fra Pythons Pandas Library. Vi kan levere alle Python-, Numpy- eller Pandas -datatype for å endre typen av alle kolonnene i en DataFrame, eller vi kan passere en ordbok med kolonnenavn som nøkler så vel som datatype som verdier for å endre typen utvalgte kolonner.

Her lar AstType () -metoden oss spesifisere datatypen vi trenger. Det er ganske tilpasningsdyktig ved at du kan prøve å bytte fra en art til en annen.

Syntaksen til AstType () -funksjonen, som gjør det mulig å konvertere kolonnetype til Int, er som følger.

La oss forstå parametrene til denne funksjonen en etter en.

Den første parameteren her er "dtype" som refererer til datatype. Hele Pandas -objektet kan konverteres til riktig type ved bruk av DType eller Python -type. Motsatt kan du konvertere en enkelt eller multippel av kolonnene i en dataaframe til en bestemt type for den kolonnen ved å bruke syntaksen “[Colmn: dtype,…]” hvor kolonnen er navnet på kolonnen mens dtype er en NP.dtype eller til og med python -type. Den andre parameteren er "Copy". Det krever boolske verdier som input. Som standard brukes True. Kopieringsverdien må være sant for å returnere en kopi. Den siste parameteren for AstType () -metoden er "Feil". Både “heve” og “ignorere” er mulig. Imidlertid er "heve" standardinnstillingen for denne parameteren.

Konvertering av en enkelt kolonne med en Pandas dataaframe til en int som bruker AstType () -metode

I denne illustrasjonen vil vi endre datatypen til en enkelt kolonne i dataaframe til int. La oss se på hvordan det fungerer.

Importer først Pandas -biblioteket til Python -filen og tilordner deretter aliaset til PD for å benytte Pandas -funksjonene. Når vi er ferdig med det, har vi nå opprettet et DataFrame -objekt og kalt det en "ramme", og tildelt det utgangen fra å kalle DataFrame -funksjonen, som brukes til å generere en Pandas DataFrame. PD.DataFrame -funksjon initialisert med tre kolonner, “Student”, “Marks” og “Poeng” påkalles. Vi har tildelt samme verdi lengde for hver kolonne i dataaframet. PRINT () -funksjonen brukes til å skrive ut Pandas DataFrame.

Du kan se DataFrame med tre kolonner i bildet nedenfor:

Når DataFrame er blitt opprettet, vil vi deretter sjekke datatypene for alle kolonnene.

Datatypen til Pandas DataFrame kan vises ved å bruke egenskapen “Dtypes”. For å påkalle denne egenskapen, skriv navnet på DataFrame -objektet vi har opprettet ovenfor med “.dtype ”eiendom; I vårt eksempel er det “ramme.dypes ”. Så det vil sjekke datatypene for den spesifiserte DataFrame. Når vi vil se datatypene, må vi skrive “ramme.dtypes ”inne i selene på print () -funksjonen.

PRINT () -funksjonen med DTYPES -egenskapen vil få oss datatyper av alle kolonnene i "Frame" DataFrame.

Du kan se utgangsbildet som viser tre kolonner, alle med datatypen "Objekt".

Vi vil nå lære å endre datatypen til DataFrame ved å konvertere den forhåndsdefinerte datatypen til int. For å oppnå ønsket datatype, må vi bruke metoden “AstType ()”. Mellom parentesene gir vi datatypen som vi ønsker å konvertere den tidligere datatypen. Her skal vi utføre datatype -konvertering for bare en kolonne.

Syntaksen for å bruke denne metoden er å skrive navnet på DataFrame -objektet med kolonnens navn inne i de lange seler “[]”. Sett tildelingsoperatøren “=”, så DataFrame -objektet med samme kolonneavn med “.astype () ”-funksjonen og innenfor seler gir den nødvendige datatypen. Som i ovennevnte tilfelle har vi “Frame ['Marks”].astype (int) ”. Det betyr at vi ønsker å konvertere datatypen til "Marks" -kolonnen fra "Objekt" til "Int". Til slutt vil vi vise den oppdaterte datatypen for "Frame" DataFrame ved å bruke "dtype" -egenskapen inne i utskrift () -funksjonens bukseseler.

Dette gir oss følgende utgang:

Konvertering av mer enn en kolonne i en Pandas dataaframe til en int som bruker AstType () -metode

Som vi har lært å konvertere pandas enkeltkolonne i en dataaframe til en int, vil vi nå få på å lære å konvertere flere kolonnes datatype -konvertering til int.

Vi vil bruke den samme DataFrame som vi utarbeidet i det første eksemplet for dette tilfellet. For å sjekke datatypen til DataFrame, brukes Dypes -egenskapen. I forrige eksempel ga vi en kolonne som vi ønsket å konvertere til en int; Imidlertid, der vi trengte å endre datatypen på mer enn en kolonne. Kolonnene vi har valgt å endre datatypen til er "merker" og "poeng".

Med DataFrame -objektet har vi gitt navnet på begge kolonnene. Og tildelt den utgangen av å påkalle "astype ()" -funksjonen. Vi har satt datatypen til Int i AstType () -metoden. Du kan velge til og med 3 eller flere kolonner i henhold til ditt krav om å endre datatypen. Når vi utfører metoden Print (), har vi gitt navnet på DataFrame -objektet med DTTYPE -egenskapen slik at den viser den nye datatypen til kolonnene i DataFrame “Frame”.

Terminalen viser en utgang som inneholder en dataaframe, den innledende og faktiske datatypen til hver kolonne i DataFrame, og deretter viser den den oppdaterte datatypen til "merkene" og "poeng" -kolonnene.

Eksempel 2: Konverter pandas -kolonnen til å bruke Pandas to_numeric () -funksjonen

Å bruke Pandas to_numeric -funksjon er en av de fineste teknikkene for å konvertere enkelt- eller flere kolonner i en dataaFrame til numeriske verdier. Denne metoden vil forsøke å konvertere strenger eller andre ikke-numeriske elementer til akseptabelt heltall eller flytende punktverdier.

La oss se dens praktiske implementering.

For demonstrasjon av denne metoden opprettet vi først en ordbok "data" som inneholder tre strenger, "navn", "score" og "forsøk". Vi har ansatt pandaene.DataFrame () -metode for å konvertere dette dikten til et dataaframe og lagre denne dataaframe til et dataaframe -objekt “demo”. Vi sjekket deretter denne DataFrames datatype av DType -egenskapen i print () -funksjonen. Vi har valgt kolonnen "poengsum" hvis datatype vi ønsker å endre til int. Vi benyttet oss av Pandas to_numeric () -funksjonen, og innenfor seler ga vi DataFrame -objektet med kolonnenavnet. Til slutt vil utskriftserklæringen med DTTYPE -egenskapen vise den oppdaterte datatypen til DataFrame.

Dette er utgangsbildet:

Konklusjon

I denne artikkelen har vi prøvd å gjøre deg kjent med konseptet med å konvertere en DataFrames datatype til Int. Vi benyttet oss av to pandasfunksjoner til nevnte formål. For den første tilnærmingen har vi implementert to praktiske koder på Spyder Tool så vel som for den andre illustrasjonen. Praksis vil gjøre konseptene dine sterke, og kunnskapen din vil bli bedre.