Pandas astype

Pandas astype
Pandas -objektet er vanligvis støpt til en spesifikk dype.astype () -funksjon ved bruk av AstType () -metoden. Dette verktøyet kan også endre enhver kvalifisert kolonne til en kategorisk type. Vi bruker den når vi ønsker å konvertere en spesifikk kolonne -datatype til en annen datatype. Innspillet til Python -ordboken kan også brukes til å endre flere kolonnetyper samtidig. Kolonnenavnet og de nye datatypene vi ønsker å bruke i kolonnene er representert i henholdsvis ordboken med nøkkel- og verdiselskapene. Teknikken til Pandas astype har flere applikasjoner.

Dette verktøyet lar oss endre datatypen til:

  1. En serie pandaer
  2. Hver kolonne i en Pandas DataFrame
  3. Flere kolonner i en dataaframe

Hvordan bruke AstType () -funksjonen i pandaer

For å bruke AstType () -funksjonen, må vi først forstå syntaks. Begge serieobjekter og dataframmer kan brukes med AstType -metoden. Syntaksen for astype på serien og astype på kolonnene til DataFrame er som følger:

Syntaks av AstType () -funksjon på serie

Bare skriv serienavnet etterfulgt av AstType () -funksjonens "Dot Syntax" for å påkalle metoden for en serie.

Syntaks:

Syntaks av AstType () -funksjon på DataFrame -kolonner

Vi må først skrive datarammenes navn før vi kaller AstType () -metoden “Dot Syntax”.

Syntaks:

Dataramme.astype (dtype, copy = true, feil = "heve", ** kwargs)

dtype: Pandas -objektet er støpt til samme type ved hjelp av Python -typen eller Numpy.dtype. En eller flere DataFrames kolonner kan støpes til kolonnespesifikke typer. Det er også mulig å bruke col: dtype,? Som et alternativ, der Col representerer kolonnens navn og dtype er en numpy.

kopiere: Det gir en kopi hvis kopi = sant. Når kopi = falsk, må vi være forsiktige siden endringer i verdier kan spre seg til andre gjenstander av pandaer.

feil: Hvis du prøver å bruke en feil eller ugyldig datatype på objektet, vil teknikken enten øke et unntak eller ikke, avhengig av verdien på feilparameteren. De to svarene på dette er som følger:

heve(Hvis det er et problem, vil det heve et unntak)

overse (Hvis det er et problem, vil det undertrykke unntak. det vil returnere det opprinnelige objektet hvis det er en feil)

I AstType () funksjon Raise = True som standard.

Kwargs: Konstruktøren mottar et nøkkelordargument (Kwargs) som en inngang.

Nå har vi sett syntaksen. Vi vil lære bruken av AstType () -funksjonen i følgende eksempler.

Eksempel 1: Endring av datatype av serier med pandaer

Først av alt, vi vil importere Pandas -moduler, så bruker vi DataFrame () -funksjonen til å lage datasettet, og passerer den en ordbok med kolonnenavn og noen lister som inneholder informasjonen vi ønsker at variablene skal inneholde:

I tillegg lager vi en serie som utelukkende har DataFrames utgiftervariabel:

For å illustrere vår DataFrame, vil vi bruke PRINT () -funksjonen.

Det er fire variabler: navn, land, salg og utgifter. Som et resultat inkluderer DataFrame prøve- eller dummy -salg og utgifter informasjon for noen individer fra forskjellige land.

La oss sjekke datatypen til serien vår som heter E_Variable ved hjelp av dtype.

Dette indikerer at vår E_Variable -serie har datatypen "Objekt". Vi vil nå endre serien DataType til INT64 ved hjelp av Pandas AstType.

Utgangens datatype er dtype: int64, som du kan se om du følger nøye med på utgangens bunn. Husk at E -variabelen ikke er endret direkte av dette. Fordi utgangen fra AstType () ble skrevet ut til konsollen, har serien E_Variable fremdeles datatypen til “Object”. Vi måtte tilordne utdataene til det faktiske variabelen med følgende kode hvis vi ønsket å endre dataene permanent direkte:

Nå blir datatypen til serien vår endret permanent.

Eksempel 2: Endring av DataFrame -kolonnens datatype

Vi vil nå operere på en DataFrames kolonne. Sammenligning av dette med eksempel 1, der vi jobbet med en Pandas -serie, vil være litt annerledes. I dette tilfellet skal vi jobbe med en dataaframe. Derfor vil syntaksen avvike litt. Først vil vi sjekke den nåværende datatypen til vår DataFrame S_Data. For å sjekke datatypen til DataFrame, vil vi bruke dtype.

For å undersøke utdataens datastyper, vil vi i tillegg bruke .Dypes attributt.

Du vil se at Sales datatype er endret til INT64 i utgangen. For å oppnå dette brukte vi AstType -funksjonen og passerte et argument fra en ordbok. Kolonnens navn vises på ordbokens venstre side, og den nye datatypen vises til høyre. La oss endre datatypen til en annen kolonne i vår datafram.

Datatypen til Nation Column er blitt fullstendig transformert til "streng", som du kan se.

Eksempel 3: Endre datatype for flere kolonner i en DataFrame

La oss nå endre datatypen til et antall av våre DataFrames kolonner. Dette kan gjøres på en måte som ligner på hvordan vi endret kolonnen i eksempel 2. Vi vil ansette en annen ordbok i dette eksemplet.

Nok en gang, la oss undersøke de originale datatypene med bruk av .DTYPE -attributt før du utfører operasjonen:

Nok en gang, merk at objektet er datatypen til hver kolonne i DataFrame.

Vi vil nå endre datatypen til flere kolonner. For å oppnå dette, oppretter vi en ordbok med variabelenes navn og datatype som sin "nøkkel" og "verdi" -par. Etter attributtet AstType, vil vi i tillegg ringe .Dypes attributt slik at vi kan observere de nye datatypene.

Du vil se at tre kolonnes datatyper har endret seg i utgangen. Datatypen til landskolonnen blir endret til streng, datatypen for salg endres til INT64, og datatypen på utgifter blir endret til INT32.

I parentesen la vi til en ordbok og påkalte AstType -metoden. Noen nøkkel-/verdipar med formatet “Kolonne”: “Datatype” var i ordboken. De nye datatypene og kolonnenavnene trenger bare å være gitt i en ordbok.

Eksempel 4: Støping av datatyper av alle kolonnene i en dataaframe

Pandas astype () -metoden standard prøver å kaste hver DataFrame -kolonne til Python -typene (int, tekst, float, date og datetime) eller numpy.dtype som leveres. Operasjonen mislykkes, og feilen “ValueError: Ugyldig bokstavelig” heves hvis noen kolonner ikke kan støpes på grunn av ugyldige data eller NAN. La oss for dette eksemplet lage en ny DataFrame fra Dictionaries.

Alle DataFrame -kolonnens navn og dtyper returneres av DataFrame.dypesfunksjon. Husk at hver kolonne har en objekttype i DataFrame vist ovenfor. Nå vil vi kaste datatypen til streng.

Som tidligere sett, oppdateres dtypen for alle kolonnene i DF DataFrame.

Konklusjon

I denne opplæringen prøvde vi å lære deg hvordan du bruker Python Pandas Dataframe.astype () -metode. Vi endret datatypen på DataFrames kolonne til en annen datatype og undersøkte deretter DataFrame. Vi implementerte noen få eksempler i denne artikkelen, slik at du kanskje kan endre seriens datatype og dataramkolonnenes datatype ved hjelp av Pandas astype -metoden i Python.