Pandas Extract år fra DateTime

Pandas Extract år fra DateTime
“Pandas” er en sterk Python -pakke som brukes til høy effektivitet og beregningshastighet. En datetime -kolonne i “Pandas” gir en omfattende kilde til tidsseriedata som kan være fordelaktig. For eksempel kan det hende du vil se dataene dine på årlig eller månedlig basis. Å lære å raskt trekke ut slik informasjon kan være veldig gunstig når du arbeider med datarammer som inneholder datetime -kolonne (er). I denne artikkelen skal vi utforske hvordan du bruker pandaer for å hente årets data fra DataFrames datetime -kolonne.

Pandas Extract år fra DateTime:

“Pandas” datetime -kolonner inneholder attributter som år, måned, dag og så videre. For å hente året fra en datarammes datetime -kolonne, kan du bare se den "år" -attributtet. “Pandas” har en rekke enkle metoder for å trekke ut komponenter fra et datetime -objekt, hvorav vi implementerer to i denne opplæringen. Syntaks for disse metodene er gitt nedenfor:

PD.DateTimeIndex ().år

df.dt.år

Vi vil nå se den praktiske implementeringen av disse Python -metodene.

Eksempel nr. 1: Bruker “PD.DateTimeIndex ().År ”-metode for å trekke ut år fra DataFrames datetime -kolonne

I denne illustrasjonen vil vi bruke den første metoden som er nevnt ovenfor, “PD.DateTimeIndex ().år for å hente ut år fra datarammen.

For å praktisk implementere denne metoden i Python -programmet, har vi brukt "Spyder" -verktøyet. Vi begynte å skrive skriptet i Python -filen. Den første og grunnleggende tingen her er å aktivere Pandas verktøysett. Python blir bedt om å laste Pandas -biblioteket i vårt nåværende arbeidsmiljø av Import Pandas -delen av koden. Kodenes "PD" -del instruerer Python å tilordne pandas aliaset til "PD". Slik har vi tilgang til alle funksjonene i Pandas. Vi opprettet da en dataramme.

Datarammen genereres ved å bruke Pandas -metoden “PD.Dataramme()". Vi har påkalt denne metoden og initialisert den med fire kolonner: “Tittel”, “Forelesninger”, “karakter” og “start_date”. Den første kolonnen, "tittel" lagrer titlene på forskjellige programmeringsspråk. Dette er “C ++”, “Python”, “Java” og “R”. Den andre kolonnen, vi har opprettet i datarammen er "Forelesninger" og holder antall forelesninger for hvert kurs som "30", "26", "35" og "20". Kolonnen "karakter" forteller nivået som disse kursene blir tilbudt, jeg.e., “12”, '10 ”,“ 14 ”og“ 16 ”. Den siste kolonnen er kjernedataene til denne datarammen fordi den lagrer datatverdiene som denne opplæringen er basert på. Denne kolonnen har verdier “02-02-2022”, “09-01-2023”, “07-29-2024”, og “11-24-2025” som startdato for hvert kurs.

Lengden på kolonnen vi har tatt for hver kolonne er fire. Vi trenger et datarammeobjekt for å lagre innholdet av datarammen. Så vi har opprettet et datarammeobjekt “Extract” og gitt det resultatet som vil bli oppnådd ved å ringe “PD.DataFrame () ”-metode. Pythons mest anvendte metode for å vise utdataene, "Print ()" påberopes her for å utvise innholdet i "Extract" datarammeobjektet.


Når vi utfører programmet som er nevnt over, får vi en DataFrame som vises på konsollen som har fire kolonner. Her kan du se at "start_date" -kolonnen lagrer datetime -verdiene.


Nå må vi gå frem for å begynne med hovedoppgaven vår som vi har generert datarammen. Vi vil trekke ut året fra datetime -kolonnen i vår dataramme ved å bruke “PD. DateTimeIndex ().år ”-metode her.

Vi har påkalt “PD.DateTimeIndex ().År ”-metode rett etter å ha opprettet og skrevet ut datarammen. “.År ”spesifiserer at vi bruker denne metoden for å trekke ut året fra den aktuelle datetime -kolonnen. Det kan ha andre attributter også, jeg.e., “.måned ”for å trekke ut månedene,“.uke ”for å hente ukene,“.dag ”for å få dagene, og mange andre. Vi har kalt funksjonen, og mellom dens parenteser har vi gitt navnet på DataFrame med kolonnens navn som funksjonen blir brukt for å trekke ut årene fra den.

Datarammeens navn “Extract” leveres med kolonnen “start_date” med datatimeverdier. Når denne funksjonen påberopes, vil den komme inn i "Extract" datarammen, og fra "start_date" -kolonnen, hente årene. Nå, for å lagre disse årene, har vi laget en ny kolonne "år" i vår "ekstrakt" dataramme. Så årene hentet fra å ringe “PD.DateTimeIndex ().År ”vil bli lagret i spalten“ År ”. Vi benyttet oss av “Print ()” -metoden for å vise den oppdaterte datarammen.


Her har vi vår resulterende dataramme. Vi kan se at denne DataFrame har en ny kolonne "år" som holder årene eksplisitt, hentet fra "start_date" -kolonnen som tilsvarer hver verdi den inneholder.

Eksempel nr. 2: Bruker “DF.dt.År ”-metode for å trekke ut år fra datarammens datetime -kolonne

Denne demonstrasjonen vil forklare hvordan du kan trekke ut året fra en datetime -kolonne som bruker Pandas “DF.dt.år ”-metode. La oss se hvordan det fungerer.

Vi åpnet nettopp “Spyder” -verktøyet og begynte å skrive koden. Vi har lastet Pandas -biblioteket fordi metoden vi ønsker å bruke her er en Pandas -funksjon, og vi kan bare bruke den hvis vi har dette biblioteket lastet inn i vår nåværende Python -fil. Vi opprettet deretter en dataramme ved å bruke “PD.DataFrame () ”-metode. Vi har påkalt funksjonen og opprettet tre kolonner i den, som er "navn", "fødsels_dato" og "alder". Kolonnen "Navn" lagrer navnene på noen mennesker, som er "Parker", "Jack", "Leo" og "Rabecca". "Birth_date" lagrer fødselsdatoen til disse menneskene som "02-02-1989", "09-01-1996", "07-29-1981", og "11-24-2001".

"Alder" -kolonnen har den nåværende alderen på dem som henholdsvis "32", "26", "40" og "21". Vi har opprettet et datarammeobjekt “Biodata” for å lagre utdataene fra “PD.DataFrame () ”-funksjon. "Print ()" -metoden blir deretter påkalt for å vise den resulterende datarammen som er lagret i "Biodata" -objektet.


Når vi kjører dette kodebiten, får vi en dataramme med tre medfølgende kolonner, som kan sees i øyeblikksbildet vedlagt nedenfor.


Nå vil vi bruke denne datarammen for å trekke ut året fra sin datetime -kolonne ved å bruke “DF.dt.år ”-metode. Her inneholder kolonnen “Birth_Date” datoene med året, så vi må bruke funksjonen på denne spesielle kolonnen for å trekke ut året. For å bruke denne kolonnen, må vi først konvertere den til DateTime -format. Fordi funksjonen vi bruker her inneholder en "DT" -attributt, som er for DateTime. Så den vil bare utføres hvis den spesifiserte kolonnen blir konvertert til datetime. For å gjøre det, har vi brukt pandaene “to_dateTime ()” -metoden og gitt navnet på datarammen med kolonnens navn mellom parentesene.

Nå er datatypen til kolonnen “Birth_date” endret til Datetime. Vi kalte da “DF.dt.år ”-funksjon. Vi har nevnt navnet på datarammen med kolonnenavnet og ".dt.år ”forlengelse. For å lagre dette utvinnede verdiåret i datarammen, har vi opprettet en ny kolonne “År” i “Biodata”. Til slutt viste vi DataFrame ved hjelp av "print ()" -funksjonen.


Dette gir følgende utfall.

Konklusjon:

Å trekke ut et år fra en datetime -kolonne fra Pandas dataramme er en nyttig øvelse. Pandas lærer oss med noen veldig nyttige og praktiske teknikker for å oppnå ønsket resultat. I denne opplæringen har vi introdusert deg for to teknikker for pandaer for å trekke ut året fra DateTime -kolonnen i en dataramme. Vi utdypet alle detaljer i den praktiske implementeringen av eksemplene koder. Vi har beskrevet og forklart alt vi har brukt i eksempler, slik at du ikke vil møte noen problemer mens du øver på disse metodene for å lære pandaer.