Pandas datoområde

Pandas datoområde
Tidsseriedata er datasett akkumulert med periodiske eller kontinuerlige tidsintervaller. Tidsseriedata brukes til å spore en langsiktig prediksjon, oppdage et tidsavhengig mønster, eller spore sesongmessighet.

Python-datamanipulering og analysemodul “Pandas” er godt anerkjent. Pandas tilbyr en metode som heter “Date_range ()” som kan produsere en rekke datoer eller tidsintervaller. Hvis du har å gjøre med tidsserie-data, er Panda “date_range ()” en fin måte å gruppere datoer etter dager, uker eller måneder.

Pandas date_range () metode

“PD.Date_range () ”er en av Pandas 'standardfunksjoner som returnerer en definert frekvens“ DateTimeIndex ”.

Denne metoden kan brukes i følgende syntaks:

Vi vil kort beskrive parametrene til denne funksjonen her.

Syntaksens første parameter vist i forrige øyeblikksbilde er "start". For å konstruere datoområdet, brukes dette argumentet til å spesifisere den nedre eller venstre bundne. De "slutt" er den øvre eller høyre bundet for å produsere datoområdet. De "periode" Angir periodetall eller ønsket datanummer. De “Freq” er intervallet (trinnstørrelse) mellom to påfølgende datoer. De “TZ” er datoenes tidssone. Datetimes er naive som standard, uten begrep om tidssone. De “Normaliser” brukes til å normalisere start- og sluttdatoer til midnatt før du produserer et datoområde. "Navnet" er navnet på DateTimeIndex som returnerer. De "lukket" Parameteren lukker intervallet til 'venstre', høyre 'eller begge sider av den medfølgende frekvensen. Standardinnstillingen er “Ingen”.

I denne artikkelen vil vi forklare utførelsen av Python -kodene med noen av disse parametrene til “PD.datointervall()".

Eksempel 1: Bruke PD.date_range () -metode for å generere et grunnleggende datoområde

I dette eksemplet vil du bruke den grunnleggende bruken av Pandas -metoden “PD.date_range () ”for å produsere et datoområde med individuelle dager. La oss komme i gang.

For å begynne utførelsen av denne illustrasjonen, må vi ha en plattform der vi kan implementere Python -kodene. Av alle valgene angående verktøyene eller programvaren som gir oss Python -støttende miljø, har vi bestemt oss for å velge "Spyder" -verktøyet. Dette verktøyet må først lastes ned og installeres på systemet du jobber med. Du har kanskje brukt et Windows -operativsystem eller Linux; Alle operativsystemene støtter det. Du må laste ned det påfølgende oppsettet. Når du treffer ikonet til verktøyet, lanseres grensesnittet. Nå har vi satt opp alt som er nødvendig for å utføre koden. For å begynne å skrive skriptet, har vi lansert en ny Python -fil ved å velge alternativet "Ny fil" eller bare holde og gi ut “Ctrl+N” -tastene sammen. Filen åpnes med ".py ”utvidelse, som refererer til Python -katalogen.

Nå begynner vi å skrive Python -koden vår på den. Tittelen på denne opplæringen kan ha gitt deg et hint om at vi vil jobbe med noen Pandas -funksjoner. “Pandas” er et bibliotek med Python. For å bruke funksjonen til et hvilket som helst bibliotek, må vi først laste biblioteket inn i filen. Så vi lastet først Pandas -biblioteket ved å bruke skriptet "Importer Pandas som PD". Dette vil importere alle Pandas -funksjoner til Python -filen. Nå er de tilgjengelige for oss ved å bruke "PD". Hovedkoden vår begynner her.

Vi har brukt “PD.Date_range () ”-metode levert av Pandas -biblioteket for å opprette et grunnleggende datoområde. Mellom denne funksjonens parenteser har vi brukt to parametere, "Start" og "End". "Start" -parameteren spesifiserer hvor datoområdet starter, som vi har gitt "start =" 2/2/2022 "". "Slutt" -parameteren tar i nedre sprett der datoområdet vil ende, som vi setter "slutt =" 2/12/2022 "". Så datoområdet starter på 2nd av februar 2022 og slutter på 12th av februar 2022, og skaper et datoområde på 10 dager.

For å lagre utgangen som genereres fra å påkalle “PD.date_range () "-metode, vi har opprettet en variabel" display ". Nå lagres datoområdet i denne variabelen. For å vise dette datoområdet på Python -konsollen, må vi kalle Python -metoden “Print ()”. Dette vil vise utgangen som er lagret i "Display" -variabelen i form av DateTimeIndex.

Når vi kjører denne koden ved å bruke alternativet "Kjør fil" på "Spyder" -verktøyet, viser konsollen oss et datoområde på 10 dager. Alle datoene fra “2/2/2022” til “2/12/2022” har blitt vist en etter en. Den enkleste anvendelsen av denne teknikken er denne.

Eksempel 2: Bruke PD.date_range () -metode for å generere et datoområde med en spesifisert periode

Denne illustrasjonen vil demonstrere hvordan du genererer et datoområde med et bestemt antall jevnt distribuerte perioder mellom en spesifisert start- og sluttdato.

Vi har først importert Pandas -biblioteket som "Importer Pandas som PD". For å opprette et datoområde, “PD.date_range () ”-metoden påkalles. Vi har brukt denne metoden med tre parametere for denne illustrasjonen. Disse parametrene er "start", "slutt" og "perioden". "Start" -parameteren er satt til å starte datoområdet fra "4/6/2022", og "slutt" -parameteren er spesifisert for å avslutte datoområdet på "4/16/2022". Den tredje parameteren her er "perioden", som vil skape et mønster av datoer med den medfølgende lengden på "6" i vårt eksempel.

Vi har laget et variabelt “intervall” for å lagre datoområdet generert fra “PD.datointervall()". Nå må vi stille ut resultatet på konsollen. For dette benyttet vi “Print ()” -funksjonen.

Datoområdet med en periode på 6 generert fra “PD.date_range () ”-metode vises på konsollen når vi utfører det forrige programmet.

Eksempel nr. 3: Bruke PD.date_range () -metode for å generere et datoområde med spesifikk frekvens

Datoområdet kan også genereres ved å spesifisere en bestemt frekvens. Vi vil se det i denne illustrasjonen.

Som nevnt i de foregående eksemplene, er det første og fremste kravet til koden her å importere det aktuelle biblioteket, som er pandaer. Så påkalte vi “PD.date_range () ”-metode for å opprette et datoområde. Vi har påkalt denne funksjonen med tre parametere “Start”, “Freq” og “Period”. Vi har spesifisert startdatoområdet som "11/11/2022", og deretter ga vi frekvensen, som er intervallet mellom to påfølgende datoer. Som standard er det satt til “D”, men her har vi spesifisert det til “MS”, og skaper intervaller mellom hver måned.

Den siste parameteren vi har brukt her er "periode" og er satt til "8". Dette betyr at et datoområde vil bli generert fra den spesifiserte datoen til perioden 8 som tar en frekvens på en måned. Vi har opprettet en variabel "måned" for å lagre utdataene, og til slutt blir "print ()" -funksjonen påkalt for å skrive ut datoområdet.

Dette gir utgangsdatoområdet for åtte perioder som er opprettet i frekvensen av en måned fra den angitte datoen.

Konklusjon

Denne opplæringen er basert på et veldig nyttig og viktig konsept av pandaer om å lage et datoområde. Vi har forklart ideen om å sette opp et datoområde i Python. Pandas “PD.date_range () ”-metode er den beste tilnærmingen som skal brukes til dette formålet. Denne metoden gir oss en rekke parametere som brukes i henhold til behovet. Vi har implementert denne metoden praktisk talt på "Spyder" -verktøyet og utdypet også hvert trinn vi tok under utførelsesprosessen. Å følge hvert trinn vil hjelpe deg med å generere ønsket datoområde.