Tidsserie er en type data der vi ser et sett med målinger over en periode. Hver observasjon har sin tidsstempel. Aksjekurser, sensoravlesninger, programobserverte data og andre typer data er eksempler på denne typen data. I denne opplæringen vil vi bruke Seaborn and Pandas -modulen for å plotte tidsserieanalysen i Python. Før vi konstruerer en tidsserie -plott, la oss undersøke noen få konsepter.
Et tidsplott (også kjent som en statistisk graf) viser verdier når de endres over tid. De er som X-Y-grafer. Tidsplott kan imidlertid bare representere tid på x-aksen. Mens X-Y-grafer kan plotte forskjellige “X” -variabler, for eksempel høyde, vekt og alder. Disse tomtene inkluderer ikke kategorier, i motsetning til kakediagrammer og stolpediagrammer. Tidsplott er nyttige for å vise progresjonen av data over tid. For eksempel kan denne typen diagram være nyttig hvis du analyserte data med rare intervaller.
Anta at vi planlegger tidsplott med Panda -modulen. Pandas er et numpy-basert open source-bibliotek. En Python -modul gir mange datastrukturer og metoder for behandling av numeriske og statistiske data. Det er mest kjent for å lage dataimport og analyse betydelig enklere. Pandas er raskt, høytytende og brukervennlig.
Eksempel 1: Opprette en enkel tidsserie -plott ved hjelp av en linjeplott
Vi har brukt Python -moduler for å konstruere tidsserien. Disse modulene inkluderer sjøborn, pandaer og matplotlib -moduler. Etter å ha lagt til disse modulene, har vi laget data ved å kalle Pandas datarammefunksjon og satt inn feltet 'Dato' for x-aksen og tre flere felt for Y-aksen. Dato-feltet har tidsserie-data, og andre felt har bare tilfeldige talllister.
Deretter har vi en plottfunksjon for sjøkabin. Denne linjeplottet oppretter en tidsserie -plott, og vi har definert Xticks -plasseringen med den spesifiserte vinkelen.
Importer matplotlib.Pyplot som PltTimes Series -plottet er gjengitt inne i følgende figur. Denne figuren er en-kolonne tidsserie-plott:
Eksempel 2: Opprette en tidsserie -plott med mange kolonner ved å bruke en linjetak
Den foregående tidsseriegrafen er gjengitt med en enkelt kolonne. Her har vi importert sjøborn-, Panda- og Matplotlib -moduler for å gjengi tidsserieplottet. Deretter har vi laget data som har definert fire felt. Det første feltet er satt med datoene og angir navnedato. I de andre feltene har vi satt bilens navn, som viser salget av bilen på en bestemt dato.
Etter det ringte vi Seaborn Line -plottet to ganger, men med de forskjellige feltnavnene. X-aksen er tildelt med feltdatoen, og Y-aksen tilordnes med BMW- og ALTO-feltet. Vi satte etiketten for y-aksen og triksrotasjonen for x-aksen med en vinkel på 20.
Importer matplotlib.Pyplot som PltTidsserieplottet visualiseres med flere felt i følgende graffigur:
Eksempel 3: Lag flere tidsserieplott ved hjelp av en linjeplott
Vi kan lage flere tidsserier med flere kolonner. Her har vi et eksempel på illustrasjonen der vi har laget de fire tidsserie -plottene med linjeplottfunksjonen. Først har vi laget data i en variabel representert med navnet DF. Deretter har vi laget delplaner for tidsseriegrafen, der vi også har satt figurstørrelsen inne i underplottfunksjonen.
For hvert delplott har vi satt rotasjonen av flått. Innenfor linjeplottet har vi tildelt kolonnene for X- og Y -parametere og angir fargen på hvert underplott ved å oppgi fargenavnene. Det er en ekstra parameter; Tight_layout er satt med verdien som justerer polstring av delplotene.
Importer sjøborn som SNSHer har vi flere tidsserieplottrepresentasjoner med de forskjellige kolonnene og de forskjellige fargelinjene ved å bruke linjeplottet.
Eksempel 4: Lag en tidsserie -plott ved å bruke en bar plot
De observerte verdiene er avbildet i rektangulære stenger ved bruk av en stangplott. Seaborn Barplot () -teknikken brukes til å konstruere bargrafer i Pythons Seaborn -modul. Når du viser kontinuerlige tidsserie-data, kan en stolpeplott brukes.
Deretter har vi angitt dataene for tidsserien ved hjelp av Panda -modulfunksjonen kalt en dataramme. Inne i datarammen setter vi datoene og opprettet en liste over tall som representerer oppmøteprosenten. Med to_dateTime () -funksjonen har vi satt datoformatet for tidsserie -plottene. Vi har også definert størrelsen på figuren på tidsserien. Etter det har vi en Barplot () -funksjon som tar verdiene for X- og Y -parametrene for tidsserien.
Importer pandaer som PDFor tidsserie-data gir følgende graf en alternativ visualisering:
Konklusjon
Dette er en grunnleggende oversikt over hvordan du genererer tidsserier for tidsrelaterte inngang. Når du har flere datapunkter i et spesifikt tidsrom, er et tidsserie -plott en utmerket tilnærming for å representere dataene dine. Fra å lage et lite datasett med Pandas-sekvens til å integrere et virkelighetsdatasett og plotte tidsserier som er avhengig av dine behov, guider denne artikkelen deg gjennom alt du trenger å vite.