Pandas -serien til CSV

Pandas -serien til CSV

Seriene.to_csv () ”-metode i Pandas gir ut det spesifiserte serieobjektet i en komma-separert verdier (CSV) -notasjon. Denne funksjonen tar ganske enkelt verdiene fra en serie og endrer formatet deres ved å legge til komma for separasjon av indeks- og kolonneverdier.

For å bruke denne funksjonen, må vi bruke følgende syntaks:

Denne artikkelen vil gi deg to forskjellige teknikker for å lære måtene å bruke denne metoden i et Python -program.

Eksempel 1: Bruke serien.to_csv () metode for å konvertere en serie med DateTimeIndex til komma-separerte verdier

For å endre en serie i et CSV -format, bruker vi “Series.to_csv () ”-funksjon. Denne illustrasjonen vil generere en serie med en DateTimeIndex og deretter konvertere den til et komma-separert verdiskformat.

For å sette denne metoden i drift, må vi ha verktøy som støtter Python -programmering. "Spyder" -verktøyet er valgt å samle kodene. For å skrive skriptet på det, lanserte vi først det installerte verktøyet i systemet vårt. Python -programmet trenger et bibliotek for å utøve sine metoder for å oppnå det nødvendige resultatet. Biblioteket vi har lastet her er "Pandas". I samme kodelinje blir dette bibliotekets alias identifisert som "PD". Så uansett hvor i programmet, må vi skrive "pandas" for å få tilgang til en funksjon. Vi ville i stedet skrevet “PD”.

Det første trinnet for å starte med koden er å generere en Pandas -serie. Vi må skrive “PD” for å bruke seriens opprettelsesmetode fra Pandas. “PD.Serie () ”-funksjon kalles for å konstruere en serie med de spesifiserte verdiene. Verdiene vi har gitt for serien er “Istanbul”, “Izmir”, “Ankara”, “Ankara”, “Antalya”, “Konya” og “Bursa”. Hvis du vil oppgi et navn til denne rekke verdier, kan du gjøre det ved å bruke "Navn" -parameteren. Her har vi navngitt denne rekke verdier “Cities”, da den holder navnene på 6 byer. For å lagre denne serien er det opprettet et serieobjekt "Tyrkia".

For å lage en DateTimeIndex, har vi påkalt “PD.date_range () ”-metode. Mellom parentesene i denne funksjonen har vi bestått 4 argumenter som er: “Start”, “Freq”, “Periods” og “TZ”.

Argumentet "start" tar inn en dato og tid for å begynne å generere et datoområde fra det. Her har vi spesifisert startdato og klokkeslett som “2022-03-02 02:30”. "Freq" -parameteren klassifiserer frekvensen for datoområdet. Så vi ga det verdien “D”. Nå vil det opprette et datoområde på daglig frekvens. "Period" -argumentet er satt til “6”, noe som betyr at det vil generere et datoområde i 6 dager. Den siste parameteren er "TZ" som spesifiserer tidssonen for det spesifiserte området. Vi har spesifisert tidssonen for “Asia/Istanbul”.

For å lagre dette datoområdet, har vi laget en variabel "DateTime" -variabel. For å sette DateTimeIndex, har vi brukt “Seriene.indeks ”eiendom. Navnet på serien “Tyrkia” er levert med “.indeks ”-egenskaper og tilordnet den dato -tidsområdet som er lagret i" DateTime "-variabelen. Dermed vil "indeks" -egenskapen ta verdiene fra "DateTime" -variabelen og gjøre dem til indekslisten over "Tyrkia" -serien. Til slutt, for å se output -serien, har vi brukt "print ()" -metoden og passert "Tyrkia" -serien som inngang til den for å vise innholdet.

Vi har nettopp trykket på alternativet "Run File" for å utføre skriptet. Følgelig kan vi se en serie med DateTimeIndex med utgangspunkt i “2022-03-02 02: 30: 00+03: 00” og slutter på “2022-03-07 02: 30: 00+03: 00” Opprette en periode av 6 dager. Under serien er "Freq: D", navnet på matriselisten "Cities" og DTTYPE "Objekt" nevnt.

Nå vil vi lære å konvertere denne serien som vi bare har sett i øyeblikksbildet over til et CSV -format. For å endre serien til komma-separerte verdier, har vi en metode levert av Pandas-modulen som er “Series.to_csv () ”. Denne metoden tar verdiene til den medfølgende serien og legger til komma mellom kolonnens verdier.

Seriene.to_csv () ”-funksjonen kalles. Navnet på serien som vi ønsker å konvertere er nevnt med metoden som “Tyrkia.to_csv () ”. For å bevare de komma-separerte verdiene, har vi laget en variabel “komma_separert” og deretter lagt innholdet på utgangsvinduet ved å påkalle "print ()" -funksjonen ".

Her er serien vår i CSV -format. Vi kan se i øyeblikksbildet at indeksen og serieverdiene er blitt skilt ved bruk av kommaene i dem.

Eksempel 2: Bruke serien.TO_CSV () -metode for å konvertere en serie med NAN-verdier til komma-separerte verdier

Den andre teknikken for å utøve “serien.To_csv () ”-metoden er å bruke denne metoden for å konvertere en serie som holder noen nulloppføringer i et CSV -format.

Vi har opprinnelig importert de nødvendige pakkene. "PD" er laget til et alias for pandaer og "NP" som et alias for Numpy. Numpy Toolkit er lastet her fordi vi vil lage noen nulloppføringer i serien vår ved å bruke “NP.Nan ”mens du oppretter den ved hjelp av Pandas“ PD.Serie () ”-metode.

“PD.Serie () ”-funksjonen påberopes for å bygge en Pandas -serie med disse verdiene:“ Nile ”,“ Amazon ”, NP.Nan, “Ganges”, “Mississippi”, “NP.Nan ”,“ Yangtze ”,“ Donau ”,“ Mekong ”,“ NP.Nan ”, og“ Volga ”. Det er totalt 21 verdier definert for serien hvorav 3 oppføringer holder “NP.Nan ”-verdier som betyr at 3 verdier mangler i serien. Egenskapen "Navn" spesifiserer navnet for denne rekke verdier som vi ga "titler". Egenskapen "indeks" brukes til å angi den brukerdefinerte indekslisten i stedet for å gå med standardlisten.

Her ønsker vi indekslisten med verdiene “10”, “11”, “12”, “13”, “14”, “16”, “17”, “18”, “19”, “20”, og 21 ”. Nå vil serien vår ha indekslisten som starter fra “10” i stedet for “0”. Lagre nå denne serien slik at vi kan bruke den senere i programmet. Vi har initialisert et serieobjekt “elver” og tildeler det utgangsserien generert fra å kalle “PD.Serie () ”-metode. Serien kan sees ved å sette den ut på skjermen ved hjelp av "print ()" -funksjonen av Python.

Den gjengitte utgangen på terminalen trykket en serie hvis indeksliste starter fra 10 og slutter på 21, noe som betyr at serien har 21 verdier.

Serien vil bli forvandlet til et CSV -format med “Series.to_csv () ”-metode.

Vi har påberopt "serien.to_csv () ”-metode med vår serie“ Tyrkia ”. Derfor vil denne metoden ta verdiene fra "Tyrkia" -serien og konvertere dem til et komma-separert verdiskformat. Resultatet lagres i variabelen “konvertert_csv”. Og til syvende og sist er den konverterte serien skrevet ut ved hjelp av "Print ()" -funksjonen.

I øyeblikksbildet av utfallet nedenfor, kan du se at verdiene til serien nå er endret på en måte der et komma brukes til å skille dem fra indekslisten. Dessuten, der verdiene mangler, er bare indeksnummeret trykt med komma.

Konklusjon

Endringen av en Pandas -serie til et CSV -format er en praktisk tilnærming. Dette kan oppnås ved å bruke Pandas "-serien.to_csv () ”-funksjon. Denne guiden ble brakt ut to teknikker for å bruke denne metoden. I den første illustrasjonen har vi påkalt denne metoden for å konvertere en serie med en DateTimeIndex til et komma-separert verdiskformat. 2. forekomst brukte “serien.to_csv () ”-funksjon for å endre en serie med noen manglende oppføringer i et CSV -format. Begge teknikkene er praktisk talt implementert ved bruk av "Spyder" -verktøyet på Windows -operativsystemet.