Pandas eksport til Excel

Pandas eksport til Excel
Dataframe er kjernekomponenten i nesten alle Pandas -operasjoner. Vanligvis lagrer du data som du importerer fra en fil i et Pandas DataFrame -objekt. Det holder seg inne i DataFrame -objektet selv etter at modifikasjoner er brukt på det. For å få tilgang til data utenfor Python, kan du ofte kreve eksport av dem i et annet format.

I denne opplæringen forklarer vi dere to metoder for å eksportere en Pandas DataFrame til en Excel -fil. Den første teknikken innebærer å påkalle “DF.to_excel () ”for eksport til en Excel -fil. “PD.ExcelWriter () ”-metoden er den andre tilnærmingen som dekkes i denne artikkelen. Denne teknikken skriver objekter til Excel -regnearket og eksporterer dem etterpå til Excel -filen som bruker "til Excel" -metoden.

Eksempel 1: Bruke Pandas DF.to_excel () metode

For å eksportere DataFrame til Excel, trenger vi et forutsetningsbibliotek “OpenPyxl”. Dette biblioteket kan installeres i Python -miljøet ved å kjøre PIP -kommandoen “Pip Install OpenPyxl”.

Fra og med Python -skriptet lastet vi først Pandas -biblioteket. Pandas -modulen importeres som "PD" som er det aliaset for Pandas. For å eksportere datagrammet til Excel, må vi først og fremst opprette en DataFrame. DataFrame -konstruksjon kan oppnås ved å bruke “PD.DataFrame () ”-metode. “PD.DataFrame () ”-metoden påberopes for å generere DataFrame med 3 kolonner“ språk ”,“ poeng ”og“ prosjekter ”. Kolonnen "Språk" lagrer navn på programmeringsspråkene som er "Java", "Python", "C ++", "R", "Kotlin" og "PHP".

Vi har definert heltallstypeverdier for kolonnen “Points” som “10”, “6”, “20”, “15”, “9” og “14”. Den tredje kolonnen “Projects” har antall prosjekter for hvert språk som er “11”, “4”, “8”, “17”, “6” og “5”. Vi har lagret denne DataFrame i DataFrame -objektet “Prog”. For å se denne DataFrame har vi brukt Pythons “Print ()” -metode.

Vi kan utføre skriptet ved å trykke på "Enter+Shift" -tastene sammen eller klikke på "Kjør filen" -knappen. Python -konsollen viser oss en dataaframe med 3 kolonner og 6 rader.

Dataframe er produktivt blitt opprettet. Å eksportere den til Excel -filen er neste oppgave. Som standard, når vi eksporterer en DataFrame til Excel/CSV -fil, lagres den i den gjeldende arbeidskatalogen for vårt Python -miljø. Du kan også endre denne innstillingen ved å gi en spesifisert bane der du vil eksportere filen. Vi vil jobbe med standardinnstillingene i dette tilfellet.

Først må vi se den nåværende arbeidskatalogen for miljøet vårt. Dette kan gjøres ved å bruke Python -skriptet nedenfor:

Her har vi funnet vår nåværende arbeidskatalog som er "Desktop". Dette betyr at filene vil bli eksportert til skrivebordskatalogen til systemet vårt.

Nå, for å eksportere DataFrame, har vi en metode “DF.to_excel () ”levert av Pandas. “To_excel ()” -metoden påberopes med navnet på DataFrame som er “Prog”. Mellom parentesene til funksjonen har vi spesifisert navnet på Excel -filen som "mydata" med ".XLSX ”utvidelse. Dette vil skrive DataFrame -objektet “Prog” direkte inn i Excel -arket. Excel -filen vil bli lagret i vår nåværende arbeidskatalog som vi allerede har tildelt Desktop.

Når vi kjører skriptet, vil DataFrame bli eksportert til Excel -filen på skrivebordet. Vi har åpnet skrivebordskatalogen til maskinen vår og funnet en Excel -fil som heter “MyData”. Åpne filen viser oss DataFrame vi har eksportert til “XLSX” -filen. I øyeblikksbildet som er vedlagt her, kan du observere at arknavnet er som spesifisert "mydata".

På bildet over har vi sett at indeksene er lagret i en kolonne. Du kan også eliminere kolonnens etiketter. Dette kan gjøres bare ved å bruke to parametere “indeks” og “header”.

Som standard er "indeksen" og "header" -parametrene satt til "True". Når vi ikke vil ha dem, endrer vi ganske enkelt standardinnstillingene til "False" for begge argumentene.

Her har vi vår Excel -fil uten en indekskolonne og titlene på kolonnene.

Eksempel nr. 2: Bruke Pandas PD.ExcelWriter () -metode

Denne demonstrasjonen vil lære deg en annen metode for å eksportere en Pandas dataaframe til en Excel -fil.

Programmet startet med å importere Pandas verktøysett til Python -filen. Pandas -funksjonene er tilgjengelige for oss i Python -filen nå. For å eksportere en dataaframe for å utmerke oss, må vi først ha en. Dataframe genereres ved å bruke pandaene “PD.DataFrame () ”-funksjon. Vi påkalte “PD.DataFrame () ”-metoden og initialiserte DataFrame med 4 kolonner. Kolonnetikettene er "std_id", "økonomi", "geografi" og "historie".

Kolonnen “STD_ID” lagrer IDS for studenter som “1011”, “1012”, '1013 ”,“ 1014 ”og“ 1015 ”. Merkene til 3 forsøkspersoner lagres i kolonnene “økonomi” med verdier “98”, “60”, “70”, “65”, 87 ”; “Geografi” som holder verdier “51”, “78”, “88”, “97” og “56”; og “History” som bærer disse oppføringene “56”, “76”, “78”, “65” og “79”. Alle disse kolonnene må ha samme lengde på verdiene.

I vår illustrasjon er kolonnestørrelsen 5. “PD.DataFrame () ”-metode når det kalles for å lage en DataFrame med disse verdiene, krever et objekt der det kan lagre DataFrame slik at vi kan komme tilbake til det senere. Vi har opprettet en DataFrame -objekt “Rapport” og tildelt det utgangen av å kalle “PD.DataFrame () ”-metode. For å se DataFrame på skjermen, har vi brukt "Print ()" -funksjonen.

Den nyopprettede DataFrame med 4 kolonner er blitt stilt ut på Python -konsollen.

Vi vil nå se hvordan du lagrer denne dataaframmen i en Excel -fil som bruker Pandas “PD.ExcelWriter () ”-metode. “PD.ExcelWriter () ”-funksjonen påberopes og mellom parentesene har vi definert navnet på Excel -filen med".XLSX ”-forlengelse som“ ReportCard.XLSX ”. En variabel "butikk" er konstruert for å lagre resultatet av “PD.ExcelWriter () ”som vil være en Excel -fil. Nå har vi et Excel -ark med navnet “ReportCard.XLSX ”. Vi eksporterer dataaframe til det nå.

For dette “Pandas -metoden“ DF.to_excel () ”kalles. Navnet på DataFrame “Report” er vedlagt med “.to_excel () ”-metode. Variabelen “Store”, som har Excel -fil, sendes som en parameter. Så vil DataFrame bli eksportert i “ReportCard.xlsx ”-fil. For å lagre tabellinnholdet har vi en metode “DF.lagre()". "Save ()" -metoden brukes og DataFrame lagres vellykket i Excel -filen. Husk at denne filen vil bli lagret i den gjeldende arbeidskatalogen for prosjektet vårt, som i dette tilfellet er "Desktop" -katalogen.

"Rapportkortet.XLSX ”-filen finnes i skrivebordskatalogen til maskinen vår. Filen er lansert, og her ser vi at DataFrame vi opprettet er lagret i denne filen.

Konklusjon

Denne artikkelen gjorde deg kjent med to strategier for å oppnå ønsket resultat. De to metodene til pandaer har blitt diskutert. Den praktiske demonstrasjonen av eksempelkoder for å bruke begge metodene er utført på Spyder -verktøyet. Det første eksemplet brukte “DF.to_excel () ”-metode for å eksportere DataFrame til en Excel -fil mens den andre illustrasjonen utdypet“ PD.ExcelWriter () ”-metode for å lagre DataFrame i et Excel -ark.