Hvordan lese Excel -filen i Python

Hvordan lese Excel -filen i Python

De .XLSX er utvidelsen av Excel -dokumentet som kan lagre en stor mengde data i tabellform, og mange typer aritmetiske og logiske beregninger kan gjøres enkelt i et Excel -regneark. Noen ganger kreves det å lese dataene fra Excel -dokumentet ved hjelp av Python -skript for programmeringsformål. Det finnes mange moduler i Python for å lese Excel -dokumentet. Noen av de nyttige modulene er xlrd, openpyxl, og Pandas. Måtene å bruke disse modulene for å lese Excel -filen i Python har blitt vist i denne opplæringen.

Forutsetning:

En dummy excel -fil med .XLSX -utvidelse vil bli pålagt å sjekke eksemplene på denne opplæringen. Du kan bruke hvilken som helst eksisterende Excel -fil eller opprette en ny. Her en ny Excel -fil som heter Salg.XLSX Fil er opprettet med følgende data. Denne filen har brukt til lesing ved å bruke forskjellige Python -moduler i neste del av denne opplæringen.

Salg.XLSX

Salgsdato Selger Beløp
12/05/18 Sila Ahmed 60000
06/12/19 Mir Hossain 50000
09/08/20 Sarmin Jahan 45000
07/04/21 Mahmudul Hasan 30000

Eksempel-1: Les Excel-fil ved hjelp av XLRD

XLRD -modulen er ikke installert med Python som standard. Så du må installere modulen før du bruker den. Den siste versjonen av denne modulen støtter ikke Excel -filen med .XLSX -utvidelse. Så du må installere 1.2.0 Versjon av denne modulen for å lese XLSX -filen. Kjør følgende kommando fra terminalen for å installere den nødvendige versjonen av xlrd.

$ pip install xlrd == 1.2.0

Etter å ha fullført installasjonsprosessen, oppretter du en Python -fil med følgende skript for å lese Salg.XLSX filen bruker XLRD modul. open_workbook () Funksjon brukes i skriptet Åpne XLSX -filen for lesing. Denne Excel -filen inneholder bare ett ark. Så arbeidsbok.Sheet_by_index () Funksjon har blitt brukt i skriptet med argumentverdien 0. Neste, nestet 'til' Loop har brukt til å lese celleverdiene til regnearket ved å bruke rad- og kolonneverdiene. To områdefunksjoner har blitt brukt i skriptet for å definere rad- og kolonnestørrelsen basert på arkdataene. De Cell_Value () Funksjonen har brukt til å lese den spesielle celleverdien til arket i hver iterasjon av loopen. Hvert felt i utgangen vil bli skilt med ett fanområde.

# Importer XLRD -modulen
Importer xlrd
# Åpne arbeidsboken
Workbook = xlrd.Open_Workbook ("Salg.XLSX ")
# Åpne regnearket
Arbeidsark = arbeidsbok.Sheet_by_index (0)
# Itererer radene og kolonnene
for i i rekkevidde (0, 5):
for j i rekkevidde (0, 3):
# Skriv ut celleverdiene med fanen Space
trykk (regneark.cell_value (i, j), end = '\ t')
skrive ut(")

Produksjon:

Følgende utgang vises etter å ha utført skriptet ovenfor.

Eksempel-2: Les Excel-fil ved hjelp av OpenPyxl

De openpyxl er en annen Python -modul for å lese XLSX -filen, og den er heller ikke installert med Python som standard. Kjør følgende kommando fra terminalen for å installere denne modulen før du bruker den.

$ pip installer openpyxl

Etter å ha fullført installasjonsprosessen, oppretter du en Python -fil med følgende skript for å lese Salg.XLSX fil. Som XLRD -modulen, openpyxl modulen har LOAD_WORKBOOK () Funksjon for å åpne XLSX -filen for lesing. De Salg.XLSX Fil brukes som argumentverdi for denne funksjonen. Objektet med Wookbook.aktiv er opprettet i skriptet for å lese verdiene til MAX_ROW og MAX_COLUMN egenskaper. Disse egenskapene har blitt brukt i nestet for løkker for å lese innholdet i Salg.XLSX fil. Range () -funksjonen har blitt brukt til å lese radene på arket, og ITER_COLS () -funksjonen har blitt brukt til å lese kolonnene på arket. Hvert felt i utdataene vil bli skilt med to fanerområder.

# Importer OpenyXl -modulen
Importer OpenPyxl
# Definer variabel for å laste Wookbook
WOOKBOOK = OpenPyxl.LOAD_WORKBOOK ("Salg.XLSX ")
# Definer variabel for å lese det aktive arket:
Arbeidsark = Wookbook.aktiv
# Itererer sløyfen for å lese celleverdiene
for jeg i rekkevidde (0, regneark.max_row):
for Col i regnearket.ITER_COLS (1, regneark.Max_column):
trykk (col [i].verdi, slutt = "\ t \ t")
skrive ut(")

Produksjon:

Følgende utgang vises etter å ha utført skriptet ovenfor.

Eksempel-3: Les Excel-fil ved hjelp av pandaer

Pandas-modulen er ikke installert med Python-lignende den forrige modulen. Så hvis du ikke installerte det før, må du installere den. Kjør følgende kommando for å installere Pandas fra terminalen.

$ pip installer pandaer

Etter å ha fullført installasjonsprosessen, oppretter du en Python -fil med følgende skript for å lese Salg.XLSX fil. De read_excel () Funksjon av Pandas brukes til å lese XLSX -filen. Denne funksjonen har brukt i skriptet for å lese Salg.XLSX fil. De Dataramme() Funksjonen har brukt her for å lese innholdet i XLSX -filen i datarammen og lagre verdiene i den navngitte variabelen data. Verdien av dataene er skrevet ut senere.

# Importer pandaer
Importer pandaer som PD
# Last inn XLSX -filen
excel_data = pd.Read_Excel ('Salg.XLSX ')
# Les verdiene til filen i DataFrame
Data = PD.DataFrame (excel_data, kolonner = [
'Salgsdato', 'Sales Person', 'Beløp'])
# Skriv ut innholdet
print ("Innholdet i filen er: \ n", data)

Produksjon:

Følgende utgang vises etter å ha utført skriptet ovenfor. Utgangen til dette skriptet er forskjellig fra de to foregående eksemplene. Radnumrene skrives ut i den første kolonnen, der radverdien har talt fra 0. Datoverdiene er justert sentralt. Navnene på selgere er rettet rett. Beløpet er justert igjen.

Konklusjon:

Python -brukerne må jobbe med XLSX -filer for forskjellige programmeringsformål. Tre forskjellige måter å lese XLSX -filen har blitt vist i denne opplæringen ved å bruke tre Python -moduler. Hver modul har forskjellige funksjoner og egenskaper for å lese XLSX -filen. Denne opplæringen vil hjelpe Python -brukere med å lese XLSX -filen enkelt ved hjelp av Python -skriptet etter å ha lest denne opplæringen.