Python CSV Skip Header Row

Python CSV Skip Header Row
I denne artikkelen lærer vi hvordan vi kan fjerne overskriften til CSV -fildataene mens vi leser CSV -en, fordi vi noen ganger ikke trenger overskriften til CSV -fildataene. Så vi skal lære disse fire metodene, som er gitt nedenfor:
  1. Ved hjelp av neste () metode
  2. Bruk DiCtrader () -metoden
  3. Pandas skiprows basert på et bestemt radnummer
  4. Pandas skiprows basert på en indeksposisjon

La oss forklare hver av de ovennevnte metodene i detalj.

Metode 1: Bruke neste () -metode

I denne metoden vil vi bruke neste () metode og se hvordan denne metoden vil kaste overskriften før vi skriver ut alle de andre CSV -dataene.

CSV -fil: Nedenfor CSV -filen (test.CSV) Vi vil bruke til denne bloggen.

Måned, 1958,1959,1960
340.360.417
318.342.391
Mar, 362.406.419
348.396.461
340.360.417
318.342.391 Import CSV
med åpen ("test.CSV "," R ") som post:
# Vi lager et objekt av CSV -leseren
csvreader_object = csv.leser (plate)
# Linjen hopper over den første raden i CSV -filen (Header Row)
Neste (CSVReader_Object)
# Vi skriver nå ut alle rader bortsett fra den første raden i CSV
For rad i CSVReader_Object:
trykk (rad)

Produksjon:

['Jan', '340', '360', '417']
['Feb', '318', '342', '391']
['Mar', '362', '406', '419']
['Apr', '348', '396', '461']
['Jan', '340', '360', '417']
['Feb', '318', '342', '391']

Linje 1: Vi importerer CSV -modulen.

Linje 3 -7: Vi åpner testen.CSV -fil i lesemodus ('r') som en post, og så oppretter vi et objekt av CSV.leser () metode. Neste () -metoden, når vi kaller den, kaster automatisk den første raden fra CSV -leserobjektet og resten av dataene vi kan bruke som vi trenger.

Linjer 10-11: Nå iterer vi CSV Reader -objektet og skriver ut hver rad. Ovennevnte utgang viser at det nå ikke er noen topprekke.

Metode 2: Bruke dicTreader () -metode

Nå skal vi se hvordan vi kan lese CSV som et ordbokformat. Men etter å ha lest CSV -filen som et direkte format, vil vi bare skrive ut verdien, ikke nøkkelen, som vil løse problemet vårt med å skrive ut alle data uten overskriftsraden. Vi bruker den samme testen.CSV -fil som vi brukte før. Et eksempel på denne metoden er gitt nedenfor:

Importer CSV
med åpen ("test.CSV "," R ") som post:
# Vi lager et objekt av CSV -leseren
csvreader_object = csv.DicTreader (Record)
# Linjen hopper over den første raden i CSV -filen (Header Row)
# Fordi det fungerer som et dikter og vi skriver ut bare verdier ikke nøkler
For rad i CSVReader_Object:
Print (Row ["Month"], Row ["1958"], Row ["1959"], Row ["1960"])

Produksjon:

340 360 417
318 342 391
362 406 419
348 396 461
340 360 417
318 342 391

Linje 1: Vi importerer CSV -modulen.

Linje 3 -5: Vi åpner testen.CSV -fil i lesemodus ('r') som en post, og så oppretter vi et objekt av CSV.DicTreader () -metode.

Linjer 8-9: Nå itererer vi CSV DicTreader-objektet og skriver ut hver rad. Men denne linjen kaster automatisk den første raden fra CSV Reader -objektet fordi DicTreader konverterer hver rad i et dikter (nøkkel og verdi) skjema. Når vi bare skriver ut verdi, ikke nøkkel, som bare viser dataene, ikke k, v, som var vårt primære mål.

Metode 3: Bruke Pandas read_csv Skiprows attributter

I denne metoden skal vi bruke Pandas Read_CSV -attributtet Skiprows. I Skiprows vil vi nevne toppnummeret, som åpenbart er 1, så vi definerer verdien av Skiprows som 1 som vist i programmet nedenfor. På denne måten kan vi ignorere overskriften fra CSV mens vi leser dataene.

Importer pandaer som PD
SkipHeaderDF = PD.read_csv ('test.CSV ', Skiprows = 1)
Print (SkipHeaderdf)

Produksjon:

340 360 417
0 feb 318 342 391
1. mars 362 406 419
2. april 348 396 461
3 jan 340 360 417
4 feb 318 342 391

Linje 1: Vi importerer Pandas -biblioteket som en PD.

Linje 2: Vi leste CSV -filen ved hjelp av Pandas Read_CSV -modulen, og i det nevnte vi Skiprows = 1, som betyr å hoppe over den første linjen mens vi leser CSV -fildataene.

Linje 4: Nå skriver vi ut det endelige DataFrame -resultatet vist i output ovenfor uten overskriftsraden.

Metode 4: Ved hjelp av pandaer, fjern overskriften til CSV ved hjelp av indeksposisjon

I denne metoden skal vi bruke Pandas Read_CSV -attributtet Skiprows. I Skiprows vil vi nevne toppnummeret for topptekstindeksen, som åpenbart er 0, så vi definerer verdien av skiprows i firkantede parenteser ([0]) som vist i programmet nedenfor. På denne måten kan vi ignorere overskriften fra CSV mens vi leser dataene.

Importer pandaer som PD
SkipHeaderDF = PD.read_csv ('test.CSV ', Skiprows = [0])
Print (SkipHeaderdf)

Produksjon:

340 360 417
0 feb 318 342 391
1. mars 362 406 419
2. april 348 396 461
3 jan 340 360 417
4 feb 318 342 391

Linje 1: Vi importerer Pandas -biblioteket som en PD.

Linje 2: Vi leste CSV -filen ved hjelp av Pandas Read_CSV -modulen, og i det nevnte vi Skiprows = [0], som betyr å hoppe over den første linjen mens vi leser CSV -fildataene.

Linje 4: Nå skriver vi ut det endelige DataFrame -resultatet vist i output ovenfor uten overskriftsraden.

Konklusjon:

Denne artikkelen har sett fire forskjellige metoder for å hoppe over header -raden mens du leser CSV -filen. Alle metodene i artikkelen ovenfor er helt fine og brukes av Python -programmereren for å hoppe over overskriften til CSV -filen mens du leser CSV -dataene. Pandas Library -metoden lar oss ikke bare fjerne overskriften til CSV -fildataene, men kan også brukes til å fjerne andre rader hvis vi spesifiserer nummer eller indeksposisjon til Skiprows. Så Skiprows vil kunne fjerne alle de radene hvis tall vil bli tildelt dem. Så Pandas -modulen for å hoppe over header er den beste å bruke, og det er også veldig praktisk å fjerne de andre radene.

De andre metodene som bruker DicTrader og Reader er også tilgjengelige, men disse er bare for overskriftsradene, så hvis vi vil fjerne noen andre rader, må vi også skrive noen annen kode.