Python leste CSV i 2D -matrise

Python leste CSV i 2D -matrise
Som vi vet, når vi snakker om 2D -matrisen, snakker vi om Numpy -matrisen. Numpy -matrisen brukes i utgangspunktet av informatikere og maskinlæringsingeniører for å håndtere de enorme mengdene data som er lagret i CSV -filen. Som et resultat gjør Numpy dem i stand til å behandle store datamengder i en CSV -fil på en veldig praktisk måte. Python hjelper også på samme måte ved å tilby forskjellige metoder for å lese CSV -fildataene i en numpy matrise. Så vi skal lære om disse forskjellige typene metoder i denne artikkelen.
  1. Bruke Numpy LoadTxt () -metode
  2. Bruke Numpy GenFromTxt () -metode
  3. Bruke Pandas DataFrame
  4. Bruke listedatastrukturen
  5. Bruke Pandas DataFrame Values ​​() -metode

Hva er en CSV -fil?

En CSV er en (komma -adskilt verdier) fil der data er i form av en tabellform. Utvidelsen av CSV -filen er .CSV. Denne CSV -filen brukes mest i dataanalysen. Bortsett fra dataanalysene, er CSV-filen også brukt i e-handelsapplikasjonen fordi det er veldig enkelt å håndtere i alle forskjellige typer programmeringsspråk.

Metode 1: Bruke Numpy LoadTxt () -metoden

I denne metoden skal vi bruke Numpy.LoadTxt () -metode som konverterer CSV -dataene til en 2D -matrise. Nedenfor er en prøve CSV -fil som vi vil bruke i dette programmet.

1,2
3,4
5,6
7,8
9,10

Python -kode:

Importer numpy som NP
Csvdata = åpen ("samplecsv.CSV ")
Array2d_result = np.LOADTXT (CSVDATA, Delimiter = ",")
print (array2d_result)

Produksjon:

[[ 1. 2.]
[3. 4.]
[5. 6.]
[7. 8.]
[9. 10.]]

Linje 1: Vi importerer Numpy Library.

Linje 3-4: Vi åpner samplecsv -filen og vi passerer både CSVData og avgrenseren til NP.LoadTxt () -funksjon, som returnerer dataene i en 2D -matrise.

Linje 6: Vi skriver endelig ut resultatet som viser at nå våre CSV -data konvertert til en 2D -matrise.

Metode 2: Bruke Numpy GenFromTxt () -metoden

I denne metoden skal vi bruke Numpy.GenFromTxt () -metode som konverterer CSV -dataene til en 2D -matrise. Nedenfor er en prøve CSV -fil som vi vil bruke i dette programmet.

1,2
3,4
5,6
7,8
9,10

Python -kode:

Importer numpy som NP
Csvdata = åpen ("samplecsv.CSV ")
Array2d_result = np.GenFromTxt (CSVData, Delimiter = ",")
print (array2d_result)

Produksjon:

[[ 1. 2.]
[3. 4.]
[5. 6.]
[7. 8.]
[9. 10.]]

Linje 1: Vi importerer Numpy Library.

Linje 3-4: Vi åpner samplecsv -filen og vi passerer både CSVData og avgrenseren til Numpy NP.GenFromTxt () -funksjon, som returnerer dataene til en 2D -matrise.

Linje 6: Vi skriver endelig ut resultatet som viser at nå våre CSV -data konvertert til en 2D -matrise.

Metode 3: Bruke Pandas DataFrame

I denne metoden skal vi bruke pandaene som konverterer CSV -dataene til en 2D -matrise. Nedenfor er en prøve CSV -fil som vi vil bruke i dette programmet.

1,2
3,4
5,6
7,8
9,10 Importer pandaer som PD
df = pd.read_csv ('samplecsv.CSV ')
trykk (DF)
Array2d_result = df.to_numpy ()
print (array2d_result)

Produksjon:

1 2
0 3 4
1 5 6
2 7 8
3 9 10
[[3 4]
[5 6]
[7 8]
[9 10]]

Linje 1: Vi importerer Pandas -biblioteket som PD.

Linje 2-3: Vi leser CSV -filen ved hjelp av Pandas Read_CSV -metoden og skriver deretter ut den nyopprettede DataFrame (DF) på skjermen som vist i output ovenfor.

Linje 4-5: Vi bruker deretter DataFrame -metoden til_numpy som konverterer hele DataFrame -verdiene til en 2D -matrise som vist i utgangen.

Metode 4: Bruke listedatastrukturen

I denne metoden skal vi bruke listedatastrukturen. Listen kan også hjelpe oss med å få CSV-dataene i en 2-D-matrise. Programmet nedenfor viser den samme metoden.

Importer CSV
Importer numpy
med åpen ("samplecsv.csv ", newline =") som fil:
resultat_list = liste (CSV.leser (fil))
print (result_list)
Resultat_2d = numpy.Array (Resultat_list)
print (resultat_2d)

Produksjon:

[['1', '2'], ['3', '4'], ['5', '6'], ['7', '8'], ['9', '10'] ]
[['1' '2']
['3' '4']
['5' '6']
['7' '8']
['9' '10']]

Linje 1: Vi importerer CSV- og Numpy -bibliotekene.

Linjer 3-5: Vi åpner samplecsv -filen og leser deretter hver CSV -filens data ved hjelp av CSV.Reader () -metode og konvertere resultatene til en liste over lister.

Linje 6: Nå bruker vi Numpy.Array-metoden for å konvertere hele listen over lister til en 2-D-matrise. Resultatet i utdataene viser at CSV-dataene våre nå er blitt konvertert til en 2-D-matrise.

Metode 5: Bruke Pandas DataFrame -verdier

I denne metoden skal vi bruke den helt grunnleggende metoden for å konvertere CSV -dataene til et numpy matrise ved å bruke DataFrame Values ​​() -funksjonen. Programmet nedenfor vil demonstrere det samme.

Importer pandaer som PD
df = pd.read_csv ('samplecsv.CSV ')
trykk (DF)
Array2d_result = df.verdier
print (array2d_result)

Produksjon:

1 2
0 3 4
1 5 6
2 7 8
3 9 10
[[3 4]
[5 6]
[7 8]
[9 10]]

Linje 1: Vi importerer Pandas -biblioteket som PD.

Linje 2-4: Vi leser CSV -filen ved hjelp av Pandas Read_CSV -metoden og skriver deretter ut den nyopprettede DataFrame (DF) på skjermen som vist i output ovenfor.

Linje 5-6: Vi bruker deretter DataFrame Values ​​() -funksjonen som konverterer DataFrame til en numpy 2-D-matrise som vist i utgangen.

Konklusjon

I denne artikkelen har vi sett forskjellige metoder for å lese CSV -data i en 2D -matrise. Vi har vist alle metodene som for tiden brukes av forskjellige programmerere og informatikere. Noen av metodene er innebygde, og noen av metodene opprettes ved å kamme forskjellige metoder fra forskjellige biblioteker. Men alle ovennevnte metoder du kan bruke i henhold til dine krav. Hvis du vet hvordan du kan lese CSV -filen, kan du også lage noen av dine egne metoder.