Pandaer til Array

Pandaer til Array
Den vanligste og populære metoden for å konvertere DataFrame til en matrise er å bruke To_Numpy () -funksjonen. I Numpy blir dimensjonene referert til som aksen. "Arrayen.Array ”-klasse fra standard Python -biblioteket er forskjellig fra Numpy.Array. Vi har også "verdier" attributt og til_records () metoder.

Metode 1: Bruke to_numpy ()

Når vi bruker til_numpy () -metoden på Pandas DataFrame, et objekt av den numpy datatypen, returneres NdArray som utdata. Vanligvis returneres en 2-dimensjonal ndarray. La oss se på funksjonens syntaks før vi ser funksjonen med funksjonen i følgende eksempler.

Syntaks:

DataFrame_Object.to_numpy (dtype = ingen, kopi = falsk, na_value = nodefault.NO_DEFAULT)

Parametere:

  1. dtype: Numpy.dtype, str, eller valgfritt. Datatypen sendes til Numpy.Asarray ().
  2. kopiere: Bool, falsk som standard. Om du skal sjekke at utdata/returnerte data/verdi ikke er et syn på de andre matriser. To_numpy () er ikke garantert å være ingen kopi når kopi = falsk brukes. I stedet lager Copy = True en kopi selv om det ikke er strengt nødvendig.
  3. na_value: Ethvert alternativ. Verdien å erstatte hvis det mangler verdier. Verdien avhenger som standard av dypene til kolonnene i DataFrame.

Eksempel 1:
La oss ha en DataFrame med 5 rader og 3 kolonner og konvertere den til en numpy matrise ved hjelp av To_Numpy () -metoden.

Importer pandaer
Importer numpy
# Tenk på Pandas DataFrame
faktisk = pandaer.DataFrame ([[1, "Cooking", 200],
[2, "Music", 3004],
[3, "Hand Loom", 1000],
[4, "Hand Loom", 2000],
[5, "Dressing", 3000]],
kolonner = ['id', 'arbeid', 'lønn'],
indeks = ['Person 1', 'Person 2', 'Person 3', 'Person 4', 'Person 5'])
# Vis den konverterte DataFrame
trykk (faktisk, "\ n")
# Konverter til Numpy Array
konvertert = faktisk.to_numpy ()
# Vis typen numpy matrise
print (type (konvertert), "\ n")
trykk (konvertert)

Produksjon:

Forklaring:
Etter å ha konvertert til Numpy -matrisen, bruker vi Type () -funksjonen for å vise typen konvertert matrise. Du kan se at 5 rader er lagret i en numpy matrise.

Eksempel 2:
Konverter bare to kolonner i DataFrame til Numpy -matrisen ved hjelp av To_Numpy () -metoden. Her må vi spesifisere kolonnenavn som skal konverteres til Numpy -matrisen i en liste.

Importer pandaer
Importer numpy
# Tenk på Pandas DataFrame
faktisk = pandaer.DataFrame ([[1, "Cooking", 200],
[2, "Music", 3004],
[3, "Hand Loom", 1000],
[4, "Hand Loom", 2000],
[5, "Dressing", 3000]],
kolonner = ['id', 'arbeid', 'lønn'],
indeks = ['Person 1', 'Person 2', 'Person 3', 'Person 4', 'Person 5'])
# Konverter bare 'arbeid' og 'lønn' kolonner til numpy matrise
trykk (faktisk [['arbeid', 'lønn']].to_numpy ())

Produksjon:

Forklaring:
Vi kan se at bare to kolonner ["arbeid", "lønn"] blir konvertert til numpy matrise.

Metode 2: Bruke attributt for verdier

"Verdiene" er en attributt som konverterer Pandas dataaframe til Numpy -matrisen direkte.

Syntaks:

DataFrame_Object.verdier

Eksempel 1: Konverter hele DataFrame til Numpy Array
Tenk på den forrige DataFrame og konverter den til en numpy matrise ved hjelp av To_Numpy () -metoden.

Importer pandaer
Importer numpy
# Tenk på Pandas DataFrame
faktisk = pandaer.DataFrame ([[1, "Cooking", 200],
[2, "Music", 3004],
[3, "Hand Loom", 1000],
[4, "Hand Loom", 2000],
[5, "Dressing", 3000]],
kolonner = ['id', 'arbeid', 'lønn'],
indeks = ['Person 1', 'Person 2', 'Person 3', 'Person 4', 'Person 5'])
# Bruk verdier attributt for å konvertere ovennevnte DataFrame til Numpy Array.
trykk (faktisk.verdier)
trykk (type (faktisk.verdier))

Produksjon:

Forklaring:
Du kan se alle kolonnene i DataFrame til Numpy Array.

Eksempel 2: Konverter noen kolonner til Numpy Array
Konverter bare to kolonner i DataFrame til Numpy -matrisen ved hjelp av To_Numpy () -metoden. Her må vi spesifisere kolonnenavn som skal konverteres til Numpy -matrisen i en liste.

Importer pandaer
Importer numpy
# Tenk på Pandas DataFrame
faktisk = pandaer.DataFrame ([[1, "Cooking", 200],
[2, "Music", 3004],
[3, "Hand Loom", 1000],
[4, "Hand Loom", 2000],
[5, "Dressing", 3000]],
kolonner = ['id', 'arbeid', 'lønn'],
indeks = ['Person 1', 'Person 2', 'Person 3', 'Person 4', 'Person 5'])
trykk (faktisk [['arbeid', 'lønn']].verdier)

Produksjon:

Vi kan se at bare to kolonner ["arbeid", "lønn"] blir konvertert til numpy matrise.

Metode 3: Bruke to_records ()

“To_Records ()” konverterer den eksisterende DataFrame direkte til en Numpy -matrise som er av platearray -type. Fordelen med å bruke denne metoden er at for hver konverterte rad kommer indeksen også i postoppstillingen.

Syntaks:

DataFrame_Object.to_records ()

Eksempel 1: Konverter hele DataFrame til Numpy Array
Tenk på den forrige DataFrame og konverter den til en numpy matrise ved hjelp av To_Records () -metoden.

Importer pandaer
Importer numpy
# Tenk på Pandas DataFrame
faktisk = pandaer.DataFrame ([[1, "Cooking", 200],
[2, "Music", 3004],
[3, "Hand Loom", 1000],
[4, "Hand Loom", 2000],
[5, "Dressing", 3000]],
kolonner = ['id', 'arbeid', 'lønn'],
indeks = ['Person 1', 'Person 2', 'Person 3', 'Person 4', 'Person 5'])
# Bruk til_records () for å konvertere ovennevnte DataFrame til Numpy Array.
trykk (faktisk.to_records (), "\ n")
# Få datatypen
trykk (type (faktisk.to_records ()))

Produksjon:

Forklaring:
Du kan se alle kolonnene i DataFrame til Numpy -matrisen, og den returnerte matrisen er en post -matrise. I hver post kan du også se indeksen.

Eksempel 2: Konverter noen kolonner til Numpy Array
Bruk metoden To_Records () for å konvertere de to første kolonnene i DataFrame til en numpy matrise.

Importer pandaer
Importer numpy
# Tenk på Pandas DataFrame
faktisk = pandaer.DataFrame ([[1, "Cooking", 200],
[2, "Music", 3004],
[3, "Hand Loom", 1000],
[4, "Hand Loom", 2000],
[5, "Dressing", 3000]],
kolonner = ['id', 'arbeid', 'lønn'],
indeks = ['Person 1', 'Person 2', 'Person 3', 'Person 4', 'Person 5'])
# Bruk til_records () for å konvertere de to første kolonnene i DataFrame til en numpy matrise.
print (faktisk [['id', 'arbeid']].to_records (), "\ n")

Produksjon:

De to første kolonnene blir konvertert til Numpy -matrisen.

Konklusjon

Vi diskuterte hva matriser er og hvordan dataframene i pandaer kan konverteres til numpy kolonner. Vi brukte tre metoder for å endre DataFrame -kolonnene til en matrise. I eksemplene på denne artikkelen prøvde vi å lære deg hvordan du konverterer de spesifikke kolonnene eller hele DataFrame til en numpy matrise ved hjelp av TO_NUMPY () -funksjonen. Vi brukte også verdien Attributt og To_Records () -metoden for å konvertere DataFrame -kolonnene til en numpy matrise.