Pandas til Numpy

Pandas til Numpy
"Python Data Analysis Library" er "Pandas". I "Pandas" er serien enkel å generere, og vi kan også gjøre dem om til numpy matriser. Det foreslås å bruke Numpy -matrisen der det er mulig på grunn av dets omfattende datahåndtering. Data kan raskt og enkelt skaleres og normaliseres ved hjelp av numpy matriser, som kan brukes til å utarbeide dataene for treningsmaskinlæringsmodeller. "Pandas" -pakken tilbyr forskjellige måter å forvandle serien til en numpy matrise. Vi vil diskutere alle metoder som hjelper oss med å transformere "Pandas" -serien til "Numpy Array". Denne artikkelen vil vise alle mulige måter å endre serien til en numpy matrise og bruke alle metoder i vår "pandas" -kode her.

Metoder for å transformere “Pandas” -serier til “Numpy Array”

"Pandas" letter tre distinkte metoder som hjelper oss med å transformere "Pandas" -serien til "Numpy Array". Disse metodene er diskutert i dette avsnittet:

  • Pandas.serie.to_numpy () funksjon
  • Pandas.serie.Verdier eiendom
  • Pandas.serie.Array -eiendom

Vi vil bruke disse metodene på "Pandas" -serien for å transformere "Pandas" -serien til "Numpy Array". Vi vil også vise flere eksempler i denne artikkelen der vi bruker disse metodene.

Eksempel nr. 01

Disse kodene presenteres i denne artikkelen ved hjelp av “Spyder” -verktøyet. For å lage "Pandas" -serien, må vi "importere" modulene til "Pandas". Så vi la til "import", og ved hjelp av denne "importen" importerer vi "pandaene som PD". Deretter opprettet vi en serie ved å sette “PD.Series "og la til" Finland, Danmark, Ungarn, Angola, Israel, Kina og Amerika "i denne serien, og lagret også denne serien i" Series_data "-variabelen. Vi har "trykket ()" der vi legger "serie_data", så denne serien vil skrive ut på terminalen. Vi viser ganske enkelt serien, og etter å ha vist serien, vil vi konvertere denne serien til "Numpy Array".

Serien vises her, da vi har utført denne koden ved hjelp av “Shift+Enter” -tastene. Merk at serien inneholder standardindeksverdiene. La oss gå videre for å forvandle denne serien til Numpy Array.

Vi bruker “pandaene.serie.to_numpy () ”-metoden, som vil endre serien til Numpy Array. Vi har lagt til en "matrise" -variabel for lagring av Numpy Array, som vi får etter å ha brukt “Pandas.serie.to_numpy () ”-funksjon. Vi plasserer navnet på serien, som er “Series_data”, og deretter “to_numpy ()” -metoden. Så denne serien konverteres til Numpy Array. Vi ønsker også å vise denne numpy matrisen, så vi har lagt til "matrisen" -variabelen i "print ()".

Den forrige serien blir nå omgjort til Numpy Array og vises også i dette utfallet. Numpy -matrisen inneholder ikke indeksverdiene som vist her:

Eksempel # 02

Vi har brukt to biblioteker, "Pandas" og "Numpy". Serien vi har laget er "JOB_DATA" ved å bruke "PD.Serie ”, og den inneholder“ Freelancer, Software Engineer, Physician, Technical Writer, Teacher, Instructor and Constructor ”. Vi trykker først denne "JOB_DATA" -serien, og deretter konverterer vi "JOB_DATA" -serien til Numpy -matrisen ved å sette “NP.Array () ”-metode og legge til navnet på serien til den, og også plassere" matrisen "med navnet på serien i denne funksjonen. Dette vil forvandle "JOB_DATA" -serien til "Numpy Array" og lagre den i "JOB_ARRAY". Deretter passerer vi “Job_Array” til “Print”.

Serien og den numpy matrisen vises i denne utgangen. Merk at serien inneholder indeksverdiene, men Numpy -matrisen har ikke indeksverdiene.

Eksempel # 03

"Fruits_data" -serien i denne koden inneholder "Mulberry, Date Palm, Cherry, Orange, Peach, Apricot, Olive, Apple, Pear og Watermelon". Vi skriver deretter "print ()" og legger til "frukt_data" til det. Etter dette forvandler vi "Fruits_data" -serien til Numpy -matrisen ved hjelp av "to_numpy ()" -metoden. Denne numpy matrisen er også lagret i "Fruits_Array", og "Fruits_Array" er lagt til "Print ()".

Her er "Pandas" -serien og Numpy -matrisen i resultatet av forrige kode. Du kan også observere serien og numpy matriseforskjeller her:

Eksempel nr. 04

Her har vi brukt “Numpy” og “Pandas” -biblioteker. Ved å bruke “PD.Series, ”Vi har konstruert en serie som heter“ Data ”som inkluderer“ AY123, AY678, AY876, AY908, AY987, AY912, AY456 og AY012 ”. "Data" -serien blir først trykt, og deretter blir den omgjort til et numpy matrise ved å bruke “NP.Array () ”-metode, legge til serienavnet til den, og deretter“ Verdier ”. Vi lagrer også Numpy -matrisen i variabelen “new_array”. "Data" -serien vil forvandle seg til "Numpy Array" og bli lagret i "new_array.”“ New_Array ”blir deretter sendt til“ Print ”.

Denne gitte utdata viser både serien og Numpy Array. Husk at den numpy matrisen mangler indeksverdiene, men serien inneholder indeksverdier.

Eksempel nr. 05

Nå lager vi “S_DF” DataFrame ved å plassere “Pandas” -metoden, som er “DataFrame ()” i dette tilfellet. Vi har lagt til forskjellige kolonner, og hver kolonne i DataFrame kalles også serien. Vi har lagt til "navn" som inneholder "Roman, Collins, Ethan, Poppy, Edward, Archie, Benjamin og Bromley". Deretter kommer "merkene" neste, og legger til "278, 344, 239, 310, 485, 298, 453 og 670". Deretter har vi satt inn “37%, 54%, 15%, 59%, 76%, 34%, 61%og 80%” i ​​“prosentvis” kolonne. Vi skriver "print ()" og legger til "s_df" til det. Så "s_df" vises.

Nå konverterer vi to kolonner av DataFrame til Numpy -matrisen fordi vi også har diskutert at kolonnen til DataFrame også er serien "Pandas". Vi konverterer først "Navn" -serien til Numpy Array ved å bruke "NP.Array ”og legge til“ S_DF ”DataFrame med“ Navn ”-kolonnen og deretter skrive“ Verdier ”med den. Vi har lagret denne numpy matrisen i "my_array1" -variabelen og deretter vist den. Vi bruker den samme metoden, men denne gangen har vi nevnt "Marks" -kolonnen i DataFrame for å konvertere den til Numpy Array. Denne andre numpy matrisen lagres i “my_array2” og lagt til “trykket” for gjengivelse.

Dataframe blir presentert først. Deretter konverteres "Navn" -kolonnen eller "Navn" -serien til Numpy Array og vises. Også "Marks" -kolonnen konverteres til Numpy -matrisen og gjengis her.

Eksempel # 06

Nå vil vi lese CSV -filen her og deretter konvertere dataene til DataFrame og Series. Også serien inn i Numpy Array. “File_Data” initialiseres med “PD.read_csv () ”-metode, og banen til CSV -filen legges inn i den. Vi leser “Filen.CSV ”, og denne metoden konverterer filens data til DataFrame og lagrer dem i“ File_Data ”. Vi legger også til "Dropna ()" -metoden, som vil slippe nullverdiene hvis de er til stede i denne dataaframe.

Nå bruker vi “Print”, og etter dette bruker vi “PD.Series () ”-metode og legg til DataFrames navn og en kolonne i DataFrame, som er“ S_Location ”. Dette vil konvertere den til en serie og lagre den i "my_series". Vi bruker metoden “to_numpy ()” for å konvertere “s_location” -dataene til Numpy -matrisen, og “to_numpy” -metoden blir lagt til i “Print”, så den vises også.

Dataene vi får etter å ha lest “Filen.CSV ”vises i DataFrames form, og deretter konverteres en av kolonnene,“ S_Location ”, til Numpy -matrisen.

Konklusjon

I denne artikkelen har vi diskutert Numpy -matrisen i “Pandas”. Her har vi forklart ved hjelp av forskjellige metoder for å transformere en "pandas" -serie til Numpy Array. Vi har sett på ideene om å gjøre serien om til et numpy matrise og også gjøre kolonner av DataFrame til en numpy matrise. I tillegg demonstrerte denne artikkelen hvordan man skal håndtere nullverdier når du transformerer en serie til et numpy matrise. I denne opplæringen brukte vi tre distinkte metoder, som letter konvertering av serien til Numpy -matrisen i stor grad. Dette konseptet er blitt grundig forklart her.