Pandas dataaframe til numpy matrise

Pandas dataaframe til numpy matrise
“Pandas er et open source-bibliotek, og“ Python ”gir dette biblioteket. Vi har forskjellige serier, lister og dataframmer i “Pandas”. Vi kan enkelt lage DataFrames, og vi konverterer disse DataFrames til Numpy Array. På grunn av den sofistikerte datahåndteringen, anbefales Numpy Array å bli brukt der det er mulig. Numpy Arrays tilbyr raske og fleksible måter å skalere og normalisere data på, som kan brukes til å utarbeide dataene for trening av maskinlæringsmodell. Når vi ønsker å konvertere DataFrame til Numpy Array, bruker vi “To_Numpy” -metoden til “Pandas”. I denne guiden vil metoden “to_numpy ()” diskutere i detalj med noen praktiske demonstrasjoner av denne metoden. Vi vil konvertere Dataframes til en numpy matrise hit ved å bruke "to_numpy ()" -metoden og vil vise resultatet av kodene også.”

Syntaks

# Pandas.Dataramme.to_numpy ()

Eksempel nr. 01

Nå gjør vi noen praktiske eksempler her der vi vil lage DataFrame i "Pandas", og så vil vi konvertere denne DataFrame til Numpy -matrisen ved å bruke "To_Numpy ()" -metoden. Vi bruker "Spyder" -appen i denne guiden og skriver koden på den. Det første trinnet her er å importere modulene til "pandaer" ved å bruke nøkkelordet "import" og deretter sette "pandaer som PD" her. Dataframe er nå opprettet ved hjelp av “PD.DataFrame ”-metode. "Classes_df" er opprettet i dette eksemplet, og det har fem kolonner i seg. Vi har "klasse 1" som navn på den første kolonnen, og vi setter “Lily, Ava, Isla, Harper og Firenze” i den.

Deretter bruker vi “Klasse 2” som navn på den andre kolonnen i denne Dataframe og setter også inn “Smith, Henry, Theo, Elsie og Evelyn”. "Klasse 3" her er navnet på den tredje kolonnen, og den inneholder "Bromley, Ivy, Freddie, Noah og Teddy" i den. Så kommer kolonnen “Klasse 4”, og vi plasserer “Milli, Leo, Jacob, Amelia og Samuel” som verdiene til den kolonnen. Etter dette legger vi også til "Klasse 5" -kolonnen, og verdiene for denne kolonnen er "Alexander, Oscar, William, James og John". Nå er "classes_df" DataFrame her. Først vil vi vise denne dataaframmen til deg, og så vil vi endre denne dataaframmen til det numpy matrisen.

Resultatet vi kommer hit er når vi trykker på “Shift+Enter” -tasten. I dette utfallet er bare en dataaframe gjengitt, som vi har opprettet i koden ovenfor. Nå skal vi bruke “to_numpy ()” -metoden for å konvertere denne dataaframe.

Vi setter inn de gitte kodelinjene til koden vi har opprettet DataFrame. Vi bruker først en variabel her, som er "class_numpy", og vi initialiserer denne variabelen med "to_numpy ()" -metoden. Vi må bruke riktig DataFrame -navn med “to_numpy ()” -metoden, så vi skriver det som “classes_df.to_numpy () ”der“ classes_df ”er navnet på DataFrame og“ to_numpy () ”er metoden for“ Pandas ”som vil konvertere DataFrame til Numpy -matrisen.

Den numpy rekke dataaframe er gjengitt nedenfor. Dette er "Numpy Array" som vises i denne utgangen, og vi får denne numpy matrisen ved å bruke metoden “To_Numpy ()” i “Pandas”.

Eksempel # 02

DataFrame i denne koden er "Registrerings_df", som inneholder fem unike kolonner, og disse kolonnenavnene er "student_id, last_name, first_name, student_age og program". I spalten "Student_id" satte vi "STD23-11, STD23-12, STD23-13, STD23-14, STD23-15, STD23-16, STD23-17, STD23-18 og STD23-19". Så i kolonnen "Last_name" setter vi inn "Smith, John, Graham, Wilson, Peter, Bromley, George, Thomas og Russel". Etter å ha satt verdier i kolonnen “Last_name”, satte vi deretter verdier i kolonnen "First_Name", som er "Samue, James, Lily, Grace, Liam, Jack, Ryan, Oscar og Jacob". Så har vi "Student_age" -kolonnen der vi setter "16, 17, 20, 18, 16, 21, 19, 17 og 19". Den siste kolonnen vi har er "program" -kolonnen, der vi har lagt til "kunst, informatikk, sykepleie, utarbeidelse, kalligrafi, informatikk, botony, zoologi og kunst".

Nå, etter å ha satt inn verdiene i alle kolonnene, skriver vi ut denne "registrering_df" DataFrame, og deretter konverterer vi denne "påmelding_df" DataFrame til Numpy Array. Så vi plasserer “to_numpy ()” -metoden nedenfor og nevner navnet på DataFrame med denne “to_numpy ()” -metoden. Så det vil konvertere DataFrame til Numpy -matrisen og også lagre numpy -matrisen i variabelen "Registrering_numpy". Vi gjengir også Numpy -matrisen hit ved å bruke “Print ()”.

Her vises både DataFrame og Numpy Array.

Eksempel # 03

Ovennevnte DataFrame brukes igjen i dette eksemplet, og vi endrer verdiene til DataFrame litt her. Vi erstatter noen verdier av kolonnen "Student_age" med "NP. Nan ”-verdien som er nullverdien, og vi vil håndtere disse nullverdiene her når vi konverterer denne dataframmen til Numpy -matrisen. Etter å ha satt denne dataaframe i "print ()" -funksjonen, bruker vi “to_numpy ()” -metoden der vi setter “np_value = 20”. Så det vil konvertere nullverdiene til 20. Når denne DataFrame konverteres i Numpy -matrisen, vil 20 gjengi i stedet for nullverdier, og vi lagrer denne numpy matrisen inn i "numpy_array" -variabelen. Vi viser også Numpy -matrisen ved å bruke “Print ()” igjen.

I "Student_age" -kolonnen i DataFrame kan du enkelt merke at "NAN" -verdiene har dukket opp, men når du endrer denne DataFrame til Numpy -matrisen, har "20" dukket opp i stedet for "Nan" fordi vi setter denne 20 verdien I "to_numpy ()" -metoden, så er den gjengitt her.

Eksempel nr. 04

"DF" DataFrame har fem forskjellige kolonner: produktnavn, salgsrepresentant, måned, stykker og land. Vi skrev inn "Produkt 1, produkt 2, produkt 3, produkt 4 og produkt 5" i feltet "Produktnavn". Så går vi inn i "Tom, Joe, Peter, Bromley og Samuel" i "Salgsrepresentanten" -feltet. Etter kolonnen "Sales Rep", skrev vi inn navnene "Feb, august, september, oktober og desember" i "Måned" -kolonnen. Kolonnen "Pieces" følger, der "12 stk, 6 stk, 10 stk, 4 stk og 9 stk" er listet opp. Så kom vi inn i "Frankrike, Australia, Kina, Tyskland og England" i spalten "Land". Nå har vi fylt ut verdiene for alle kolonnene; Vi skriver ut denne "DF" DataFrame før vi konverterer den til Numpy Array.

For å konvertere “DF” til Numpy Array, plasserer vi “To_Numpy ()” -metoden nedenfor og plasserer navnet på DataFrame med denne metoden. Som et resultat vil DataFrame bli forvandlet til Numpy -matrisen, og Numpy Array er også lagret i "Sales_Array" -variabelen. Ved å bruke "print ()", gjengir vi også Numpy -matrisen hit. Vi kan også konvertere noen kolonner av DataFrame til Numpy -matrisen i stedet for å konvertere hele DataFrame til Numpy -matrisen.

For å konvertere noen kolonner i DataFrame til Numpy -matrisen, bruker vi den samme metoden, som er “to_numpy ()”, men før denne metoden plasserer vi navnene på to kolonner i denne dataaframet som vi ønsker å forvandle til Numpy -serien. Her konverterer vi bare "Salgsrepresentanten" -kolonnen til Numpy Array og skriver også ut kolonnene i Numpy Array -skjemaet.

Den originale DataFrame og den numpy matrisen av denne komplette Dataframe er gjengitt, og under dem kan du se at to kolonner av denne DataFrame blir konvertert til Numpy -matrisen og vises her.

Konklusjon

Vi har lært om Numpy Array i denne guiden. Vi har diskutert konverteringen av DataFrame til Numpy Array hit ved hjelp av “To_Numpy ()” -metoden til “Pandas”. Vi har undersøkt konseptet med å konvertere hele DataFrame til Numpy -matrisen, samt konvertere noen kolonner i DataFrame til Numpy -matrisen. Vi viste også hvordan vi skal takle nullverdiene mens vi konverterer dataaframe til numpy -matrisen i denne guiden. Vi har brukt metoden “To_Numpy ()” i denne guiden som hjelper oss mye med å konvertere DataFrame til Numpy -matrisen. Vi har forklart dette konseptet dyptgående her.