Pandas konverterer serier til DataFrame

Pandas konverterer serier til DataFrame
Pandas er et Python-basert datamanipulasjonsverktøysett. Blant andre funksjoner kan den også analysere mange filformater og gjøre hele datatabellen til en Numpy Matrix -matrise. Som et resultat er Pandas en pålitelig maskinlæring og datavitenskapelig samarbeidspartner.

Pandas-serien er en endimensjonal matrise inkludert etiketter på aksene. Objektet aksepterer både heltall og etikettbasert indeksering og har en overflod av teknikker for å utføre indeksrelaterte handlinger. Generasjonen av nye søyler fra avledet eller nåværende serie er en krevende utfordring i funksjonsteknikk. Ved å bruke Pandas 'innfødte funksjonalitet.

Pandas konverterer serier til DataFrame

Å konvertere en serie til en dataaframe i pandas er en ganske enkel tilnærming. For å effektivt forvandle en serie til en dataramme, bruker Pandas å ramme inn() funksjon.

Denne funksjonen bruker følgende syntaks:

Den har en parameter "navn". Hvis serien har et navn, bør den brukes i stedet for det passerte navnet. DataFrame -representasjonen av serien vil bli returnert av denne funksjonen.

I denne opplæringen vil vi forklare deg metoden for å konvertere Pandas -serien til DataFrame ved hjelp av praktiske eksempler.

Eksempel 01: Bruke pandaer .to_frame () metode for å konvertere en serie til dataaframe

Vi bruker "Spyder" -verktøyet, som er et pålitelig og enkelt verktøy for å skrive og montere Python -koder. I "Spyder" -miljøet åpner vi en ny Python -fil og begynner å skrive skriptet vårt. Når vi jobber med Pandas -funksjonene, er det primære og fremste kravet å importere “Pandas som PD”. Dette muliggjør alle Pandas -funksjonene i Python -filen vår.

Vi lager deretter en serie “New_ser” som bruker “PD.Serie () ”-metode som brukes til å konstruere en Pandas -serie. Vi initialiserer serien med åtte heltallverdier som er “8”, ”4”, “3”, “9”, “11”, “6”, “15” og “21”. Denne serien er lagret i "New_ser" -variabelen. Vi kan nå få tilgang til serien ved å bruke dette variable navnet.

Nå må vi se vår nyopprettede Pandas -serie. Her gir pandaer oss en "print ()" -funksjon som viser dataene som er lagret i en variabel eller et objekt som er gitt til den. Som vi ønsker å skrive ut “New_ser” -serien, bruker vi derfor denne variabelen som en parameter i seler av "Print ()" -funksjonen.

Trykk på "Kjør fil" -knappen som ligger i overskriften til "Spyder" -verktøyet. Eller alternativt kan du bruke “Shift+Enter” -tastene for å utføre skriptet. Nå kan utgangen sees på terminalen. Vi oppretter først en serie og tildeler den 8 heltallverdier som kan observeres i utgangsbildet gitt nedenfor.

La oss sjekke objekttypen til "new_ser" -variabelen. Vi bruker "type ()" -metoden for å finne objekttypen. Vi må oppgi objekt eller variabelnavn, hvis objekttype vi trenger å se i parentesene til denne funksjonen. Som vi har inkludert "New_ser" -variabelen som en parameter til "Type ()" -funksjonen. Vi setter deretter inn "type ()" -funksjonen i "print ()" -funksjonen, da vi har inkludert "new_ser" -variabelen som en parameter til "Type ()" -funksjonen.

Trykk igjen på "Kjør fil" -knappen for å kjøre Python -filen for å få utdataene på terminalen. Den sjekker om noen parameter blir gitt til den når "trykte ()" -funksjonen påkalles. Vi har gitt den med "Type (New_ser)" -funksjonen, så den vil vise objekttypen til "new_ser" -objektet. Utgangsbildet viser i den siste linjen “.Serie ”utvidelse som betyr at objektet er av serietype.

Vi vil nå konvertere "New_ser" -serien til Pandas DataFrame. For denne konverteringen gir pandaer oss en veldig enkel og grei metode som er "to_frame ()". Vi har opprettet et DataFrame -objekt eller variabel “new_df” og tilordnet det utgangen av å påkalle “to_frame ()” -metoden. Vi må bruke "to_frame ()" -funksjonen med navnet på serieobjektet, som vi ønsker å konvertere til et dataaframe.

Vi brukte også parameteren til denne funksjonen "Navn" og tildelte det navnet "Numbers" som vi har brukt "New_Ser.to_frame (name = 'tall') ”. Det vil bli presentert som kolonnens navn i DataFrame. Deretter bruker vi metoden “Print ()” med DataFrame -objektet som parameter for å vise det resulterende DataFrame. Her bruker vi en annen "print ()" -funksjon med "type ()" -funksjonen for å bestemme objekttypen for "new_df" -variabelen.

Du kan se i utgangsbildet serien vi lager og deretter DataFrame vi genererte fra serien med hell. For bekreftelse av objekttypen definerer metoden “type ()” typene for begge objektene. Til å begynne med var det “.Serie ”og da vi konverterer serien til Dataframe, ble den til“.Dataramme".

Eksempel 02: Bruke pandaer .to_frame () metode for å konvertere flere serier til dataaframe

I illustrasjonen ovenfor konverterer vi en serie til en serie. Nå vil denne demonstrasjonen forklare hvordan du konverterer flere serier til en dataaframe.

Nå bygger vi Pandas -serien. For dette tilfellet lager vi 3 serier. Den første serien er "Navn" og den lagrer fem navn som er "Albert", "Boran", "Charlie", "Daren" og "Elsa". Den andre serien vi genererer er "poeng" som har samme lengde på verdier som er 5 og har verdier "44", "10", "31", "52" og "18". Den siste serien “Assists” inneholder verdier “10”, “3”, “7”, “15” og “5.

Vi må da vise alle serien én etter en ved å bruke "print ()" -funksjonen. Vi bruker først "Navn" -objektet i "print ()" -funksjonen, deretter "poeng". Til slutt sendes "assists" til metoden “Print ()”.

Når vi utfører den ovennevnte koden ved å trykke på "Run File" -knappen til "Spyder" -verktøyet, får vi 3-serier trykt på terminalen etter den.

Vi vil benytte oss av Pandas “to_frame ()” -metoden her. Vi har først opprettet en variabel "name_df" for å lagre DataFrame som genereres fra "Navn" -serien, og vi tildeler "TO_FRAME ()" -metoden "Navn" verdien "Navn" som kolonnens tittel. Vi oppretter deretter ytterligere to variabler som "Points_DF" og "ASSISTS_DF" for å lagre serien konverterte DataFrames fra henholdsvis "Points" og "Assists" -serien. Vi tildeler “Points_df” en tittel “Points” og “Assists_df” tittelen “Assists” ved å bruke “Navn” -egenskapen til “To_Frame ()” -metoden.

Vi oppretter et objekt "endelig" for å lagre hele DataFrame. For å binde alle de 3 Dataframes, bruker vi “PD.concat () ”funksjon og passere de 3 dataframene som verdier. Den vil binde alle dataframene i ett komplett dataframme og lagre den i "Final" -objektet. Til slutt bruker vi metoden “Print (Final)” for å vise DataFrame som er lagret i “Final” -objektet.

Når vi kjører ovennevnte kode, viser vi en serie konverterte DataFrame med tre kolonner, kalt “Navn”, “Poeng” og “Assists”.

Konklusjon

Denne artikkelen er en guide for deg å lære og forstå begrepet seriekonvertering til en pandas dataaframe. Å transformere en serie til en dataaframe er en enkel praksis ved hjelp av Pandas -funksjoner. Vi forklarte deg først teknikkene for å konvertere en enkelt serie til en datafram, og deretter utdypet vi konvertering av flere serier til flere Dataframes og deretter kombinere alle enkeltkolonne DataFrames til en enkelt sammenkoblet dataFrame ved å bruke "concat ()" -metoden " av pandas. Vi ga også en utgang for hver tilnærming vi har brukt. Vi forventer at dette stykke skriving vil bli vist seg gunstig for å ta tak i Pandas -funksjoner.