Pandas Reindex

Pandas Reindex

“I“ Pandas ”kan vi lagre mye informasjon i tabellform, som også er kjent som DataFrame. “Pandas” letter oss med “DataFrame ()” -metoden for å konstruere DataFrame. DataFrame inneholder indekser, og vi kan også endre indeksene til DataFrame ved å bruke "Pandas" -funksjonene. Metoden som vi bruker for å gjenindeksere DataFrame er metoden “Reindex ()”. Denne metoden hjelper med å endre radens indeksverdier så vel som indeksverdiene til kolonnene. Ved å bruke denne metoden, kan vi endre standardindeksen til DataFrame, og også kan vi endre indeksen som vi setter mens vi oppretter DataFrame. Vi vil bruke "Reindex ()" -metoden i "Pandas" -eksemplene i denne opplæringen og vil forklare dette konseptet grundig her.”

Eksempel nr. 01

"Spyder" -verktøyet hjelper oss med å utvikle "pandas" -koden her i denne opplæringen, og vi starter koden vår med nøkkelordet "import", som vil hjelpe deg med å importere "pandas" -funksjonen. Vi plasserer "Pandas som PD" etter å ha skrevet "importen". Etter dette oppretter vi DataFrame ved å skrive “PD.Dataramme()". Vi skriver denne “PD” her fordi “DataFrame ()” er metoden for “Pandas”. "Value_df" er navnet på variabelen som DataFrame er lagret. Vi legger til "RandomName", som er kolonnenavnet, og "RandomName" inneholder "Thomas, Oscar, Lilly, Rowan, John, Bromley, Peter, Alexander og Samuel".

Deretter har vi “Value_1”, der vi har satt inn “16, 29, 24, 35, 44, 50, 69, 74 og 88”. Så kommer “Value_2”, og vi har lagt til “25, 38, 42, 56, 54, 65, 78, 89 og 99”. Nå kommer “Value_3” neste, og vi plasserer “36, 48, 52, 69, 74, 75, 87, 91 og 69” i den. Kolonnen “Value_4” er til stede etter dette, der vi har satt inn “52, 64, 72, 88, 82, 95, 97, 21 og 39”. Den siste kolonnen er kolonnen “Value_5” her, og i denne kolonnen er verdiene vi har lagt til “66, 78, 82, 99, 34, 45, 57, 61 og 89”. Etter dette bruker vi "print ()" -funksjonen der "verdier_df" legges til så. Den vil skrive ut på terminalen.


Etter å ha trykket på "Shift+Enter", kan vi enkelt få resultatet av kodene våre i "Spyder" -appen. Her returnerer denne koden DataFrame med standardindeksen. Nå vil vi bruke "Reindex ()" -metoden for å gjenindeksere denne dataaframe i "Pandas".


"Reindex ()" -funksjonen brukes her for å gjenindre radens indeksverdi. I ovennevnte DataFrame kan du se at standardindeksverdiene for raden vises, og nå bruker vi metoden “Reindex ()” for å gjenindeksere disse radindeksene. Vi plasserer DataFrame -navnet og deretter "Reindex ()" -metoden der vi plasserer de indeksverdiene som vi ønsker å legge til ovennevnte DataFrame. Vi setter “Ind_A, Ind_B, Ind_C, Ind_D, Ind_E, Ind_F, Ind_G, Ind_H og Ind_I” i "Reindex ()" -funksjonen. Så disse radernes indekser vil bli oppdatert på DataFrame når vi utfører denne koden.


Verdiene for radens indeks vises i dette utfallet, og du kan merke at DataFrame -verdiene ikke vises her, og “NAN” -verdiene har dukket opp. Dette er fordi de nye indeksverdiene ikke samsvarer med de forrige indeksverdiene til DataFrame. Når den nye indeksen og gamle indeksen ikke stemmer overens, viser den “Nan” der. Disse “NAN” -verdiene vises som standard når vi endrer indeksen, og den samsvarer ikke med forrige indeks.

Eksempel # 02

Vi endrer nå kolonneindeksverdiene til "Value_df", som vi tidligere har laget i eksempel 1. Etter å ha skrevet ut “Value_df”, satte vi “kolonnen” -variabelen og lagt til noen verdier til den. Vi legger til “A_1, B_1, C_1, D_1 og E_1”. Nå ønsker vi å justere disse verdiene som indeksen for kolonnene, så for dette bruker vi “Reindex ()” -metoden og plasserer navnet på variabelen “Kolonne” der de nye kolonneindeksverdiene er lagret og Sett også "aksen" til "kolonner", så den vil oppdatere kolonneakseindeksen. Vi setter metoden “Reindex ()” i “Print ()”, så den vil også gjengi på terminalen.


Som vi har brukt "Reindex ()" -metoden, blir kolonneindeksverdiene som er til stede i den første DataFrame oppdatert, og nye verdier blir lagt til i den oppdaterte DataFrame. Du kan også merke deg at alle verdiene til DataFrame blir konvertert til “NAN” fordi begge indeksverdiene for kolonnene er forskjellige.

Eksempel # 03

"Programming_data" i denne koden inneholder "P_Languages", der vi har lagt til "JavaScript, CSS, Web Engineering, OOP, C#, AI, Java og Javascript". Deretter har vi "timer" der vi plasserer “4_hrs, 2_hrs, 3_hrs, 7_hrs, 6_hrs, 5_hrs, 8_hrs og 6_hrs”. Etter dette legges "P_Code" inn, og vi setter inn "11523, 12423, 12321, 11456, 11454, 12267, 13106 og 14123" ". Vi legger til "p_index" -variabelen og legger "pro_a, pro_b, pro_c, pro_d, pro_e, pro_f, pro_g og pro_h".

Disse verdiene vil bli brukt som indeksverdiene for radene. Vi endrer "programmering_data" i "programmering_df" dataaframe. Vi legger også til "P_Index" til denne DataFrame ved å bruke "indeksen" -metoden. Vi setter "programmering_df" og deretter "indeks" -metoden og tilordner "p_index" til dette. Nå blir de ovennevnte indeksverdiene lagt til som radindeksverdiene til DataFrame. Vi skriver ut "programmering_df" også.

Etter dette legger vi til noen nye indeksverdier i variabelen “New_index”, og dette er “P_1, P_2, P_3, P_4, P_5, P_6, P_7 og P_8”. Når vi ønsker å oppdatere indeksverdiene til rader, bruker vi metoden “Reindex ()” og legger “new_index” som parameter for denne funksjonen og lagrer også den oppdaterte DataFrame i "newprogramming_df" og plasserer "newprogramming_df" i " print () ”for visning.


Indeksverdiene er oppdatert, og vi kan også si at vi har gjenindekset DataFrame som vi har opprettet. Alle verdiene til DataFrame er også konvertert til “NAN” fordi begge indeksverdiene er forskjellige.

Eksempel nr. 04

Vi endrer for tiden "programmering_dfs" indeksverdier for kolonner, som vi tidligere har utviklet i eksempel 3. Vi plasserer "kolonne" -variabelen og setter inn nye verdier i den. "P_code, P_Languages, Hours and New" legges til "kolonnen" -variabelen. Deretter bruker vi igjen "Reindex ()" -metoden der vi setter "kolonnen" -variabelen, som vil oppdatere de forrige kolonneindeksverdiene og legge til disse nye kolonneindeksverdiene til DataFrame.

Her kan du merke at de nye verdiene som vi har lagt til i "kolonne" er de samme som vi har lagt til i ovennevnte DataFrame, men sekvensen er annerledes, så den vil endre sekvensen til kolonnene og justere alle kolonnene som vi nevnt i "kolonnen" -variabelen. Vi legger også til en indeksverdi til som ikke er til stede i ovennevnte DataFrame, som er "nytt" her, så "nan" -verdiene vil vises i denne kolonnen.


Sekvensen av kolonnene endres her, og alle verdier vises som den er til stede i den originale DataFrame -kolonnene og den "nye" kolonnen i den oppdaterte DataFrame inneholder alle “NAN” -verdier fordi denne kolonnen ikke er til stede i den originale DataFrame.

Konklusjon

Vi har presentert denne opplæringen som hjelper oss med å forstå "Pandas Reindex" -oppfatningen i detalj. Vi har diskutert hvordan vi kan reindex en dataaframes kolonne så vel som radens indeksverdier. Vi har forklart at "reindex ()" -funksjonen til "pandas" brukes til å gjøre dette. Vi har gjort forskjellige eksempler der vi har endret indeksverdiene for radene til DataFrame, og også indeksverdiene til kolonneindeksen til DataFrame. Vi har gitt resultatene av alle kodene som vi har gjort her i denne opplæringen, og forklarte dem også dyptgående.