Pandas Set Index

Pandas Set Index
Pandas '"set_index" -funksjon brukes til å definere DataFrame eller serien som nøkkelen til en DataFrame. Pandas '"set_index ()" -funksjon oppretter DataFrame -indeksen ved å utnytte eksisterende eksisterende kolonner. Indeksen kan erstatte eller utvide dagens indeks.

Syntaksen for denne metoden er som følger:

Den første parameteren “Keys” klassifiserer kolonnenavnet som vi ønsker å angi som indeksen. “Append” -attributtet legger til den medfølgende kolonnen når verdien av indeksen er satt til sann. "Slipp" -parameteren slipper kolonnene. Standardverdien er "sann". "Inplace", når den er verdsatt som "sann", gjør endringene i den opprinnelige Dataframe og lager ingen kopi av den. Den siste parameteren "Verify_integrity" sjekker for duplisering av den nye kolonneindeksen.

Vi lærer den praktiske utførelsen av denne metoden gjennom forskjellige teknikker i denne artikkelen.

Eksempel 1: Bruke metoden Set_index () for å endre indekskolonnen

Denne demonstrasjonen vil utdype bruken av pandaene “DF.set_index () ”-metode for å endre standardindekslisten i en DataFrame til en brukerdefinert indekskolonne.

"Spyder" -verktøyet lanseres for å begynne å jobbe med samlingen og utførelsen av manuset. Vi har først lastet de nødvendige bibliotekene inn i programmet. Pakken vi trengte her er “Pandas”. Så vi importerte det som "PD".

Vi har generert en dataaframe ved å bruke Pandas -metoden “PD.Dataramme()". Du har valget om å enten importere en CSV -fil eller opprette en DataFrame ved hjelp av “PD.DataFrame () ”-metode. “PD.DataFrame () ”-funksjon i påberopt med 4 kolonner“ EMP_NAME ”,“ Experience ”,“ Income ”og“ Bonus ”. Hver kolonne lagrer 11 verdier.

Vi har verdier for kolonnen "emp_name" som "a", "b", "c", "d", "e", "f", "g", "h", "i", "j", og “K”. Oppføringene for kolonnen “Experience” er “5”, “2”, “17”, “21”, “9”, “20”, ”11”, “32”, “23”, “14” og “30”. Den tredje kolonnen vi har er "inntekt" som lagrer disse verdiene "40000", "30000", "100000", "50000", "40000", "70000", "200000", "95000", "60000", “27000”, og “98000”. "Bonus" -kolonnen holder disse verdiene “30000”, “40000”, “60000”, “30000”, “86000”, “50000”, “60000”, “95000”, “76000”, “27000” og og “78000”.

“PD.DataFrame () ”-metoden vil konstruere en DataFrame med disse medfølgende verdiene. For å lagre DataFrame, har vi opprettet et DataFrame -objekt “Record”. Vi tildelte det utgangen av å kalle “PD.DataFrame () ”-funksjon. Til slutt vises innholdet på konsollen ved å utøve Pythons "print ()" -funksjon.

Når vi utfører Python -programmet ved å klikke på alternativet "Kjør fil", ser vi en DataFrame med 4 kolonner og 11 rader. Denne DataFrame har blitt vist med standardindekslisten som starter fra “0” og går opp til lengden på DataFrame.

Det kan hende du må endre indekskolonnen til DataFrame noen ganger. Her lærer vi å endre indekskolonnen i en dataaframe ved å bruke “DF.set_index () ”-metode. Ved å bruke denne metoden, vil vi endre standardindekskolonnen med en eksisterende kolonne i den medfølgende DataFrame.

Vi har påkalt “DF.set_index () ”-metode. Navnet på DataFrame leveres som "post" med "set_index ()" -funksjonen. Mellom parentesene i denne funksjonen har vi gitt navnet på kolonnen som vi trenger å angi som indekskolonnen i den resulterende DataFrame. Kolonnen vi har nevnt er “emp_name”. Så, "set_index ()" -metoden vil se på "posten" DataFrame, finne kolonnen merket som "emp_name", og angi den som indekskolonnen etter å ha droppet standard indekskolonne. Resultatet lagres i variabelen “Innstillingen”. Ved hjelp av "print ()" -funksjonen viste vi den på skjermen.

Output DataFrames indekskolonne blir endret fra standardlisten til “emp_name”. Den resulterende utgangen er gitt på bildet nedenfor.

Eksempel nr. 2: Bruke metoden SET_INDEX () for å endre indeksen til flere indekskolonner

Når vi endrer indeksen for DataFrame, kan vi sette enda mer enn en kolonne som indeksene for DataFrame. La oss utforske konseptet gjennom Python -programmet.

For denne illustrasjonen har vi brukt DataFrame opprettet i foregående eksempel. “DF.set_index () ”-metoden påkalles. Vi har kalt funksjonen med følgende parametere: “Keys”, “Inplace”, “Append” og “Drop”. Indeksnøklene vi har gitt her er "emp_name" og "inntekt". To kolonner er valgt fordi vi må angi mer enn en kolonne som indeksene i DataFrame. Parameteren "Inpleat" er satt "sant", noe som betyr at sjansene vil bli gjort i selve DataFrame uten å lage noen kopi av den.

Vi har satt verdien "sann" for "vedlegg" -attributtet. Å holde det sant vil legge til de nye indekskolonnene med den allerede eksisterende eller standardindekskolonnen. Den siste egenskapen vi har brukt her er "slipp" med verdien "falsk". Så det vil ikke slippe kolonnene vi har satt for indeksen fra DataFrame. Ettersom endringene foretrekkes å bli gjort i selve DataFrame, så trenger vi ikke å lage noe objekt. Bare å skrive ut selve DataFrame etter innstilling av indeksen vil vise oss endringene. Vi har brukt "Print ()" -funksjonen for å vise resultatet.

Vår oppdaterte faktiske DataFrame vises som har en standardindekskolonne, så vel som de to ny spesifiserte indekskolonnene som "emp_name" og "inntekt".

Eksempel nr. 3: Bruke metoden SET_INDEX () for å endre indekskolonnen med kolonnen Float Value

Vi kan også endre standardindekskolonnen og angi en flottørkolonne som indekser i DataFrame. Vi vil se dens praktiske implementering her.

Vi må først opprette en kolonne med flyteverdier i DataFrame. Dataframe fra første forekomst brukes igjen, bortsett fra at verdiene i "bonus" -kolonnen er flyte nå. Vi har gitt disse verdiene for "bonus" -kolonnen: "30.87 ”,“ 40.16 ”,“ 60.98 ”,“ 30.87 ”,“ 86.32 ”,“ 50.92 ”,“ 60.11 ”,“ 95.12 ”,“ 76.24 ”,“ 27.35 ”, og“ 78.52 ”. Deretter trykket vi den oppdaterte DataFrame ved hjelp av "print ()" -funksjonen.

DataFrame med den oppdaterte "bonus" -kolonnen er utstilt.

Vi påkalte “DF.set_index () ”-metoden og angi indeksnøkkelkolonnen som" bonus ". Parameteren "Inplace" er verdsatt som "sann". Så endringene vil bli gjort i selve DataFrame.

Float -kolonnen er satt som indekskolonnen i DataFrame som kan sees på bildet nedenfor.

Eksempel 4: Bruke metoden Set_index () for å angi multiindex i kopien av DataFrame

Vi kan angi multiindex i DataFrame ved å bruke metoden “set_index ()”. “Set_index” -metoden påberopes med navnet på DataFrame “Record”. Innenfor de runde seler har vi initialisert abonnementsoperatøren og definert navnene på kolonnene som "emp_name" og "erfaring". Her har vi foretrukket å utføre funksjonen med standardinnstillingene der "inplace" er satt som "falsk". Manipulasjoner vil bli utført i kopien av DataFrame.

For å lagre denne DataFrame -kopien, har vi opprettet en variabel “Multi_index”. Til slutt viste vi innholdet i kopien av DataFrame som er lagret i "Multi_index" -variabelen ved å bruke "print ()" -funksjonen.

Dette gir oss følgende utfall:

Konklusjon

I denne læringsøkten har vi demonstrert behovet for å endre indekskolonnen i en dataaframe. Pandas ga metoden “DF.set_index ”brukes i denne opplæringen for å oppnå ønsket resultat. Vi har gitt syntaks for å bruke denne funksjonen med en kort beskrivelse av parametrene. Alle teknikkene for å utøve "set_index ()" -funksjonen blir praktisk talt implementert på Spyder -verktøyet. Vi kan bruke metoden i henhold til vårt behov for om vi ønsker å sette en enkelt kolonne som en indeksnøkkel eller flere kolonner.