Pandas multiindex

Pandas multiindex
Når vi snakker om open source-bibliotekene til “Python”, er “Pandas” en av dem. Vi bruker dette biblioteket når vi trenger å manipulere og analysere dataene. Vi kan bruke “Pandas” -modulene for å lage de forskjellige seriene eller DataFrame. Noen ganger må vi justere de flere kolonnene som indekskolonnene i DataFrame. “Pandas” gir en "multiindex" -metode for å lage mer enn en indeks. "MultiIndex" -metoden gir muligheten til å velge flere rad eller kolonner som indeksene for den dataframmen. Vi vil lære om “MultiIndex” -metodene i denne guiden og også gjøre noen koder der vi bruker "MultiIndex" -metodene til "Pandas" for å lage flere indekser.

Pandas multiindex -metoder

"Pandas" gir mange metoder for "multiindex" som vi bruker for å lage flere indekser. Disse er:

  • Multiindex.FRA_FRAME
  • Multiindex.fra_produkt
  • Multiindex.fra_arrays
  • Multiindex.fra_tuples

Nå går vi videre og bruker disse "multiindex" -metodene som vi tidligere nevnte i "Pandas" -koden her.

Eksempel 1:

Den første koden til denne guiden er gitt her. Vi har gjort alle kodene som vi vil diskutere i denne guiden i "Spyder" -verktøyet. Hver gang vi ønsker å utvikle "Pandas" -koden, må vi importere noen "pandaer" -moduler. Vi kan importere disse ved å bare bruke nøkkelordet "importere" og skrive "pandaene som PD". Nå, i denne koden, får vi funksjonene til “Pandas” ved å plassere “PD”. Vi lager noen matriser her. Den første matrisen heter “Raw_names”, og den inneholder “Smith, James, Bromley, Peter og Samuel”. Neste matrise heter “Raw_ages” der vi lagrer verdiene “10, 11, 15, 12 og 13”. Den siste matrisen vi har er “Raw_marks” som inneholder “90, 92, 83, 74 og 88”.

Etter å ha opprettet disse matriser, bruker vi “MultiIndex” -metoden her som er “MultiIndex.fra_Arrays () ”-metoden. Vi plasserer navnet på alle tre matriser i denne metoden, noe som betyr at disse tre matriser er kombinert slik at komponentene fra hver matrise kan brukes til å lage flere indekser. I navnene passerer vi “Navn, aldre og merker”. Nå viser vi resultatet av den nevnte koden her ved å bruke "print ()" -funksjonen.

Når vi treffer "skift+enter", får vi dette resultatet. Når koden er feilfri, blir følgende utfall gjengitt på skjermen. Den viser multiindex her vi opprettet i denne koden:

Eksempel 2:

I denne koden oppretter vi DataFrame. Vi oppretter listen "arbeider_informasjon" her. Vi legger til "navnet" som vises som kolonnenavnet når vi konverterer det i DataFrame og setter inn "William, Timmy, James, Alexander og Graham". "Arbeidet" inneholder "programvareingeniør, programvaretester, spiller, selger og lærer". Deretter har vi "Monthly_Salary" der vi setter lønnen til arbeidere "$ 1500, $ 1200, $ 1100, $ 1300 og $ 1500". Deretter konverterer vi denne nestede listen i DataFrame. Vi bruker “PD.DataFrame () ”her for å gjøre dette.

Deretter hjelper "print ()" oss med å gjengi denne dataframmen. Nå har vi en variabel her kalt “Resultat” og bruker “MultiIndex.fra_frame () ”-metoden for å lage alle kolonnene som indeksen. Det skaper en multiindex av denne gitte dataaframe ved hjelp av denne metoden. Etter dette legger vi til denne variabelen i "print ()", så den gjengis etter utførelsen.

Her sees Dataframe først i dette utfallet, og multiindex vises sammen med følgende verdier. Vi får disse flere indeksene ved å bruke “MultiIndex.FRA_FRAME () ”-metoden.

Eksempel 3:

Vi bruker "arbeider_df" i dette eksemplet igjen. Denne gangen legger vi til en ny kolonne til denne DataFrame som er "W_NO". Vi legger også til noen data i denne kolonnen som er "W101, W102, W103, W104 og W105". Nå bruker vi en annen metode her for å lage flere indekser for denne DataFrame. Vi bruker “DF.set_index ”-metode her der vi legger navnene på to kolonner som er“ W_NO og Name ”. Deretter legger vi til "inplace" og "vedlegg" til både "sann" og "slipp" til "falsk". Så det vil ikke slippe kolonnene.

Disse kolonnene vises to ganger i DataFrame. Indeksen, så vel som kolonnen, vises her. Deretter bruker vi "print ()" på "arbeider_df". "Worker_df" er gjengitt. Nå viser vi også indeksene separat ved å sette “arbeider_df.Indeks "i" trykk "etter å ha vist den oppdaterte dataafame der vi angir disse flere indeksene.

I den første DataFrame vises bare standardindeksen, og det er ingen annen indekskolonne i denne DataFrame. Men følgende DataFrame viser flere indekser. Du kan enkelt se indeksene “W_NO og Name” som vi opprettet i koden. Disse indeksene sammen med verdiene vises separat på slutten.

Eksempel 4:

Vi konstruerer de forskjellige matriser igjen i denne koden. "Callum, Tyler, Chloe, Lewis, Hazel, John og Peter" er alle oppført i den første matrisen. "Patient_name" heter her. Følgende matrise, “Patient_age”, inneholder verdiene “28, 33, 45, 17, 22, 44 og 29”. Den siste matrisen kalles “Patient_Contact” og den inneholder tallene “1001234, 1001235, 1001236, 1001237, 1001238, 1001239 og 1001240”.

Her bruker vi “MultiIndex” -metoden som er “MultiIndex.fra_arrays () ”-funksjonen etter å ha opprettet disse matriser. Vi passerer da navnene på disse tre matriser i “MultiIndex.fra_arrays ”for å lage disse matriser som indeksene her. Vi legger også til "foreldre, alder og kontakt" i navnene. Etter dette har vi “Print ()” som hjelper oss med å gjengi dataene fra “Patient” -variabelen der vi lagrer flere indekser etter å ha brukt “MultiIndex.from_arrays ”-metoden.

Dette utfallet viser alle indeksene som vi la til koden. Navnet er også nevnt her. Alle matriser er satt her som flere indekser ved hjelp av “MultiIndex.fra_Arrays () ”-metoden.

Eksempel 5:

Nå, her er den siste koden til denne guiden der vi genererer DataFrame og oppretter flere indekser for denne DataFrame. For å lage DataFrame, må vi legge til noen data her. Vi legger til alle dataene i "XYZ" -variabelen. Vi legger først til "XYZ_Name" som inneholder "John, Michael, Foster, Samuel, Bromley, Smith og Fuller". Deretter har vi “XYZ_CODES” og vi satte “XYZ23, XYZ24, XYZ25, XYZ26, XYZ27, XYZ28 og XYZ29”. Nå kommer “XYZ_MONTH” som inneholder “Jan, februar, mars, april, mai, juni og juli”. Vi legger deretter til “XYZ_UNITS” der vi setter “20, 14, 19, 46, 35, 20 og 53”.

Nå lager vi “XYZ_DATAFRAME” og plasserer “PD.DataFrame () ”-metode her som oppretter dataaframet til“ XYZ ”-dataene. Deretter viser vi også “XYZ_DATAFRAME”. Nå lager vi flere indekser for DataFrame, så vi bruker “MultiIndex.FRA_FRAME () ”-metoden. Dette oppretter flere indekser for denne dataaframe og lagrer dem i variabelen “XYZ_DATAFRAME1”. Denne variabelen er også plassert i "print ()" slik at disse indeksene vises på terminalen.

Den viser “XYZ_DATAFRAME”. Deretter er det indeksene som opprettes etter å ha brukt “MultiIndex.FRA_FRAME () ”-metoden. Alle indekser sammen med verdiene og kolonnenavnene vises i dette utfallet.

Konklusjon

Denne guiden er skrevet her for å avklare konseptet "MultiIndex" i "Pandas". Vi diskuterte de forskjellige metodene for "multiindex" som "pandaer" gir. Vi diskuterte også noen av dem i detalj her. Vi brukte disse metodene i "Pandas" -kodene her og viste hvordan de flere indeksene opprettes i "Pandas" ved hjelp av "MultiIndex" -metoder. Vi brukte disse metodene på matriser og dataaframe og forklarte alle disse kodene i dyp detalj. Vi viste DataFrame før vi opprettet flere indekser og etter å ha opprettet flere indekser ved å bruke "Pandas" multiindex -metoden. Vi viste flere indekser separat i disse kodene også.