Pandas får indeks

Pandas får indeks
“Å finne radindeksene er nødvendig, noe som er avgjørende for funksjonsingeniør. Disse evnene kan hjelpe deg med å eliminere outliers eller avvikende tall fra en dataaframe. Et viktig verktøy for å få spesifikke rader eller kolonnedata fra Pandas DataFrame kalles en Pandas -indeks. Det er ansvarlig for å sette opp dataene for rask tilgang og organisering. Et annet navn for indeksen er valg av undergruppe. Den spesielle indeksverdien blir referert til som en etikett. Indeksverdiene er skrevet med fet skrift. Vi kan være pålagt å hente rad- eller indeksnavnene når vi undersøker ekte datasett, som ofte er veldig store for å utføre spesifikke operasjoner. Vi vil demonstrere hvordan du kan trekke ut indeksene fra Pandas DataFrames i denne artikkelen.”

Hvordan få indeksene fra DataFrame i Pandas?

Ved hjelp av forskjellige funksjoner og egenskaper er det flere måter å hente indekser fra Dataframe i pandaer. Vi forklarer hvordan du trekker ut dataframindekser ved å bruke noen forskjellige teknikker i følgende eksempler.

Først vil vi se DataFrame.indeksegenskap. Indeksegenskapen til en Pandas dataaframe brukes til å få radindeksen. Dataframes radetikett blir returnert som et objekt av DataFrame.indeksfunksjon.

Eksempel 1: Få indeksene ved å iterere over indeksene til DataFrame

For å hente ut indeksen, la oss først opprette en dataaframe slik at vi kan iterere gjennom radindeksene. Vi må først laste Pandas -modulen ved å importere den til å bruke funksjonene før vi oppretter DataFrame. Vi oppretter DataFrame ved hjelp av PD.DataFrame () -metode.

"DF" DataFrame er opprettet. “PD.DataFrame () ”-metoden har tatt Python -ordboken med nøkler og verdier som et argument. Print () -funksjonen brukes til å illustrere DataFrame. I "DF" Dataframe har vi tre kolonner, "Col1", "Col2" og "Col3", som lagrer verdiene (3, 4, 5, 6, 7, 8, 9), (9, 8, 7 , 6, 5, 4, 3) og (1, 3, 5, 7, 8, 0, 11). Python -konstruktøren oppretter en standard heltallsrekkeindeks på venstre side av hver rad (starter fra 0). La oss nå iterere gjennom indeksene for å få indeksene til DataFrame ved å bruke DataFrame.indeksegenskap.

Indeksegenskapen har hentet indeksene fra DataFrame. Som du kan se, startet radindeksene i DataFrame på 0 og endte klokka 6.

Eksempel 2: Få indeksene som et listeobjekt

Først vil vi opprette et dataaframe med tilpassede indekser. Vi vil spesifisere de ikke-numeriske etikettene for radindeksene i DataFrame.

Det kan sees at radindeksen ikke er en heltallindeks lenger, da vi har spesifisert listen over etiketter som [“R1”, “R2”, “R3”, “R4”, “R5”, “R6”, “R7 ”] Til indeksparameteren til PD.DataFrame () -funksjon. Vi har laget tre kolonner “C1”, ”C2” og C3 ”lagring av dummy -data (33, 45, 12, 78, 34, 86, 23), (26, 37, 76, 25, 97, 53, 31) , og (17, 74, 95, 63, 54, 56, 19). Nå bruker vi listen () -funksjonen for å få listen over indeksetiketter. Et listeobjekt kan opprettes ved hjelp av listen () -funksjonen. En bestilt modifiserbar samling blir referert til som et listeobjekt.

Inne i listen () -funksjonen har vi brukt indeksegenskapen for å hente indeksene til DataFrame. Listen () -funksjonen lagrer dem deretter som elementene til et listeobjekt.

Eksempel nr. 3: Få en rekke indeksen ved å bruke indeksen.Verdier () Metode

I dette eksemplet indeksen.Verdi -metoden vil bli brukt til å hente indeksene til DataFrame. Et skiver bestilt sett implementert av den uforanderlige ndarray kalt Pandas Index. Aksenavnene for alle objektene til pandaer er lagret i dette grunnleggende objektet. Indeksen.Verdier attributt til Pandas returnerer en matrise som inneholder dataene i det spesifiserte indeksobjektet.

Vi har opprettet den tilpassede indeksen ved å definere en liste over etiketten ['I', 'II', 'III', 'IV', 'V', 'vi', 'vii'] i indeksparameteren. Det er tre kolonner i Dataframe. Kolonnen "x" lagrer verdier ('a', 'b', 'c', 'd', 'e', ​​'f', 'g'), kolonne "y" som inneholder dataverdiene ('h' , 'i', 'j', 'k', 'l', 'm', 'n'), og kolonnen "z" med verdiene ('o', 'p', 'q', 'r ',' S ',' T ',' U '). Nå bruker vi indeksen.Verdier metode for å få indeksene fra DataFrame “DF”.

Vi kan også bruke Tolist () -funksjonen med indeksen.Verdier Metode for å hente indeksene til DataFrame.

En spesifisert matrise kan transformeres til et vanlig listeobjekt med de samme verdiene, elementene eller elementene ved å bruke Tolist () -funksjonen.

Eksempel 4: Få indeksene ved å bruke spørring () og tolist () -metoder

Denne teknikken lar oss bare hente de spesifikke Pandas DataFrame -objektindeksene som oppfyller visse kriterier. Bruke “PD.DataFrame () ”-metode og spørring () -metoden til Pandas, en Pandas DataFrame vil bli opprettet i denne metoden. Bruke spørringen () -metoden på en dataaframe og gi den en tilstand får den til å returnere en dataaframe som bare inneholder radene som samsvarer med kriteriene/oppfyller tilstanden. Deretter bruker vi Tolist () -metoden sammen med indeksattributtet, som vil returnere en liste som inneholder indeksverdiene til DataFrame. La oss undersøke Python -koden som brukes til å oppnå denne praktiske teknikken for å hente indeksene til DataFrame -objektet som tilfredsstiller de spesifiserte forholdene.

Vi har laget en dataaframe som har indeksetiketter som ['01', '02', '03', '04', '05', '06']. Kolonnensetikettene til DataFrame er spesifisert som "Navn", "Alder" og "Høyde" med verdier ('Alexa', 'Mark', 'Ryan', 'Bob', 'Tom', 'Joe'), (21 , 20, 21, 24, 22, 23) og (5.4, 5.8, 5.7, 6.1, 5.9, 6.2) henholdsvis.

Inne i spørringen () -funksjonen har vi spesifisert en betingelse for å hente de radene der verdien i kolonnen "høyde" er større enn 5.7. Deretter brukte vi indeksattributtet til å trekke ut indeksene for hentede rader, mens tolist () -funksjonen konverterte de returnerte indeksene til en liste i.e. ['02', '04', '05', '06].

Eksempel 5: Få indeksverdien til kolonnen etter get_loc () -funksjon med kolonnerattributt

I de tidligere eksemplene har vi sett hvordan vi kan få indekser over dataaframe -rader, men nå vil vi hente kolonneindeksverdien til en spesifikk kolonne ved hjelp av get_loc () -metoden sammen med kolonnens attributt. Indeksverdien til et bestemt kolonnenavn i en Pandas DataFrame vil bli returnert i dette eksemplet. Kolonnens attributt og get_loc () -funksjonen vil begge brukes til denne oppgaven. Variabelnavnet vi liker å velge vil bli spesifisert som en strengverdi i Get LOC -metoden.

Ved å bruke en Python -ordbok inne i PD.DataFrame () -funksjonen, vi har laget vår DataFrame. Det kan observeres at det er 5 kolonner i Dataframe som har navn “A”, “B”, “C”, “D” og “E”. La oss bruke kolonneattributtet med get_loc () -funksjonen for å få indeksverdien til kolonnen “D”.

For dette vil vi legge navnet på kolonnen, jeg.e., “D”, som en streng inne i get_loc () -funksjonen.

Kolonnen “D” er plassert til indeksverdi 3.

Konklusjon

I denne opplæringen har vi prøvd å lære hvordan du kan få indeksene til Pandas Dataframe i Python. Vi har diskutert hvilke indekser i pandaer er og hvordan du kan hente dem ved hjelp av forskjellige funksjoner og attributter. Vi implementerte forskjellige eksempler for å lære deg hvordan du kan få indeksene ved å iterere over indeksene til DataFrame, ved hjelp.