Pandas DataFrame Indexing

Pandas DataFrame Indexing
I pandaer innebærer indeksering å velge spesifikke kolonner og rader med data ut av en dataaframe. Å velge alle radene og til og med noen av kolonnene, en del av radene og alle kolonnene, eller noen av hver av radene og kolonnene er det indeksering innebærer. Undergruppeutvalg er et annet navn for indeksering. Når vi bygger et Pandas DataFrame -objekt i Python ved hjelp av PD.DataFrame () -funksjonen fra Pandas -modulen, en adresse i raden eller kolonneindeksene produseres automatisk for å symbolisere hvert dataelement/punkt inne i DataFrame. Imidlertid er radindekser DataFrames indeks, mens kolonneindekser ganske enkelt blir referert til som kolonner. En Pandas DataFrame -objekts indeks identifiserer i hovedsak visse rader. La oss se på hvordan du endrer Pandas indeks DataFrame -objekt.

Eksempel 1

Indeksalternativet i Python kan brukes til å angi indeksen for en dataframe når det opprettes. Vi vil generere en liste og sende den til PD.DataFrame () Metodens indeksparameter. La oss sette dette ut i praksis med Python -kode. Vi har importert Pandas -modulen her. Etter det laget vi en ordbok og en Python -liste. Ordboken ble brukt til å starte utviklingen av DataFrame. Som du ser, brukte vi DataFrame -funksjonen med indeksparameteren for å gjøre "RR" -kolonnen til indeksen.

Importer pandaer som PD
dd = 'navn': ['Alex', 'ramen', 'Zayn', 'Travis', 'Scott'],
'Marks': [33, 66, 88, 67, 78],
'City': ['New York', 'Los Angeles', 'Chicago', 'San Diego', 'Dallas']
RR = [1, 2, 3, 4, 5]
FF = PD.DataFrame (DD, Index = RR)
trykk (FF)

Se utgangen i følgende bilde.

Eksempel 2

I Python kan vi bruke forskjellige metoder for å lage indeksen for eksisterende kolonne eller kolonner i et Pandas DataFrame -objekt. I dette scenariet vil vi bruke Python Pandas -modulens Set Index () -metode's inplace -argument. Argumentet i plass er satt til False som standard. Imidlertid skal vi sette verdien av InPace til True i dette tilfellet. Den eksisterende kolonnen sendte til PD.Set Index () -metoden som den nye indeksen erstatter DataFrames gamle indeks. La oss se hvordan dette fungerer.

Importer pandaer som PD
dd = 'navn': ['Alex', 'ramen', 'Zayn', 'Travis', 'Scott'],
'Rollnum': ['1', '2', '3', '4', '5'],
'City': ['New York', 'Los Angeles', 'Chicago', 'San Diego', 'Dallas']
FF = PD.DataFrame (DD)
Print ("\ Ninitial DataFrame:")
trykk (FF)
ff = ff.set_index ('rollnum')
print ("\ nfinal dataaframe:")
trykk (FF)

Utgangen er gitt i følgende skjermbilde.

Eksempel 3

I dette tilfellet vil vi bruke drop -argumentet fra Python Pandas Modul's Set Index () -funksjon. Vi skal imidlertid sette fallargumentet til usant i dette tilfellet. Slik at DataFrame ikke mister kolonnen som er tildelt som den nye indeksen. La oss sette dette ut i praksis med koden nedenfor.

Importer pandaer som PD
dd = 'rollnum': ['1', '2', '3', '4', '5'],
'Navn': ['Alex', 'Ramen', 'Zayn', 'Travis', 'Scott'],
'Marks': [33, 66, 88, 67, 78]
FF = PD.DataFrame (DD)
Print ("\ Ninitial DataFrame:")
trykk (FF)
ff = ff.set_index ('navn', slipp = falsk)
print ("\ nfinal dataaframe:")
trykk (FF)

Her er resultatet.

Eksempel 4

Ved å lage en liste over DataFrame -kolonnenavn og sende den til SET -indeksen () -funksjonen, kan vi angi flere kolonner i Pandas DataFrame -objektet akkurat som indeksen. Som et resultat blir indeksen referert til som multi-indeks i dette scenariet.

Importer pandaer som PD
dd = 'rollnum': [1, 2, 3, 4, 5],
'Navn': ['Alex', 'Ramen', 'Zayn', 'Travis', 'Scott'],
'Marks': [33, 66, 88, 67, 78],
'City': ['New York', 'Los Angeles', 'Chicago', 'San Diego', 'Dallas']
FF = PD.DataFrame (DD)
Print ("\ Ninitial DataFrame:")
trykk (FF)
ff = ff.set_index (['rollnum', 'name'])
print ("\ nfinal dataaframe:")
trykk (FF)

Her kan du se utdataene fra koden gitt ovenfor.

Eksempel 5

Flere teknikker kan brukes til å angi plasseringen av Pandas DataFrame -objekt til et hvilket som helst Python -objekt, for eksempel en liste, rekkevidde eller til og med serier. Ved hjelp av PD.INDEX (), SET INDEX () og Range () -funksjoner, kan vi angi indeksen for DataFrame -objektet (Pandas) i denne tilnærmingen. Først vil vi bruke rekkevidden () -funksjonen til å bygge en python -sekvens av heltall, som vi deretter vil sende til PD.Indeks () Funksjon. Denne metoden produserer indeksobjektet til DataFrame. Det returnerende DataFrame Index -objektet blir deretter satt som DataFrames nye indeks ved hjelp av Set Index () -funksjonen. La oss implementere denne koden.

Importer pandaer som PD
dd = 'rollnum': [1, 2, 3],
'Navn': ['Alex', 'Ramen', 'Zayn'],
'Marks': [33, 66, 88],
'City': ['New York', 'Los Angeles', 'Chicago']
FF = PD.DataFrame (DD)
Print ("\ Ninitial DataFrame:")
trykk (FF)
my_list = ['i', 'ii', 'iii']
IDX = PD.Indeks (my_list)
ff = ff.set_index (idx)
print ("\ nfinal dataaframe:")
trykk (FF)

Se utgangen nedenfor.

Eksempel 6

Pandas DataFrame -objektets indeks kan settes ved hjelp av SET -indeksen () og PD.Indeks () Metoder. Vi begynner med å lage en Python -liste, som vi deretter vil sende til PD.Indeks () Funksjon. Denne funksjonen vil gi et DataFrame Index -objekt. Det returnerende DataFrame Index -objektet blir deretter satt som DataFrames nye indeks ved hjelp av Set Index () -funksjonen.

Importer pandaer som PD
dd = 'rollnum': [1, 2, 3, 4, 5],
'Navn': ['Alex', 'Ramen', 'Zayn', 'Travis', 'Scott'],
'Marks': [33, 66, 88, 67, 78],
'City': ['New York', 'Los Angeles', 'Chicago', 'San Diego', 'Dallas']
FF = PD.DataFrame (DD)
Print ("\ Ninitial DataFrame:")
trykk (FF)
indx = pd.Indeks (rekkevidde (1, 6, 1))
ff = ff.set_index (indx)
print ("\ nfinal dataaframe:")
trykk (FF)

Resultatet er gitt i vedlagte skjermbilde.

Eksempel 7

Ved hjelp av PD.Serie () og angi indeks () -funksjoner, vi kan angi indeksen for DataFrame -objektet til pandaer i foregående metode. Generer en liste og send den til PD.Serie () -funksjonen vil returnere en Pandas -serie som kan brukes som DataFrame Index -objektet. Den resulterende Pandas -serien sendes til Set Index () -metoden, som setter den som DataFrames nye indeks. La oss se følgende kode og forstå hvordan dette fungerer.

Importer pandaer som PD
dd = 'rollnum': [1, 2, 3, 4, 5],
'Navn': ['Alex', 'Ramen', 'Zayn', 'Travis', 'Scott'],
'Marks': [33, 66, 88, 67, 78],
'City': ['New York', 'Los Angeles', 'Chicago', 'San Diego', 'Dallas']
FF = PD.DataFrame (DD)
Print ("\ Ninitial DataFrame:")
trykk (FF)
ser_indx = pd.Serie ([5, 4, 3, 2, 1])
ff = ff.set_index (ser_indx)
print ("\ nfinal dataaframe:")
trykk (FF)

Her kan du se utdataene.

Konklusjon

Indeksering er prosessen med å velge verdier fra spesifikke rader og kolonner i en dataaframe. Vi kan velge alle rader og noen kolonner eller rader og alle kolonner ved hjelp av indeksering. Denne økten diskuterte emner som hva som er indeksen og hvordan du kan angi indeks mens du genererer en dataframme, hvordan du kan angi eksisterende dataframkolonner som en indeks eller til og med multi-indeks, og hvordan du kan angi python-objekter som rekkevidde, liste, eller til og med serier som en indeks.