Pandas velger rad etter indeks

Pandas velger rad etter indeks
Å velge rader fra en dataaframe kan være nødvendig for en rekke dataanalyseoppgaver. Når du velger visse rader og sampling Pandas Dataframes og serier, brukes Pandas “ILOC []” -teknikk for heltallbasert indeksering.

Du kan bruke den ved å følge den gitte syntaks:

Bare heltall-verdsatte innganger håndteres av egenskapen “ILOC []”. Disse inngangene kan imidlertid sendes på flere måter.

Du vil lære forskjellige tilnærminger til underinnstilling av Pandas DataFrames ved å bruke egenskapen “ILOC []” i denne opplæringen.

Eksempel nr. 1:

For å velge en enkelt rad i DataFrame etter indeks, vil vi se på den praktiske demonstrasjonen av “DF.ILOC [] ”-metode levert av Pandas.

Samling og utførelse av eksemplene vil bli utført i "Spyder" -verktøyet. Så vi lanserte verktøyet og så etter de nødvendige bibliotekene. Vi har funnet ut at "Pandas" verktøysettet er det vi trenger å jobbe med metoder for å velge radene. Pandas -biblioteket importeres til programmet og "PD" er satt som alias. Uansett hvor i koden, må vi ringe pandaer, bruke "PD" i stedet for "pandaer".

Den første bruken av Pandas Toolkit kommer når vi må generere en Pandas DataFrame ved å bruke “PD.DataFrame () ”-metode. Vi kaller “PD.DataFrame () ”-funksjon og spesifiser verdier for den. Vi ønsket at den skulle lage en dataaframe med 3 søyler: "fjell", "høyde" og "kontinent". Verdiene er identifisert for hver kolonne, og kolonnelengden holdes like for alle kolonnene.

Kolonnen "Mountains" holder navnene på fjellkjeder som er "Karakoram", "Hindu Kush", "Alaska Range", "Himalayas" og "Andes". Den andre kolonnen "høyde" lagrer lengden i meter av disse fjellområdene. Verdiene for denne kolonnen er “8611”, “7708”, “6194”, “8848” og “6961”. Den siste kolonnen “Continent” har kontinentets navn der disse fjellene ligger: “Asia”, “Asia”, “N_America”, “Asia” og “S_America”.

DataFrame -konstruktøren, når de blir kalt, oppretter en DataFrame med medfølgende data. Men hvis vi kaller det igjen i samme program med nye data, vil det miste det forrige. Dette er fordi det ikke finner noen lagring for å sette dataaframe i. Vi er pålagt å skape et rom for å bevare det. For å holde DataFrame for å kunne bruke den etterpå, har vi opprettet et DataFrame -objekt “Fakta”. Den vil lagre DataFrame med spesifiserte kolonner og rader.

For å vise utfallet gir Python oss en enkel metode som er "print ()" -metoden. Det tar bare inngangen og viser den på terminalen. Inngangen kan være en funksjon, en variabel/objekt, en matematisk operasjon eller en streng som skal vises. Siden vi ønsker å vise vår nyopprettede DataFrame, ga vi DataFrame -objektet "fakta" som inngangen til Pythons "print ()" -metode.

For å utføre skriptet, har vi trykket på “Shift+Enter” -tastene. Her er DataFrame med 3 kolonner og 5 rader presentert på terminalen som kan sees i øyeblikksbildet nedenfor.

Nå vil henting av en enkelt rad i den medfølgende DataFrame bli utforsket. Utvalget er basert på indeksen. For dette har Pandas DataFrame eiendommen “DF.iloc [] ”. Bare heltallverdier kan sendes inn i denne metoden for valg.

Vi har brukt “DF.ILOC [] ”Eiendom rett etter å ha vist DataFrame. Navnet på vår DataFrame “Facts” er utstyrt med “ILOC []” -metoden. Mellom de firkantede parentesene på eiendommen er indeksnummeret, på raden som vi ønsker å trekke ut, spesifisert. Her har vi gitt indeksnummer “3”. Så "iloc []" -egenskapen vil se på "fakta" DataFrame og søke ut raden med indeks nummer 3. Den vil samsvare med indeksen vi har forsynt med hver indeks i DataFrame og vil velge raden som er lik inngangsindeksnummeret. Etter å ha hentet raden, vil den bli lagt inn i "boksen" -variabelen som vi har laget for å lagre resultatet av "ILOC []" -egenskapen. Til slutt vil resultatet bli vist på konsollen ved å bruke metoden “Print ()”.

Raden med indeks 3 blir hentet. Du kan se det på bildet nedenfor. Raden med indeks nummer 3 har et fjell som heter Himalaya, høyden er 8848 og kontinentet er Asia. Datatypen for denne nevnte raden er også "Objekt".

Eksempel 2:

I illustrasjonen ovenfor har vi lært å velge en enkelt rad ved indeks ved å bruke Pandas dataFrame -egenskapen “ILOC []”. Denne forekomsten vil snakke om utvalget av flere rader i en dataaframe etter indeks.

Vi har ansatt “DF.iloc [] ”eiendom. Vi bruker også ovennevnte DataFrame i dette tilfellet. DataFrame -navnet "Fakta" er skrevet med "ILOC []" -egenskapen og innenfor abonnementsoperatøren har vi brukt en annen firkantet brakett for å spesifisere flere indekser. Hvis du ikke legger til den andre firkantede braketten, vil den kaste en feil. Indeksene vi har valgt å vise er “0”, “2” og “4”. Så det vil trekke ut rad 1, 3 og 5. Utfallet vil bli lagret i "multippel" variabel. "Print ()" -funksjonen vil utvise utgangen.

De 3 utvalgte radene er vist på terminalen.

Bortsett fra å velge flere rader i en dataaframe, kan du også velge hvilke kolonner som skal vises med radene.

Innenfor de firkantede parentesene til "ILOC []" -metoden har vi definert indeksene for radene og indeksene i kolonnen som skal velges. I den første abonnementsoperatøren har vi nevnt indekser for rader som “1”, “2” og “3” og kolonneindekser i den andre som “0”, og “2”. Utgangen presenteres ved hjelp av “print ()” -metoden.

Tre rader med 2 kolonner er valgt i det resulterende Dataframe.

Eksempel nr. 3:

Den siste teknikken for å utøve egenskapen “ILOC []” er for å velge radene etter indeksverdi vil bli satt i praksis i dette eksemplet.

Når det gjelder å velge et stort antall rader i en datafram med indeksverdiene, blir det veldig tidkrevende å spesifisere indeksene til rader en etter en, spesielt når du arbeider med store datasett. Her gjør Pandas DataFrame -egenskapen “ILOC []” oss i stand til å gi en rekke verdier.

Vi har utøvd “DF.ILOC [] ”-eiendom med DataFrame generert i første omgang. Området for indeksverdier er spesifisert som "1: 4". Her er “1” startindeksnummeret og “4” er den siste indeksverdien. Den vil velge verdiene mellom dette området inkludert startindeksverdien, men ekskludere den siste angitte indeksverdien. "Range" -variabelen opprettes for å holde utgangen ". "Print ()" -funksjonen påberopes for å vise resultatet.

Dette gir oss DataFrame som kan sees i utgangsbildet som er festet nedenfor.

Konklusjon

I denne artikkelen har vi diskutert utvalget av rader i en dataaframe ved å bruke indeksverdiene. Vi har brukt Pandas dataaframe “DF.iloc [] ”-egenskaper for å oppnå de ønskede resultatene. Ulike teknikker for å bruke egenskapen “ILOC []” er blitt forklart og implementert ved hjelp av prøvekodene. Det første eksemplet forteller oss måten å trekke ut en enkelt rad etter indeks, den andre illustrasjonen arbeidet med å velge flere rader etter indeks og valgte rader med spesifiserte kolonner også, og den siste forekomsten ga en ide om inndata av området indeksverdier.