Hvordan iterere over rader i en dataaframe i pandaer

Hvordan iterere over rader i en dataaframe i pandaer
Iterasjon er en metode som hjelper oss å krysse alle verdiene. I pandaer, når vi oppretter en dataframe, må vi alltid få tilgang til verdiene og hvor iterasjonen hjelper. Så i denne artikkelen skal vi gjennomgå forskjellige metoder for DataFrame-radmessig iterasjon.

Pandas.Dataramme

En Pandas DataFrame kan opprettes ved hjelp av følgende konstruktør:

Pandas.DataFrame (data = ingen, indeks = ingen, kolonner = ingen, dtype = ingen, kopi = falsk)

Metode: Bruke indeksattributt til DataFrame

Vi opprettet en ordbok med data med fire nøkler og konverterte deretter den dataordboken til DataFrame ved hjelp av Pandas -biblioteket som vist nedenfor:

I cellenummer [4] skriver vi bare ut at DataFrame for å se hvordan DataFrame ser ut:

I cellenummer [5] viser vi hvilken faktisk indeks som har informasjon om DataFrame. Utgangen viser at indeksen lagrer DataFrame Total Rows -detaljer i form av område, som vist ovenfor i utgangen.

I cellenummer [6], som vi allerede vet, lagrer indeksen områdefunksjonen, som har verdier fra 0 til 4 (den siste verdien ble ikke talt slik at sløyfen vil fungere fra 0 til 3). Så vi itererer sløyfen som normal, og ved hver iterasjon vil den gå til det aktuelle kolonnenavnet som er nevnt som DF ['Navn'] og deretter skrive ut den aktuelle indeksen (radnummer) for den kolonnen på den kolonnen.

Metode: Bruke Loc [] -funksjonen til DataFrame

La oss først forstå LOC- og ILOC -metoden. Vi opprettet en serie_df (serie) som vist nedenfor i cellenummeret [24]. Deretter skriver vi ut serien for å se indeksetiketten sammen med verdiene. Nå, på cellenummer [26], skriver vi ut serien_df.loc [4], som gir utgangen C. Vi kan se at indeksetiketten til 4 verdier er C. Så vi fikk riktig resultat.

Nå på cellenummeret [27], skriver vi ut serie_df.iloc [4], og vi fikk resultatet e som ikke er indeksetiketten. Men dette er indeksens plassering som teller fra 0 til slutten av raden. Så hvis vi begynner å telle fra første rad, så får vi e på indeksplassering 4. Så nå forstår vi hvordan disse to lignende LOC og ILOC fungerer.

Nå skal vi bruke .LOC -metoden for å iterere radene til en dataaframe.

I cellenummer [7] skriver vi bare ut DataFrame som vi opprettet før. Vi kommer til å bruke samme dataaframe for dette konseptet også.

I cellenummer [8], ettersom indeksetiketten starter fra null (0), kan vi iterere hver rad og få verdiene til hver enkelt kolonnes indeksmerke som vist i bildet ovenfor.

Metode: Bruke Iterrows () Metode for DataFrame

La oss først forstå Iterrows () og se hvordan de skriver ut verdiene.

I cellenummer [32]: Vi opprettet en DataFrame DF_TEST.

I cellenummer [33 og 35]: Vi skriver ut DF_TEST slik at vi kan se hvordan det ser ut. Deretter sløyer vi den gjennom Iterrows () og skriver ut raden, som skriver ut alle verdiene sammen med kolonnens navn på venstre side.

I cellenummer [37], når vi skriver ut raden ved hjelp av metoden ovenfor, får vi kolonnenavn på venstre side. Når vi allerede nevner kolonnenavnet, får vi imidlertid resultater som vist i cellenummeret [37]. Nå forstår vi tydelig at det vil iterere radmessig.

I cellenummer [9]: Vi skriver bare ut dataaframe som vi opprettet før. Vi kommer til å bruke samme dataaframe for dette konseptet også.

I cellenummer [10]: Vi itererer hver rad ved hjelp av Iterrows () og skriver ut resultatet.

Metode: Bruke iterTuples () Metode for DataFrame

Ovennevnte metode ligner på Iterrows (). Men den eneste forskjellen er hvordan vi får tilgang til verdiene. I cellenummer [11] kan vi se at for å få tilgang til kolonneverdien på hver iterasjon. Vi bruker raden. Navn (Dot Operator).

Metode: Bruke ILOC [] -funksjonen til DataFrame

Vi forklarte allerede før hvordan .ILOC -metoden fungerer. Så nå skal vi bruke den metoden direkte for å iterere radene.

I cellenummer [18]: Vi skriver bare ut DataFrame, som vi opprettet før for dette konseptet.

I cellenummer [19]: DF.iloc [i, 0], der jeg tilhører plasseringen og neste verdi 0, som forteller indeksen med kolonnens navn.

Metode: itererer over rader og skriv ut sammen med kolonnenavnene deres

I cellenummer [20]: Vi skriver bare ut DataFrame (DF), som vi opprettet før for å forstå konseptet.

I cellenummer [21]: Vi itererer gjennom Iterertuples () -metoden, som vi allerede forklarte. Men hvis vi ikke nevnte noen annen informasjon, får vi utdataene sammen med kolonnenavnene deres.

Konklusjon:

I dag lærer vi forskjellige metoder for å ro iterere på Pandas dataaframe. Vi lærte også om .loc og .iloc -metoder og den nære forskjellen mellom dem. Vi studerte også Iterrows () og iterTuples () -metodene. Vi har også sett indeksattributtmetoden. Alle disse metodene ovenfor har sine respektive fordeler og ulemper. Så vi kan si at det avhenger av situasjonen den metoden når du må bruke.