Pandas på funksjon

Lars Solberg

“Python er et av de beste språkene for å analysere dataene og resultatene, i stor grad på grunn av det sterke miljøet i Python -pakker som er fokusert på datahåndtering. Et av disse verktøyene som forenkler prosessen med å importere og evaluere data er pandaer i stor grad. Pandaene på [] -funksjonen brukes til å returnere data i en dataaframe på det passerte punktet. [Posisjon, kolonnavn] er formatet på den passerte plasseringen. Denne metoden fungerer på samme måte som Pandas loc [], bortsett fra at [] returnerer en enkelt verdi og utfører derfor raskere. Ved hjelp av Pandas -serien.Ved attributt kan vi få en enkelt verdi for et sett med rad-/kolonnetiketter. Denne attributtet og LOC tilbyr begge etikettbaserte oppslag; Derfor er de like.”

Hvordan bruke pandaene .ved funksjon?

I pandaer brukes AT -metoden for å trekke ut spesifikke data eller verdier fra en dataframme og for å trekke ut verdier fra serieobjektet. Å bruke .Ved funksjon for serie og dataaframe må vi følge syntaks. La oss se på syntaksen deres først før du bruker den til å trekke ut data.

Syntaks av .ved funksjon på Dataframes

Syntaksen til DataFrame.ved funksjonen er som følger:

Syntaks: Dataramme.på [posisjon, etikett]

Hvor,

posisjon: Posisjonen til elementet i DataFrame -kolonnen.

merkelapp: Navn på kolonnen som skal brukes.

Returverdi: Verdien som ligger der blir returnert av .ved metode.

Feil: Hvis argumentene som er gitt som kolonnetikettene og radindeksen er utenfor grensene eller mangler fra DataFrame, heves nøkkelfeilen.

Syntaks av AstType () -funksjon på serie

Syntaksen til serien.ved funksjonen er som følger:

Syntaks: Serie.på[]

Parameter: Ingen

Det er ingen parameter som kreves for serien.Ved metode kan vi få verdien bare ved å bruke verdien som vi ønsker å trekke ut i parentesen.

Returnerer: Enkel verdi blir passert.

KeyError vil stige hvis etiketten i serien er fraværende.

Nå har vi sett syntaksen til .på funksjon med serier og dataaframe. Vi vil implementere .ved funksjon med serie- og dataramme i følgende eksempler, så du lærer hvordan du bruker .ved funksjon alene.

Eksempel 1: Hent data etter indeks og kolonnenavn i DataFrame ved hjelp av DataFrame.på [] funksjon

La oss nå bygge en dataaframe med flere rader og kolonner, slik at vi kan demonstrere eksemplet vårt og undersøke utgangen. Før vi oppretter DataFrame, vil vi importere modulen Pandas. Pandaer er et av de mest brukte verktøyene innen datavitenskap og maskinlæring for rengjøring og analyse av data. Pandaene er det ideelle verktøyet for å håndtere disse kaotiske dataene i den virkelige verden.

Pandas -modulene er importert til skriptet over. Vi opprettet flere lister som holder postene til idrettsutøvere. Så opprettet vi en DataFrame ved hjelp av PD.DataFrame () -funksjon. Inne i PD.DataFrame -funksjon, vi har bestått listene våre (spillere), kolonner som inneholder navnet for hver kolonne i DataFrame, og indeksen for å navngi indeksen til vår DF DataFrame. For å illustrere vår DF -dataramme, vil vi bruke PRINT () -funksjonen, og inni den vil vi passere vår DataFrame DF som en inngang.

Du kan se at det er 4 kolonner navn, alder, sport og land som viser dataene fra seks idrettsutøvere fra forskjellige idretter som tilhører forskjellige land.

Nå vil vi hente verdien av elementet i kolonnens navn “Sport” på radnavnet “2”.

Som du kan se, hentet den idretter “badminton” fra raden på indeks to. La oss vurdere eksemplet der vi prøver å hente verdien av en celle ved å oppgi et radnavn som ikke er til stede.

Konsollen viser en nøkkelfeil fordi det i vår DataFrame ikke er noen indeks med navnet "7".

Eksempel 2: Hent data fra DataFrame ved å bruke variabelnavn

Først av alt vil vi importere Pandas -biblioteket til det nåværende miljøet. Vi vil bruke den samme DataFrame DF i dette eksemplet, som ble opprettet i eksempel nr. 1.

Etter å ha importert pandaer, har vi laget to variabler LOC for lagring av indeksposisjonen og COL for lagring av kolonnenavnet. Vi tildelte 4 til LOC -variabelen og "Navnet" til COL -variabelen, noe som betyr at den må hente data fra den fjerde indeksen for navnekolonnen. Å undersøke resultatet fra dataaframe.Ved funksjon kan vi skrive ut den hentede verdien ved å passere variabelnavnet (i.e., Få) i utskriften () -funksjonen.

Output.

Dette .på [] returnerer bare en enkelt verdi, i motsetning til.loc []. Dataframe.På [3: 6, vil COL] derfor returnere en feil. Denne tilnærmingen er raskere enn. loc [] fordi det bare gjelder enkeltverdier.

Eksempel nr. 3: Spesifiser eller overskriv en verdi til en bestemt rad/kolonne ved hjelp av DataFrame.på[]

Vi vil bruke DF Datafame, som ble opprettet i eksempel nr. 1. Først vil vi sjekke dataene i vår DF DataFrame ved å bruke PRINT () -funksjonen.

La oss anta at vi må endre idretten i rad 5. Som du ser, for tiden er sporten i rad 5 tennis. Vi vil endre celleverdien i dette eksemplet. Bruke data.Ramme.på[]. For å overskrive eller endre dataene, må vi først få tilgang til den spesifikke cellen.

Vi har fått tilgang til den nødvendige cellen. Nå vil vi sette en ny verdi i denne cellen ved å bruke DataFrame.på [] funksjon.

Vi har endret verdien fra “Tennis” til “Basketball”. Du kan se utdataene ved å skrive ut DF DataFrame.

Du kan observere at verdien i rad 5 og kolonnesport endres til basketball. Ved hjelp av .På [] kan du bare angi verdien av en kolonne eller rad som finnes i vår datafram; Ellers vil den vise en feil på konsollen.

Eksempel 4: Hent en enkelt verdi på et hvilket som helst bestemt sted i en serie ved hjelp av serier.på [] attributt

Vi har sett fra eksemplene nedenfor hvordan du kan trekke ut encelledata fra .på[]. Nå, i dette eksemplet, vil vi få verdien fra serien ved å bruke serien.på [] attributt. Først lager vi en objektserie etter import av Pandas -modulen.

Som du ser, opprettet vi en serie som inneholder navnene på personer. For å visualisere serien vår, kan print () -funksjonen brukes.

Vi har en serie på 6 navn, indeksering fra 0 til 5. For å hente dataene fra et bestemt sted i en serie, kan vi ganske enkelt passere indeksen inne i parentesene i serien.på [] attributt. La oss hente verdien på indeksplassering 4.

Leo 'er verdien som er oppført i posisjon 4 i det medfølgende serieobjektet, som det kan sees i utgangen fra serien.ved attributt. Vi kan også sette en verdi på et spesifisert indekssted i serie ved hjelp av serier.på [] som vi har gjort i eksempel nr. 3.

Konklusjon

I denne artikkelen har vi diskutert hvordan vi bruker .på [] egenskap for å velge eller få en individuell celleverdi eller data fra en pandas dataaframe. Vi implementerte forskjellige eksempler i denne artikkelen ved hjelp av DataFrame.på [] og serier.på [] attributt slik at du kan lære å hente data etter indeks- og kolonnenavn i DataFrame, og hente data fra DataFrame ved å bruke et variabelnavn, spesifisere eller overskrive en verdi til en bestemt rad/kolonne.

Python

Python Chmod

“OS.CHMOD () ”-funksjonen til OS -modulen brukes til å endre eierskapet til Python -filen ved å godt...

Anders Fjeld Moe

Docker

Hva er forskjellen mellom Docker og Podman?

Docker bruker en klient-serverarkitektur, mens Podman er en demon mindre containermotor. Podman er s...

Daniel Johnsen

Docker

Hva er docker bind monteringer?

En Docker Bind Mount er en type montering som tillater brukere å kartlegge en katalog eller fil på v...

Alexander Sørlie