Pandas velg kolonne med navn

Pandas velg kolonne med navn
En av de vanligste operasjonene når du behandler dataene er å trekke ut en kolonne eller kolonner fra en Pandas DataFrame. For å hente kolonnene og radene, gir DataFrame indekseringsidentifikatoren “loc []”. Denne metoden velger bare kolonner eller rader med etiketter/navn.

Syntaksen for denne metoden er som følger:

I denne artikkelen vil du se dens praktiske implementering gjennom de forskjellige teknikkene for å velge kolonnene ved navn.

Eksempel 1: Bruke Pandas Loc [] -egenskap for å velge en enkelt kolonne etter navn

For å trekke ut DataFrames spesielle enkeltkolonne, bruker vi Pandas “loc []” -egenskapen i denne illustrasjonen. La oss få en trinnvis guide for å gjøre dette.

Av et bredt spekter av alternative verktøy valgte vi “Spyder” -verktøyet for å utføre Python -kodene våre. Etter å ha lansert verktøyet, begynner vi å jobbe med manuset. Når vi kommer til Python -programmet, sjekker vi først inn forutsetningene for ubevisst utførelse av manuset. Her, som tittelen erklærer, er "Pandas" det nødvendige biblioteket for å jobbe med dets funksjoner. Vi laster Pandas Toolkit inn i vårt Python -miljø ved å skrive "Importer Pandas som PD". "PD" er laget et alias for pandaer som skal brukes i hele dette programmet i stedet for "pandaer".

For å jobbe med kolonner, trenger vi en dataaframe som holder kolonnene. Pandas gjør oss i stand til å konstruere en dataaframe ved å bruke den veldig enkle metoden som er “PD.Dataramme()". Denne metoden har to seksjoner: “PD” og “DataFrame”. "PD", som beskrevet tidligere, er aliaset for "pandaer" som betyr at vi kaller noe fra Pandas -modulen. Den andre delen "DataFrame" er nøkkelordet som brukes til å lage DataFrame. Vi påkaller “PD.DataFrame () ”-funksjonen for å generere en DataFrame. Kolonnenavnene og deres verdier kan defineres mellom parentesene til denne funksjonen.

Vi initialiserer DataFrame med 6 kolonner med navnene “Mercury”, “Venus”, “Earth”, “Mars”, “Jupiter” og “Saturn”. Hver kolonne tildeles et bestemt sett med verdier. For “Merkur” har vi verdier “13”, “2”, “24”, “19”, “9”, “52” og “65”. Kolonnen “Venus” lagrer verdiene “32”, “15”, “3”, “18”, “39”, “31” og “7”. I den tredje kolonnen har vi “Earth” -verdier “5”, “7”, “21”, “15”, “1”, “3” og “13”. Verdiene for "Mars" er "8", "21", "22", "34", "14", "21" og "2". "Jupiter" inneholder verdiene som er "11", "1", "35", "62", "5", "15" og "12". Den siste kolonnen i DataFrame “Saturn” har verdiene “21”, “23”, “45”, “2”, “11”, “12” og “9”. Hver kolonne i DataFrame bevarer en like lengde på verdiene. Nå er vi ferdige med å definere vår DataFrames kolonne og deres tilsvarende verdier.

Pandas “PD.DataFrame () ”-funksjonen oppretter en DataFrame med de oppgitte dataene. Men det har ingen plass til å bevare det. For å lagre denne DataFrame et sted, slik at vi kan bruke den senere, oppretter vi et DataFrame -objekt. Dette DataFrame -objektet er merket som "planeter". “PD.DataFrame () ”-metode, når den kalles, oppretter en DataFrame og lagrer den i dette DataFrame -objektet. For å visualisere DataFrame på skjermen, har vi Pythons funksjon “Print ()”. Denne metoden viser innholdet av "planeter" på Python -konsollen når den påkalles.

Vi får se utdataene DataFrame etter å ha truffet alternativet "Run File" på "Spyder" -verktøyet. Dataframe med 6 kolonner og 7 rader vises på konsollen som kan sees i utgangsbildet som er gitt på følgende:

Vårt utvalg av datafram for denne demonstrasjonen er klar til å jobbe med og gjøre endringer ved å bruke funksjoner. Vi skal trekke ut en kolonne ved å bruke kolonnenavnet. Vi vil instruere deg om tilnærmingen for å utføre dette.

For å velge en enkelt kolonne med navn, gir Pandas DataFrame oss attributtet “LOC []”. Det lar oss velge kolonnene eller radene ved å nevne navnene deres. Vi bruker “DF. loc [] ”attributt. Dataframets navn blir levert som "planeter". Mellom de firkantede parentesene trykker vi i kolonnenavnet “Jorden” etter å ha forlatt radstedet med “:” Colon. Dette betyr at utvalget er utført kolonnemessig. For å lagre utfallet, initialiserer vi en variabel “singel” som lagrer innholdet i den enkle kolonnen som er nevnt i "loc []" -egenskapen. Å vise utdataene på skjermen krever å ringe til "print ()" -funksjonen. Vi passerer "enkelt" -variabelen til "print ()" -funksjonen for å vise utfallet.

Her er vår resulterende DataFrame med bare en valgt kolonne. Kolonnen "Jorden" presenteres på skjermen med innholdet. Navnet på kolonnen så vel som datatypen på verdien er nevnt under den ekstraherte kolonnen.

Eksempel 2: Bruke Pandas loc [] -metode for å velge flere kolonner etter navn

Å velge en enkelt kolonne i en Pandas DataFrame læres i forrige tilfelle. Dessuten kan vi også trekke ut mer enn en kolonne som bruker DataFrames eiendom "LOC []". Vi utfører dette konseptet i praksis gjennom denne illustrasjonen.

Vi bruker DataFrame som er opprettet i tidligere forekomst. Denne dataaframe har 6 kolonner. Vi må velge flere kolonner etter eget valg. “DF.loc [] ”påkalles. Her er vårt DataFrames navn "planeter" som vi leverer med ".loc [] ”eiendom. Den spesifiserer at vi ønsker å velge de spesielle radene eller kolonnene fra den medfølgende DataFrame. Mellom de firkantede parentesene til "loc []" -egenskapen har vi to valg. Førsteplassen er å velge radene mens den andre er for valg av kolonnene. Vi, for denne guiden, vil hoppe over førsteplassen og bare legge til en tykktarm ":" fordi vi ikke trenger å gjøre et utvalg på rader.

På kolonnestedet introduserer vi en abonnementsoperatør “[]” som vi også kaller firkantede parenteser. I denne abonnementsoperatøren, skriv navnet på kolonnene. Vi velger 3 kolonner som er "Merkur", "Mars" og "Saturn". Utgangen til denne egenskapen lagres i variabelen “Multi”. Til slutt bruker vi metoden “Print ()” for å vise resultatet på skjermen.

Den resulterende DataFrame viser oss 3 kolonner som er valgt ved hjelp av "loc []" -egenskapen. De valgte kolonnene vises på terminalen mens resten blir ignorert.

Eksempel 3: Bruke Pandas loc [] -metoden for å velge en rekke kolonner med navn

Å velge kolonner ved å trykke på navnene deres en etter en blir noen ganger en hektisk oppgave når du må trekke ut et bredt antall kolonner. Hvis du trenger å trekke ut kolonnene fra en spesifisert kolonneliste opp til et bestemt punkt, kan du gjøre det ved å oppgi rekke kolonner i "loc []" -attributtet. La oss se dens praktiske trening.

Vi bruker “DF.loc [] ”eiendom. På kolonnestedet leverer vi rekke kolonner som vi trenger å hente. Det første kolonnenavnet der området starter og det andre kolonnenavnet som området slutter, er begge atskilt med en ":" kolonoperatør. Her velger vi "Venus" -kolonnen for å starte rekkevidden fra og "Jupiter" -kolonnen som området slutter. I mellom dette området, hvilke kolonner som finnes, trekker "loc []" -metoden dem alle. Vi lagrer utfallet i "Navn" -variabelen og viser den ved hjelp av "print ()" -metoden.

I utgangen av utgangen kan vi se at alle kolonnene fra "Venus" til "Jupiter" er utstilt på skjermen.

Konklusjon

Denne guiden er basert på å velge kolonnene i en Pandas DataFrame. Pandas DataFrame gir oss et attributt som er “DF.loc [] ”for å gjøre et utvalg på rader eller kolonner eller til og med begge deler. Vi jobbet med 3 eksempler i denne artikkelen. Det første eksemplet gir en detaljert forklaring på å velge en enkelt kolonne i en dataaframe. Det andre eksemplet fungerte med valg av flere kolonner. Mens den tredje illustrasjonen er basert på ideen om å velge en rekke kolonner i en dataframme.