Pandas drop kolonne med navn

Pandas drop kolonne med navn
“Pandas” er en Python open source verktøysett som forenkler og akselererer dataanalyse. Dataframe, en todimensjonal datastruktur som inneholder data i rader og kolonner, som en tabell i en database, er en av hovedfunksjonene i Pandas.

Når du jobber med DataFrames, kreves det ofte å endre en Pandas DataFrame for å fjerne irrelevante kolonner eller for å optimalisere dataene for modellkonstruksjon. Noen ganger vil visse kolonner ikke være nyttige for analysen din. Du må forstå hvordan du fjerner kolonnene fra den medfølgende Pandas DataFrame. Kolonner blir kastet fra maskinlæringsmodeller når de er irrelevante eller ikke forbedrer modellen.

Pandas drop () -metode

I pandaer kan kolonnemanipulering oppstå på forskjellige måter. For eksempel ved å bruke “DataFrame.slipp "-metode, spesifiserte kolonner kan elimineres. Det er den mest brukte metoden for å fjerne flere kolonner i pandaer. Som navnet tilsier, ble denne metoden designet for å gjøre den enkel å slippe enkelt- eller flere kolonner eller rader. I denne detaljerte opplæringen vil du utforske hvordan du slipper enkelt- eller flere kolonner fra en Pandas DataFrame ved å bruke navnene deres.

Syntaks for denne funksjonen er gitt nedenfor:

Her, “Column_name” er navnet på kolonnen vi vil slippe. De "akser" Angir hvilken akse som skal fjernes. Axis 1 representerer kolonner, mens Axis 0 representerer rader. De "på plass" indikerer at slippoperasjonen skal skje i samme dataaframe i stedet for å generere en kopi av dataaframet etter dråpen.

Du lærer å bruke denne metoden for å slippe kolonner med navn i denne opplæringen.

Eksempel nr. 1: Bruker Pandas “DataFrame.slipp () ”metode for å slippe en enkelt kolonne med navn

I dette eksemplet vil vi utføre en praktisk implementering av denne metoden for å eliminere en enkelt kolonne med navn fra DataFrame.

For å begynne å skrive Python -skriptet for utførelse av dette eksemplet, må vi ha en relevant samler som vi kan sette sammen koden. Vi har en rekke valg, men den vi har valgt er "Spyder" -verktøyet. Du må åpne "Spyder-ideen.org ”nettsted og last ned“ Spyder ”-verktøyet per operativsystemets krav. Vi har brukt Windows -operativsystemet, så vi lastet ned det tilsvarende "Spyder" -oppsettet. Deretter installerte vi det ganske enkelt, og når installasjonsprosessen er fullført, finner vi et brukergrensesnitt av verktøyet. Vi har åpnet en ny fil ved å klikke på alternativet "Ny fil", eller du kan til og med trykke på "Ctrl+N" for å åpne den nye katalogen.

Nå må vi laste inn forutsetningsbibliotekene som kreves for skriptet. Biblioteket som trengs for utførelse av denne metoden er “Pandas”.

Vi har brukt “PD.DataFrame () ”-metode, som er levert av Pandas Library. Som vi har nevnt, er "PD" et alias for pandaer, mens "DataFrame" er nøkkelordet for å generere DataFrame. Så vi benyttet denne metoden for å konstruere vår grunnleggende DataFrame. Denne dataaframe har tre kolonner “anlegg”, “pris” og “tilgjengelighet”. "Plant" -kolonnen inneholder navnene på forskjellige planter, som er "morina", "oleander", "Acacia", "Olive", "Hopbush" og "Mango". Kolonnen "Pris" lagrer prisene for anleggene, som er "500", "700", "1300", "600", "800" og "1150". Den siste kolonnen, "tilgjengelighet", forteller om anlegget for øyeblikket er tilgjengelig eller ikke som "y", "n", "y", "y", "n" og "y". Her representerer “y” “ja” og “n” representerer “nei”. Verdiens lengde i hver kolonne i DataFrame må holdes den samme, som er seks i dette tilfellet. Vi trenger nå et DataFrame -objekt for å holde innholdet på dette DataFrame i det. Så vi opprettet et DataFrame -objekt “Forest” og ga det utfallet som ble generert fra å ringe “PD.DataFrame () ”-metode. Vi kan få DataFrame ved å bruke objektet “skog”. Nå, for å se denne nyopprettede DataFrame, har vi en Python -metode for å vise utgangen, som er "Print ()". Vi påkalte metoden “Print ()” og har lagt til navnet på DataFrame mellom parentesene.

For å utføre dette Python Pandas -skriptet, må vi trykke på alternativet "Run File". Alternativt kan du treffe “Shift+Enter” -tastene for å kjøre programmet. Her kan vi se DataFrame vi nettopp opprettet med tre kolonner og seks rader som vises på Spyder Tool's Console.

Dataframe er konstruert, og nå kan vi utføre de nødvendige operasjonene på den. Hovedoppgaven vil bli utført, som er å slippe en enkelt kolonne ved navn som bruker Pandas “DataFrame.slipp () ”metode. Først må vi skrive navnet på Dataframe, som er "skog", så ".slipp () ”-funksjonen blir påkalt med den. Vi bruker "slipp ()" -metoden med tre parametere her "kolonne_navn", "akse" og "inplace". Kolonnenavnet vi har gitt at vi ønsker å slippe er "pris" -kolonnen. "Axis" er satt til "1", noe som indikerer at dråpen er utført kolonnemessig.

Og den siste parameteren, "inplace", innebærer at uansett hvilke manipulasjoner vi laget vil vises i selve DataFrame, og ingen kopi av DataFrame vil bli generert. Kolonnen vi vil slippe vil bli eliminert direkte fra den opprinnelige DataFrame. Til slutt brukte vi “print ()” -metoden for å vise den originale oppdaterte DataFrame etter at vi droppet en kolonne fra den.

Det forrige kodebiten, når den kjøres i Python, gir oss den opprinnelige DataFrame med en viss modifisering. Vi kan observere at denne DataFrame bare har to kolonner mens den første hadde tre kolonner. Av denne grunn er "pris" -kolonnen blitt utelatt fra DataFrame.

Eksempel nr. 2: Bruke Pandas “DataFrame.slipp () ”metode for å slippe flere kolonner med navn

Vi har utdypet teknikken for å slippe en enkelt kolonne ved navn ved hjelp av pandaene “Dataframe.slipp () ”metode. Vi vil nå utforske å slippe flere kolonner med samme teknikk.

For dette eksemplet har vi brukt DataFrame konstruert i forrige tilfelle. Som vi har vist deg, har DataFrame “Forest” tre kolonner “Plant”, “Price” og “Tilgjengelighet”. Etter å ha skrevet ut DataFrame har vi brukt “DataFrame.slipp () ”-funksjon. Vi har nevnt navnet på DataFrame “Forest” med “.slipp () ”metode.

Denne illustrasjonens tittel sier at vi slipper mer enn en kolonne her. Kolonnene vi har valgt fra DataFrame for å slippe er “Price” og “Tilgjengelighet”. Mellom parentesene i “skogen.Drop () ”-funksjonen, vi har levert kolonnelisten, sett" Axis "til" 1 "for kolonner, og" Inplace "er satt" sant "for å skildre endringene i den originale DataFrame. Endelig har vi kalt “print ()” -metoden for å vise utfallet.

I utgangsbildet kan du se at DataFrame nå er vist med bare en kolonne fordi resten av de to kolonnene er blitt droppet.

Konklusjon

Å slippe en kolonne ved hjelp av navnet er en veldig nyttig og effektiv strategi i Python Pandas. Det gjør dataanalysen mye enklere og fri for komplikasjoner. Denne artikkelen vil hjelpe deg å forstå dette konseptet og gi deg de beste tilnærmingene for å oppnå ønsket resultat. I dette forfatterskapet har vi forklart og implementert teknikken for å eliminere en enkelt kolonne med navn og slippe flere kolonner med navn. Vi utførte eksemplet Python -koden i "Spyder" -verktøyet. Lære å bruke pandaene “Dataframe.Drop () ”-metoden vil være fordelaktig og praktisk for dataanalyseprosjektene dine.