Pandas slipper en rad

Når du arbeider med Python -datasett, renser ingeniører dataene etter behov for oppgaven. Slippfunksjonen brukes ofte til å eliminere kolonner og rader som kanskje ikke er relevant for oppgaven.

Pandas drop -funksjon:

"Drop ()" -metoden i Pandas DataFrame fjerner de medfølgende etikettene fra kolonnene og radene. Drop () -funksjonen eliminerer rader og kolonner enten ved å spesifisere etikettnavn så vel som tilsvarende akser eller ved å gi indeksene eller kolonnenavn eksplisitt.

Når vi bruker multi-indeks, eliminerer vi etiketter på forskjellige nivåer ved å indikere nivået. Det brukes til å fjerne datarammen, som vi ikke trenger å inkludere i vår analyse.

Syntaksen for denne funksjonen er som følger:

"Drop ()" -funksjonen inneholder syv parametere totalt, hvorav noen er valgfrie. La oss kort diskutere alle parametrene.

Den første parameteren den “Etiketter” er enten indeksen eller rettere sagt kolonnenavnet som må elimineres. Det er vanligvis spesifisert for å være en enkelt etikett eller en liste. De "akser" har to mulige verdier: 0 og 1. Når vi trenger å slippe fra indeksen/raden, skriver vi 0 i parameteren, og hvis vi må fjerne fra kolonnene, legger vi 1. Den er satt til 0 som standard. “Indeks” kan brukes i stedet for å spesifisere aksen (etiketter, akse = 0 er lik indeks = etiketter).

Neste parameter er “Kolonner”. Den brukes til å spesifisere kolonner. Indekser og kolonner tilsvarer aksen som ikke kan brukes i forbindelse. “Nivåer” er et valgfritt argument for multiindex -bruk, og det spesifiserer nivået som etikettene vil bli droppet. "på plass" er et boolsk argument som, hvis sant, utfører funksjonen på plass og returnerer ingen. Standardinnstillingen er falsk. Den siste parameteren er “Feil”. Når det er konfigurert til å "ignorere", blir bare eksisterende etiketter kastet og feilen blir ignorert. Det har to mulige verdier. Den første er "ignorere", mens den andre er "Raise". Som standard er det satt til "hevet".

I denne artikkelen vil vi demonstrere for deg dens praktiske implementering med eksempelkoder. La oss se på hvordan vi kan gjøre det i Python.

Eksempel 1: Bruke Pandas drop () -metode for å slippe en enkelt rad etter indeks

Vi lærer i denne illustrasjonen å slippe en enkelt rad med indeksen for den medfølgende DataFrame ved å bruke Pandas “DataFrame.slipp () ”metode.

For å begynne den praktiske implementeringen av Python -koden for å implementere “DataFrame.slipp () ”-funksjon på Pandas datarammer, vi må først velge et godt verktøy eller programvare som kan kjøre Python -programmene våre. Her har vi valgt og lastet ned “Spyder” -verktøyet. Vi installerte oppsettet for “Spyder” -verktøyet og lanserte deretter verktøyet. Når du ser grensesnittet til "Spyder" -verktøyet, åpner du en ny fil ved å klikke på alternativet "Ny fil" eller trykke på "Ctrl+N" -tastene. Den lanserer en ny Python -fil med utvidelsen “.py ”som refererer til“ Python ”. Vi har nå alt satt til å jobbe med.

Hovedkoden begynner med å laste de nødvendige bibliotekene inn i Python -programmet. Som artikkelens tittel beskriver, skal vi jobbe med noen moduler på "Pandas". Så fra dette får vi forstå at vår forutsetning til å implementere denne koden er å importere “Pandas” -biblioteket til Python-filen. For å få dette, må vi skrive et Python -skript “Importer pandaer som PD”. Dette vil tillate oss å bruke funksjonene til pandaer i programmet vårt, og det gjør oss i stand til å få tilgang til dem ved å bruke "PD" i stedet for "pandaer" hver gang. Nå må vi lage en Pandas -dataramme. Pandas oss med en veldig enkel metode for å lage en dataramme, som er “PD.Dataramme()".

Her er “PD” Pandas og “DataFrame” er nøkkelordet for å opprette en dataramme. Vi har konstruert en dataramme som inneholder tre kolonner: “Produkt”, “Kostnad” og “kvantitet”. Alle disse kolonnene er tildelt noen verdier. Kolonnen "Produkt" har strengverdier som er "telefon", "bærbar PC", "CPU", "skriver", "mus", "tastatur" og "høyttaler". "Kostnad" -kolonnene lagrer heltallverdier "5000", "7000", "4300", "8150", "1050", "2150" og "1500". Den siste kolonnen, "Mengde", inneholder verdier “3”, “2”, “1”, “5”, “1”, “2” og “4”. Husk mens du lager DataFrame at alle kolonnene i en dataaframe må ha samme størrelse eller lengde på verdien.

Så vi har alle kolonnene med lengde syv. For å lagre denne datarammen har vi opprettet et datarammeobjekt “elektronikk” og tildelt det utgangen som genereres fra å påkalle “PD.DataFrame () ”-funksjon. Til slutt, for å vise denne datarammen, har vi brukt "print ()" -metoden ved å gi "elektronikk" -objektet som parameter, så det vil nå skrive ut det innholdet som er lagret i dette datarammeobjektet.

For utførelse av det ovennevnte Python-programmet, må vi treffe “Kjørfilen” -knappen på “Spyder” -verktøyet, eller du kan også trykke på “Shift+Enter” -tastene for å kjøre skriptet. Vi har en dataramme med tre kolonner og syv verdier som hver vises på terminalen.

Herfra begynner hovedoppgaven vår. Vi må nå lære hvordan vi kan slippe en enkelt rad ved indeks ved hjelp av pandaene “Dataframe.slipp () ”metode. Vi må ganske enkelt oppgi navnet på datarammen vi har opprettet ovenfor med ".slipp () ”-funksjonen, og ettersom vi må slippe en rad, er derfor parameteren vi har brukt her" indeks ". Vi har gitt indeksnummeret “3”, som vi ønsket å eliminere fra datarammen. Dette vil slette hele raden med “Index = 3”.

For å lagre utgangen fra denne funksjonen, har vi laget en variabel “new_electronics”. Vi har kalt "print ()" -metoden for å vise en tekst som.

Å kjøre ovennevnte kodebit vil få oss en oppdatert dataramme etter å ha droppet den tredje raden fra den tidligere genererte datarammen.

I dette utgangsbildet kan du se at den tredje raden er eliminert fra datarammen.

Eksempel 2: Bruke Pandas drop () -metode for å slippe flere rader etter indeks

Vi har allerede lært å eliminere en enkelt rad fra datarammen ved hjelp av Pandas “DataFrame.slipp () ”metode. Nå får vi se hva vi kan gjøre hvis vi må forkaste mer enn en rad fra datarammen. For denne illustrasjonen har vi brukt datarammen som er opprettet i eksemplet ovenfor. Vi vil direkte jobbe med hovedoppgaven, ettersom alle andre ting er blitt forklart i ovennevnte tilfelle. For å slippe flere rader har vi brukt “DataFrame.slipp () ”-funksjon som“ elektronikk.slipp () ”, som er navnet på vår tidligere opprettet dataramme.

Vi har brukt "indeks" -parameteren og tildelt den indeksnumrene vi ønsker å slippe fra datarammen som "indeks = [1, 3, 5]", noe som betyr at vi trengte å kaste radene "1", "3" og “5” fra datarammen. Vi kaller da ganske enkelt metoden “Print ()” for å vise den oppdaterte datarammen.

Dette gir oss følgende utgang, der rader 1, 3 og 5 blir eliminert fra datarammen.

Konklusjon:

Denne guiden beskriver og utdyper Pandas -modulen “Dataframe.slipp () ”for å slippe rader fra datarammen. Vi har definert og kort forklart de forskjellige parametrene for denne funksjonen. Vi introduserte deg for konseptet med å slippe en enkelt rad med indeks fra datarammen, samt sletting av flere rader etter indeks. Vi implementerte begge konseptene praktisk talt med Python -koder på "Spyder" -verktøyet og viste de resulterende datarammene generert fra programmene. Dette skrivet er bare en guide, men din praksis med praktiske koder vil gjøre det til din ferdighet.

Python

Seaborn Axis -etiketter

“Aksene.set () ”-funksjon, matplotlib bibliotekfunksjoner, eller“ set_xlabel () ”og“ set_ylabel () ”...

Daniel Johnsen

Python

Matplotlib 2D -histogram

I Python, “PLT.hist2d () ”-funksjon av“ Pyplot ”-modulen i“ Matplotlib ”-biblioteket brukes til å pl...

Elias Krogh Svendsen

Python

Konverter en streng til Json Python

JSON -modulen fungerer, AST -modulfunksjonen eller eval () -funksjonen brukes til å konvertere en st...

Erik Røed