Pandas drop index

Pandas drop index
Pandas Dataframes er datastrukturer som ligner tabellformatene og lar deg jobbe med tabelldata som et innhold fra CSV -filer. Pandas prøver å forstå en indekskolonne når du importerer dataene dine. Pandas -indeksen ligner på et regnearknummer. Som standard oppretter Pandas bare en indeks for deg med mindre en spesifisert indeks er gitt. Denne indeksen begynner på 0 og fortsetter til størrelsen på DataFrame. Selv om disse indeksene vanligvis er relevante, kan det være tilfeller der du foretrekker å bare eliminere indeksen. Likevel, hvis du arbeider med visse data som tidsseriedata, kan det være lurt å indeksere dataene dine med en bestemt kolonne. Pandas tilbyr en rekke praktiske metoder for å oppnå dette, enten etter eller før du importerer en DataFrame.

Pandas drop index

Denne artikkelen vil lære deg hvordan du slipper Python Pandas DataFrames indekskolonne. Indekskolonnen til Python Pandas DataFrame kan noen ganger være påkrevd å bli droppet. Siden en indeks alltid er til stede i Pandas Dataframes og serier, kan vi ikke teknisk slippe indeksen; Snarere kan vi tilbakestille det ved å bruke følgende kodelinje.

Vi må først angi de spesifiserte indeksverdiene for DataFrame ved å bruke følgende syntaks:


Her, The “DF” er den medfølgende DataFrame.

DataFrames indekskolonne kan tilbakestilles av pandaene “DF.reset_index () ”-funksjon ved hjelp av den sekvensielle listen over standardindekser. Du kan tilbakestille indekskolonnen til standard ved hjelp av følgende syntaks:


Her, The "miste" Parameter gjenoppretter DataFrames indeks til standardverdien. De "på plass" Parameter endrer den eksisterende originale DataFrame, men produserer ikke et objekt av DataFrame.

I denne artikkelen vil vi gå gjennom hvordan du bruker Python for å slippe indekskolonnen fra Pandas.

Eksempel: Bruke Pandas DF.ESET_INDEX () Metode for å slippe indekskolonnen i en DataFrame

I dette eksemplet vil du se den praktiske demonstrasjonen av pandaene “DF.RESET_INDEX () ”Metode for å slippe Pandas -indekskolonnen til DataFrame.

Vi begynner koden ved å importere de nødvendige pakkene. For dette programmet, som artikkelens tittel beskriver, må vi bruke noen Pandas -metoder. Men de kan bare brukes hvis vi lastet Pandas -biblioteket i Python -filen. Så vi skrev "Importer Pandas as PD" -skriptet for å introdusere Pandas -modulene og aliaset det med "PD". Nå er vi i full tilgang til Pandas -funksjoner. Det første vi vil gjøre nå er å lage en pandas dataaframe der vi utfører hovedoppgaven vår som slipper indeksene.

Vi brukte Pandas -metoden “PD.DataFrame () ”for å lage en dataaframe. Som vi nevnte tidligere, "PD" er aliaset til "Pandas", mens "DataFrame" er nøkkelordet som instruerer programmet til å generere et DataFrame. Vi påkalte denne metoden med tre kolonner - “Roll_no”, “Navn” og “Marks”. Den første kolonnen "Roll_no" lagrer rullenummeret til studenter som er "1154", "1156", "1157" og "1158". Den neste kolonnen "Navn", som tittelen antyder, holder navnene på studentene som tilsvarer rulletallene sine som "Diana", "Raulf", "George" og "Amelia". Den siste kolonnen “Marks” forteller oss om de oppnådde merkene til studentene hvis navn og rulletall er nevnt i de forrige kolonnene. Verdiene er “40”, “50”, “67” og “75”.

Alle kolonnene er av like lengde som er fire. DataFrame med disse kolonnene må lagres i et objekt. Så når vi trenger denne dataframmen i programmet, kan vi få tilgang til det av det aktuelle objektet som holder det. Her opprettet vi et "student" dataframe -objekt og tildelte det den resulterende DataFrame generert fra “PD.DataFrame () ”-funksjon. I stedet for å vise DataFrame med standardindeksverdiene som programmet genererer for deg, foretrakk vi å spesifisere indeksverdiene i henhold til våre behov.

For dette har vi en Pandas -metode for å angi indeksverdiene som er “DF.set_index () ”. Med dataene fra en annen kolonne som ble levert som en parameter, “DF.set_index () ”Metode for Pandas DataFrame tilbakestiller indekskolonnen. Vi ga også syntaks i begynnelsen av opplæringen. I følge syntaksen må vi oppgi navnet på DataFrame med "set_index ()" -funksjonen. Og som et argument for denne funksjonen kalte vi “PD.Indeks () ”for å spesifisere indeksverdiene.

Navnet på vår DataFrame som vi leverte med "set_index ()" -funksjonen ser ut som "Student.set_index ([PD.indeks ()]) ”. Verdiene som vi spesifiserte for å bli satt som indekskolonnen til "Student" DataFrame er "ID1", "ID2", "ID3" og "ID4". Nå har DataFrame disse verdiene i indekskolonnen i stedet for standard sekvensiell liste over verdier. Denne indeksinnstillingen lagres i "student" dataaframe -objektet. Vi er ferdige med å sette opp indekskolonnen med våre foretrukne verdier. Nå vil vi se vår DataFrame. For å stille ut DataFrame, har vi “Print ()” Python -metoden. Vi kalte denne metoden med DataFrame -objektet "Student" som parameter for å vise den på Python -konsollen.


Vi treffer alternativet "Run File" for å utføre programmet. En dataaframe vises på konsollen med tre kolonner. Indekskolonnen til DataFrame har verdiene vi spesifiserte for den.


Det vi så langt lærte, er å lage en dataaframe og sette opp indekskolonnen for dine nødvendige preferanser. Nå vil vi utforske hvordan du slipper denne indekskolonnen i vår dataaframe ved å bruke pandaene “DF.reset_index () ”-metoden. Ved å bruke DataFrames standard sekvensielle liste over indekser, pandaene “DF.reset_index () ”funksjon tilbakestiller indekskolonnen. Som den medfølgende syntaks viser, må vi nevne navnet på DataFrame med "Reset_index ()" -funksjonen. Denne metoden bruker to parametere - “slipp” og “inplace”.

Standardverdien for "drop" -argumentet er satt som "sant", noe som betyr at den spesifiserte DataFrames indekskolonne vil bli droppet. Hvis du endrer det til "FALSE", vil DataFrame ha både "indeks" -kolonnen med definerte verdier, så vel som standard sekvensiell liste over indekser. Her går vi med standardverdien “True” fordi vi ønsker å slippe indekskolonnen.

Når "inplace" er satt til "sant", gjør det alle modifikasjonene i den opprinnelige dataaframe i stedet for å lage noen kopi av den. Så vi foretrekker å holde det "sant". Når vi påkaller metoden “RESET_INDEX ()”, slipper den indekskolonnen som vi satte med spesifiserte verdier tidligere i denne illustrasjonen i den originale "Student" DataFrame. Vi benyttet "PRINT ()" -funksjonen for å vise den oppdaterte DataFrame med nedlagte indeksverdier.


Når vi kjører det tidligere oppgitte Python -skriptet, vises det oppdaterte DataFrame på terminalen. I denne DataFrame kan vi se at indekskolonnen med våre spesifiserte verdier er droppet og standard sekvensiell indeksliste er lagt til.

Konklusjon

Å jobbe med Dataframes i Pythons Pandas er en primær teknikk. Når vi jobber med disse dataframene, kan det hende vi noen ganger må slippe den spesifiserte indekskolonnen. I denne artikkelen introduserte vi deg for forestillingen om å slippe indekskolonnen i en DataFrame. Vi forsto emnet med den praktiske implementeringen av Python -skriptene som ble utført på "Spyder" -verktøyet. Vi gjorde alle trinnene entydige og klare ved å bruke “PD.set_index () ”og“ PD.reset_index () ”for å slippe indekskolonnen. Denne guiden vil være veldig gunstig for deg å takle DataFrames indekssøyle -kompleksiteter.