Pandas sorteringsindeks

Pandas sorteringsindeks
“Pandas” er et flott språk for å utføre analysen av data på grunn av dets store økosystem av datasentriske Python-pakker. Analyse og import av begge faktorene blir lettere. Uansett hva prosjektet vi jobber med innen datavitenskap, må vi administrere dataene og vil ha dem på en sortert måte slik at de andre operasjonene skal utføre blir enklere og flytende. Å sortere dataene dine er en av ledelsesrepresentasjonene som er viktige. Datasortering er enklere ved å bruke en indeks, for at Pandas har en funksjon “Pandas Sort Index”. Vi vil dekke alle måtene Pandas -sortering ved å bruke indeksen utføres. Pandas Sort Index () sorterer ikke bare dataene etter indeksen, men også dataene fra radene eller med kolonnene i henhold til kravet. For implementering av koden vil vi bruke programvaren “Spyder”, som er bygget i et Python -miljø.

Syntaks

df.sort_index ()

Ovennevnte syntaks utfører sortering av DataFrame ved å bruke indeksen. "DF" er forkortelsen av "DataFrame". Det er en Pandas -funksjon for å sortere dataene.

Parametere

I Pandas Sort Index vil vi bruke noen parametere som "Axis", "Level", "Stigende", "Synkende" og "Ignorer Index = True".

Følgende er metodene som Pandas Sort Index utføres i:

  • Pandas sorter etter indeks (stigende orden).
  • Pandas sorterer etter synkende rekkefølge.
  • Pandas tilbakestiller indeksen på den sorterte DataFrame.
  • Pandas sorter indekser etter kolonnenavn eller med etiketter.

Opprette DataFrame for Pandas Sort Index -metoden

Først må vi lage et datafram for å forstå pandas sorteringsindeksen gjennom eksempler. Etter å ha åpnet verktøyet “Spyder” for implementering av koden, begynn å skrive koden. Importer deretter Pandas -biblioteket som "PD" og Numpy som "NP". Pandas er en open source-plattform med Python Bopiling. Når vi lager DataFrame, har vi “Languages ​​Courses” DataFrame, der vi har kursene “engelsk”, “NP. Nan ”,“ spansk ”,“ kinesisk ”og“ japansk ”.

Vi har gebyrdataene som "20000", "13000", "65500", "51000", "51000" og "96000". Vi har perioden for gjennomføringen av kurset som "35 dager", "50 dager", "60 dager", "25 dager" og 63 dager ". Deretter har vi data for rabatt på kursene som “1200”, “2300”, “4500”, “2200” og “1500”.

Her er utgangsskjermen til DataFrame vi opprettet. Displayet viser DataFrame som refererer til indeksen.

Eksempel 01: Pandas sorter etter indeks (stigende rekkefølge)

Vi har opprettet en dataaframe ovenfor for å utføre alle måtene til Pandas Sort Index. Her vil vi implementere Pandas Sort Index i stigende rekkefølge ved hjelp av indeksen. Det er mange ganger når vi oppretter en dataaframe uten å innse ordningen av indeksene. På et tidspunkt må vi ordne det for å utføre litt operasjon på den og vil ha den i stigende rekkefølge. Pandas har en funksjon “sort_index” som sorterer alle dataene avhengig av indeksen. Her, som standard, vil den stigende ordren bli utført.

Utgangen viser avgjort DataFrame i stigende rekkefølge ved å bruke Pandas Sort Index. Verdien “121” er først deretter verdiene “223”, “323”, “423” og “565” tilsvarende.

Eksempel 02: Pandas sorter etter synkende rekkefølge

Som vi har sett i eksempel nr. 02, hvordan sorterer du en dataframe av Pandas Sort Index i stigende rekkefølge. Nå skal vi sortere i synkende rekkefølge av "DF" ved å bruke indekssorteringsmetoden til Pandas. Dataframe har dataene fra språkene som har kurs og andre nødvendigheter som gebyr, varighet og rabatt som tilbys på kursene. Her utføres den synkende rekkefølgen ved å sende parameteren "falsk" til stigende i samme brak. Denne spesifikasjonen for å angi navnet Boolean “True” eller “False” spiller en betydelig rolle i metoden. Denne funksjonen til Pandas Sort Index vil utføre sortering av indeksen i synkende rekkefølge.

Følgende utgang viser “DF” sortert i synkende rekkefølge, da vi kan se henholdsvis "565", "423", "323", "223" og "121".

Eksempel 03: Pandas tilbakestiller indeksen på den sorterte DataFrame

I dette eksemplet vil vi lære å tilbakestille indeksen til en "DF" som allerede er sortert. La oss gjøre det klart, dette er bare en annen metode for å sortere DataFrame med verdien, avhengig av indeksen, eller kan si ved hjelp av å bruke en indeks. For å tilbakestille indeksen for "DF" med denne spesifikke metoden, må vi sette verdien av "Ignorer" -parameteren som "sann".

Utgangen viser at standardindeksen begynner på 0 og fortsetter med sortering i riktig rekkefølge. Dette vil gjøre DataFrame -utforskningen for å utføre noen oppgave i henhold til etterspørselen lettere.

Eksempel 04: Pandas sorter indekser etter kolonne (navn eller med etiketter)

Vi vil sortere indekser etter etiketter eller etter kolonner i dette eksemplet. Ofte trenger vi DataFrame som ordnet av kolonnene og også sortert etter navnene slik at vi kan utføre de andre evalueringsmetodene på dataene vi vil. Pandas sorter indeksen etter kolonne og ordner også dataene. DF.sort_index () -funksjon sorterer objekter etter etiketten med sin gitte “akse”. "Axis" er en parameter vi bruker.

Hensikten med å bruke "Axis" -parameteren er at vi sorterer indeksen etter kolonnen. Noen ganger må vi sortere indeksen etter rad. Så i denne typen situasjoner spesifiserer vi parameteren som en akse. Denne metoden fungerer ved å bruke Axis -etikettene på sorteringsalgoritmen i stedet for å bruke den på de faktiske dataene i DataFrame. Det er slik omorganiseringen av data blir gjort og også sortering av indeksen, begge går hånd i hånd. Denne teknikken kan brukes på forskjellige sorteringsalgoritmer.

Vi kan se at på grunnlag av kolonnens navn/etikett er det en "kurs" -kolonne ved første. Deretter "rabatt", "varighet" og til slutt "gebyr" -kolonnen.

Konklusjon

Pandas Sort Index er en så nyttig og effektiv metode. Når det sorterer dataene etter behov, ønsker vi å jobbe med. I denne artikkelen har vi lært alle metodene som å sortere indeksen i stigende og synkende rekkefølge, sortere dataFrame etter indeks og sortere indeksen med kolonnenavnet. Vi har også lært alle parametrene som brukes i funksjonen til Pandas Sort Index DataFrame. Denne metoden er en slik spillveksler for menneskene som jobber med enorme datamengder, da den sorterer dataene etter ditt behov, slik at vi kan utføre analysen og annet arbeid vi ønsker å gjøre.