Pandas sorteringsindeks

Pandas sorteringsindeks
“Pandas” er en av pakkene med Python -språk som analyserer data bedre. Å jobbe med en enorm skala av data er hektisk og vanskelig å administrere. Ettersom det er mange faktorer som data går gjennom, er en av dem "sortering". En av de viktigste jobbene å fullføre er datasortering. Pandas har en funksjon for å sortere data i dataaframe ved å bruke verdiene sine. Funksjonen er pandas “sort_value”. Dette hjelper til med å sortere millioner av datamengder på noen få minutter. I pandas -sorteringverdi sorteres dataene etter valg av kolonnene i stigende eller synkende rekkefølge. Vi vil dekke alle hvordan pandas sorteringsverdiene kan utføres. Vi bruker "Spyder" -verktøyet for implementering av koden. Det har et Python -språkmiljø.

Syntaks

df.sort_values

"DF" i syntaks er en forkortelse av "DataFrame". Ovennevnte syntaks sorterer kolonnen etter verdien i DataFrame. I stedet for å bruke hele DataFrame, fungerer den med en spesifikk etikett av DataFrame. Følgende er metodene for pandas sorteringsverdi vi implementerer med eksempler:

  • Pandas ordreverdier i stigende rekkefølge etter de spesifiserte kolonnene.
  • Pandas sorterer verdier etter flere kolonner (sak I).
  • Pandas sorterer verdier etter flere kolonner (sak II).
  • Pandas sorter verdsetter nan først.

Opprette en dataaframe for implementering av pandas sorteringsverdier i eksempler

Etter å ha åpnet “Spyder” -programvaren, importer Pandas -biblioteket som “PD”. Begynn nå å lage en dataaframe. DataFrame er av "biler" -data. Vi har merkets navn: “BM”, “Us”, “HC” og “ZX”. Vi har prisene på disse bilene også, som "44000", "32000", "52000" og "23000" med sitt produksjonsår "2018", "2019", "2019" og "2020".

Utgangen viser dataaframe som er opprettet med kolonnene til bilmerker, deres pris og deres produksjonsår.

Eksempel 01: Pandas ordreverdier i stigende rekkefølge etter de spesifiserte kolonnene

I dette eksemplet bruker vi Pandas Sort Value Function for å bestille dataverdiene. Dataframe her består av bilmodellene som "WW", "XX", "NN" og "TT" med prisene "45000", "22000", "33000" og "55000" og deres produksjonsår er "2018 ”,“ 2019 ”,“ 2020 ”og“ 2021 ”. Pandas sorterverdier fungerer basert på deres spesifiserte kolonnevalg. Her skal vi gjøre sortering basert på kolonnen "merke" som du kan se i koden. Vi har ikke skrevet stigende i koden fordi du ikke trenger å nevne at Pandas Sort -funksjonen som standard utfører den i stigende rekkefølge.

Dataframe viser sortering av "merke" -kolonnen i stigende rekkefølge.

Eksempel 02: Pandas sorteringsverdier etter valgt kolonne i synkende rekkefølge

I det siste eksemplet har vi sett hvordan du sorterer verdier i stigende rekkefølge. Vi vil ikke at dataene alltid sorteres i stigende. Noen ganger etter etterspørsel, ønsker vi det i synkende rekkefølge. Nå skal vi gjøre hvordan du sorterer verdier i synkende rekkefølge. Vi har DataFrame som har bildata som merkevarene: “YY”, “QQ”, “PP” og “BB” med prisene “38000”, “45000”, “22000” og “12000”. Vi har produksjonsårene så vel som “2019”, “2020”, “2021” og “2020”. Vi har valgt den samme "kolonnen" merke "for å sortere dataene, med navnene i synkende rekkefølge ved å legge til en tilstand" stigende = falsk ". "På plass = sant" i koden er et nøkkelord som endrer standardatferden i Pandas -metoden.

Utgangen viser DF -sorteringen av kolonnemerket i synkende rekkefølge.

Eksempel 03: Pandas sorterer verdier etter flere kolonner (sak I)

Nå skal vi gjøre et eksempel på Pandas Sorter -verdien i flere kolonner. Dataene vi har som merkenavn på biler “LL”, “KK”, “HH” og “GG”. Prisene deres er “45000”, ”14000”, “13000” og “56000” og produksjonsårene er “2019”, “2020”, “2021” og “2018”. Her har vi valgt kolonnen “Pris” og “År”, da vi må gjøre sortering av flere kolonner. Vi har brukt Pandas “sort_value” -funksjonen med “DF” og kolonnene som er valgt for sortering.

Her, i utdataene, kan vi se at kolonnen "pris" og "år" er sortert med hell.

Eksempel 04: Pandas sorteringsverdier etter flere kolonner (sak II)

I det siste eksemplet har vi gjort sortering av data i flere kolonner. Hva om de to årene har samme produksjons "år"? Her vil vi erkjenne denne situasjonen. Dataene er av biler som "XX", "BB", "EE" og "DD" med prisene som "12000", "15000", "19000" og "17000". Årene med bilen som er produsert er “2021”, “2019”, “2020” og “2020”. Som vi kan se “2020” har dukket opp to ganger i produksjon. I denne situasjonen som år skal være først i dataene hvis dette spørsmålet skulle oppstå? Ganske enkelt, det vil gå gjennom året hvis begge er de samme. Deretter ville det sjekke prisverdien. Den som har den laveste prisen vil være først, og den høyeste vil gå etter det. Basert på de tildelte dataene vil det fungere hvis denne typen tilstand skjer. I koden har vi valgt kolonnen "år" og "merke" for å sortere dem etter pandas sorteringsverdi.

Displayet er den sorterte verdien av både merkevaren og året. Her ser vi at året “2020” vises to ganger; Først med prisen “17000” og deretter med prisen “19000”.

Eksempel 05: Pandas sorter verdier nan først

Vi vil importere Numpy som NP i dette tilfellet. Numpy brukes til de numeriske beregningene av dataene. “Nan” står for “ikke et tall”. Så når det ikke er tilordnet noe nummer i dataene, dukker det opp som "Nan". Vi vil gjøre eksemplet for å ha "NAN" -verdier som vises først i DataFrame. Pandas Sort -funksjonen brukes med "na_position" = 'First' ", dette betyr at posisjonen er satt som først av de ikke tilgjengelige eller nullverdiene i" DF ". Vi har valgt kolonnen "år" for å ha sine "nan" -verdier på toppen av DataFrame.

Utgangen viser NAN -verdien først i årets kolonne.

Konklusjon

Pandas sorteringsverdi er en effektiv og veldig gunstig metode. Vi har dekket alle mulige metoder for sortering av verdier i pandaer i denne artikkelen: den stigende og synkende rekkefølgen på DataFrame -valgt kolonne. Vi har gjort sortering av flere kolonner, som vi har gjort på to måter: den normale måten og den lignende årets utseende situasjon. Til slutt har vi gjort sortering av "nan" -verdiene først i DataFrame. Hver metode for pandas sorteringsverdi er verdig på egen hånd, ettersom det er vanskelig å jobbe med en enorm skala av datasortering, har denne funksjonen til Pandas kommet med stor suksess for sortering av data på alle måter i henhold til behovet.