En Pandas-serie er en endimensjonal matrise med Axis-etiketter (indekser). Etikettene trenger ikke være unike, men de må være hasjerbare. Serieobjektet lar brukeren lagre en samling lignende typer variabler. Den kan lagre hvilken som helst datatype - heltall, float, objekter osv. Et serieobjekt kan sorteres på flere måter ved å bruke forskjellige parametere i samtalen. En serie kan initialiseres ved hjelp av kommandoen PD.Serie. Som standard sorterer Pandas serieobjektet i stigende rekkefølge.
>>> S = PD.Serie ([6, 3, 8, 2, 9])Sortering av verdier i synkende rekkefølge kan oppnås ved bruk av parameteren Stigende. Ved å sette Stigende til Falsk, Serien kan sorteres i synkende rekkefølge.
>>> s.sort_values (stigende = falsk)Som standard, samtalen til sort_values Returnerer en kopi av serieobjektet. For datasett i stor størrelse er dette uunngåelig siden det resulterer i å generere en ny kopi av data. For å unngå det, kan sorteringsoperasjonen utføres på stedet ved hjelp av på plass nøkkelord. Ved å tildele på plass som ekte, Det får serieobjektet på plass uten å ta ekstra plass.
>>> s.sort_values (stigende = falsk, inplace = true)I ovennevnte tilfelle, merk at ingen ekstra kopi av data returneres.
Pandaer lar brukeren velge sorteringsalgoritmen for utførelse av sorteringoperasjonen. Man kan stille sorteringsalgoritmen ved hjelp av snill parameter. De snill Parameter tar en av følgende verdier som argumenter: Quicksort, MergeSort, Heapsort. Som standard brukes Quicksort -algoritmen til å sortere verdiene.
>>> s.sort_values (kind = 'Quicksort')Noen ganger inneholder et serieobjekt Na verdier. Na -verdier er verdiene som mangler i serieobjektet. NA -verdiene kan plasseres enten i begynnelsen av matrisen eller den siste av matrisen. Posisjonen kan tilordnes ved hjelp av parameteren na_posisjon.
>>> S = PD.Serie ([6, 3, 8, np.Nan, 2, 9])De Na Verdier kan også slippes før sortering. Dette kan oppnås ved hjelp av kommandoen Dropna.
>>> S = PD.Serie ([6, 3, 8, np.Nan, 2, 9])Under den typen observerer vi at indeksen forblir den samme for den nye sorterte matrisen. Indeksen kan ignoreres ved hjelp av parameteren ignorere_index. Det tar en boolverdi: ekte eller Falsk. Hvis ekte, Indeksen blir ignorert i utgangen. Som standard er det Falsk.
>>> s.sort_values (ignore_index = true, na_position = 'first')Noen ganger er det praktisk å bruke en nøkkelfunksjon for å sortere verdiene. I slike tilfeller kan man eksplisitt passere nøkkelfunksjonen ved å bruke nøkkel parameter. For sortering ved hjelp av nøkkel funksjon, nøkkelfunksjonen brukes på serieverdiene før sortering. Tenk på eksemplet nedenfor, som ikke bruker nøkkel parametere.
>>> S = PD.Serie (data = ['a', 'b', 'c', 'd'])Ovennevnte serie kan sorteres ved hjelp av nøkkel parameter som følger.
>>> s.sort_values (nøkkel = lambda x: x.str.Nedre())I stedet for en lambda -funksjon, numpy Funksjoner kan også brukes som nøkkel funksjoner. I funksjonen nedenfor blir den sorterte rekkefølgen evaluert ved bruk av NP.SIN -funksjonen som beregner sinus verdi og bruker den som en sorteringsnøkkel.
>>> import numpy som NPEt serieobjekt kan også sorteres etter indeksverdien. Tenk på eksemplet nedenfor. For å sortere etter indeks, ringer vi sort_index.
>>> S = PD.Serie (data = [1, 2, 3, 4], indeks = ['d', 'b', 'c', 'a'])Sortering etter en indeks er den samme på alle måter som sortering etter verdier, inkludert parametrene, bortsett fra at den fungerer på indeksen i stedet for dataene.