Pandas sorter etter kolonne

Erik Røed

En Python er et utmerket verktøy for databehandling, takket være et blomstrende fellesskap av datasentriske Python-verktøy. Pandas er også et av disse programmene, og det forenkler import og analyse i stor grad. Sortering av dataene i Python kan gjøres på forskjellige måter. Når en bruker ønsker å sortere et bestemt datasett i henhold til en bestemt kolonne, oppstår spørsmålet. I henhold til den medfølgende kolonnen organiserer sort_values () -metoden i Pandas et datasett i stigende eller synkende retning. Den skiller seg fra den sorterte Python -metoden ved at den ikke kan sortere et datasett og ikke kan velge en spesifikk kolonne. Derfor har vi bestemt oss for å skrive denne artikkelen for å forenkle sortering med sort_values () -funksjonen. La oss begynne.

Eksempel 01:

La oss komme i gang med vårt første eksempel på dagens artikkel om å sortere datarammene til pandaer via kolonnene. For dette må du legge til Pandas støtte i koden med objektet “PD” og importere pandaene. Etter dette har vi startet koden med initialisering av en ordbok DIC1 med blandede typer nøkkelpar. De fleste av dem er strenger, men den siste nøkkelen inneholder heltallstypelisten som dens verdi. Nå er denne ordboken DIC1 blitt konvertert til Pandas DataFrame for å vise den i den tabellformede dataformen ved bruk av DataFrame () -funksjonen. Den resulterende datarammen vil bli lagret i variabelen “D”. Utskriftsfunksjonen er her for å vise den originale datarammen på Spyder 3 -konsollen ved å bruke variabelen “D” i den. Nå har vi brukt sort_values () -funksjonen gjennom datarammen “D” for å sortere den i henhold til den stigende rekkefølgen på kolonnen “C3” fra datarammen og lagre den til variabelen D1. Denne D1 -sorterte datarammen vil bli skrevet ut i Spyder 3 -konsollen ved hjelp av kjøreknappen.

Importer pandaer som PD
DIC1 = 'C1': ['John', 'William', 'Laila'], 'C2': ['Jack', 'Worth', 'Sky'], 'C3': [36, 50, 25]
d = pd.DataFrame (DIC1)
print ("\ n original DataFrame: \ n", d)
d1 = d.sort_values ('C3')
print ("\ n sortert etter kolonne 3: \ n", d1)

Etter å ha kjørt denne koden, har vi fått den opprinnelige datarammen og deretter den sorterte datarammen i henhold til stigende rekkefølge av kolonne C3.

La oss si at du vil bestille eller sortere datarammen i synkende rekkefølge; du kan gjøre det med sort_values () -funksjonen. Du trenger bare å legge til stigende = falsk innenfor parametrene. Så vi har prøvd den samme koden med denne nye oppdateringen. Denne gangen har vi sortert datarammen i henhold til den synkende rekkefølgen av kolonne C2 og viser den på konsollen.

Importer pandaer som PD
DIC1 = 'C1': ['John', 'William', 'Laila'], 'C2': ['Jack', 'Worth', 'Sky'], 'C3': [36, 50, 25]
d = pd.DataFrame (DIC1)
print ("\ n original DataFrame: \ n", d)
d1 = d.sort_values ('c1', stigende = falsk)
Print ("\ n sortert i synkende rekkefølge av kolonne 1: \ n", D1)

Etter å ha kjørt den oppdaterte koden, har vi fått den opprinnelige rammen som vises på konsollen. Etter det er den sorterte datarammen i henhold til den synkende rekkefølgen av kolonne C3 blitt vist.

Eksempel 02:

La oss komme i gang med et annet eksempel for å se arbeidet med sort_verdiene () -funksjonen til Pandas. Men dette eksemplet vil være litt annerledes enn eksemplet ovenfor. Vi sorterer datarammen i henhold til de to kolonnene. Så la oss starte denne koden med Pandas bibliotek som "PD" import på første linje. Heltallstypen Dict. Ordboken er igjen konvertert til en dataramme ved bruk av Pandas Everlasting DataFrame () -funksjonen og lagret i variabelen “D”. Utskriftsmetoden vil vise datarammen “D” på Spyder 3 -konsollen. Nå vil datarammen bli sortert ved hjelp av "sort_values ()" -funksjonen, og tar to kolonnenavn, C1 og C2, I.e. nøkler. Sorteringsordren er bestemt som stigende = sant. Utskriftserklæringen vil vise den oppdaterte og sorterte datarammen “D” på Python Tool -skjermen.

Importer pandaer som PD
DIC1 = 'C1': [3, 5, 7, 9], 'C2': [1, 3, 6, 8], 'C3': [23, 18, 14, 9]
d = pd.DataFrame (DIC1)
print ("\ n original DataFrame: \ n", d)
d1 = d.sort_values (av = ['c1', 'c2'], stigende = true)
Print ("\ n sortert i synkende rekkefølge av kolonne 1 og 2: \ n", D1)

Etter at denne koden var fullført, utførte vi den i Spyder 3 og fikk resultatet nedenfor sortert i henhold til stigende rekkefølge av kolonner C1 og C2.

Eksempel 03:

La oss se på det siste eksemplet med sort_values () funksjonsbruk. Denne gangen har vi initialisert en ordbok med to lister med forskjellige typer, i.e. strenger og tall. Ordboken er konvertert til et sett med datarammer ved hjelp av Pandas “DataFrame ()” -funksjon. Datarammen “D” er skrevet ut som den er. Vi har brukt "sort_values ()" -funksjonen to ganger for å sortere datarammen i henhold til kolonnen "Alder" og kolonne "Navn" separat på to forskjellige linjer. Begge de sorterte datarammene er skrevet ut med utskriftsmetoden.

Importer pandaer som PD
DIC1 = 'Navn': ['John', 'William', 'Laila', 'Bryan', 'Jees'], 'Alder': [15, 10, 34, 19, 37]
d = pd.DataFrame (DIC1)
print ("\ n original DataFrame: \ n", d)
d1 = d.sort_values (av = 'Age', na_position = 'First')
print ("\ n sortert i stigende rekkefølge av kolonne 'alder': \ n", d1)
d1 = d.sort_values (by = 'name', na_position = 'first')
print ("\ n sortert i stigende rekkefølge av kolonnen 'navn': \ n", d1)

Etter å ha utført denne koden, har vi fått den originale datarammen vist først. Etter det er den sorterte datarammen i henhold til kolonnen “Age” vist. Til slutt har datarammen blitt sortert i henhold til kolonnen "Navn" og vist nedenfor.

Konklusjon:

Denne artikkelen har vakkert forklart arbeidet med Pandas “sort_values ()” -funksjon for å sortere hvilken som helst dataramme i henhold til de forskjellige kolonnene. Vi har sett hvordan du kan sortere med en enkelt kolonne for mer enn 1 kolonne i Python. Alle eksempler kan implementeres på et hvilket som helst Python -verktøy.

Python

Pandas read_csv multiprocessing

For å forbedre databelastningshastigheten, inkludert fordelene og begrensningene PD.read_csv () ”-fu...

Daniel Berntsen

C skarp

Hva er system.Io navneområde i C#

System.IO er et navneområde i C# som gir et sett med klasser, strukturer, oppregninger og delegater ...

Daniel Berntsen

Docker

Hva er docker bind monteringer?

En Docker Bind Mount er en type montering som tillater brukere å kartlegge en katalog eller fil på v...

Alexander Sørlie