Pandas Dataframe unik

Det mest populære Python -biblioteket som brukes i datavitenskap kalles Pandas. Det tilbyr Python-programmerere med høy ytelse, brukervennlige og dataanalyseverktøy. Når du har forstått de grunnleggende funksjonene og hvordan du bruker dem, er Pandas et kraftig verktøy for å endre data. I "Pandas" er standardmetodene for lagring av data i tabellform Dataframes. Vi kan bruke noen "pandaer" -metoder for å få de unike verdiene i "Pandas" DataFrames kolonne. Når vi trenger å få unike verdier i DataFrames kolonner og ikke ønsker duplisering av verdier i "Pandas" DataFrames kolonne, kan vi bruke metodene som "Pandas" gir for å gjøre dette. La oss se på slike metoder i denne guiden, sammen med noen eksempler og output for å få unike verdier i DataFrames kolonne med "Pandas".

Metoder for å få unike verdier i “Pandas” DataFrames kolonner

Vi kan bruke to metoder for å få de unike verdiene i “Pandas” DataFrames kolonner. Vi slipper duplikatverdiene og får bare de unike verdiene i kolonnene til Dataframes. Metodene som "pandaer" gir for å gjøre denne oppgaven er:

Ved å bruke den unike () metoden.
Ved å bruke Drop_DuPliactes () -metoden.

Nå vil vi bruke begge metodene i "Pandas" -kodene for å få de unike verdiene i "Pandas" DataFrames kolonner.

Eksempel nr. 01

"Spyder" -appen brukes her for å generere disse "pandas" -kodene for å bruke disse metodene som hjelper oss med å få de unike verdiene i "Pandas" DataFrames kolonner. Vi må importere “Pandas” -modulene, som er nødvendige for “Pandas” -koden, før vi oppretter DataFrame. Ved å bruke begrepet "import" og plassere "pandaer som PD", importerer vi disse modulene.

Nå, ved hjelp av "PD", kan vi raskt få “Pandas” -funksjonene eller metodene. Vi setter deretter "emne_data" der vi legger til "navn" og i "navnet" legger vi til navnet til navnet som er "Roman, William, Peter, Smith, John, Milli, Thomas og James". Deretter legger vi til fagdataene i "SUBJ" som er "matematikk, økonomi, vitenskap, matematikk, statistikk, statistikk, statistikk og datamaskin" ". Deretter konverterer vi denne "emne_data" til "emne_df" DataFrame ved å bruke “PD.DataFrame () ”-metode. Vi plasserer “emne_df” i metoden “print ()” slik at den vises på terminalen.

Nå ønsker vi å få de unike verdiene i "Pandas" DataFrames kolonne "Subj". For dette formålet bruker vi metoden “unik ()” her, og vi legger til navnet på kolonnen og også navnet på DataFrame som vist nedenfor. Vi legger til denne metoden i "print ()", så resultatet vil også vises på terminalen.

Nå trykker vi på “Shift+Enter” for å få resultatet av denne koden, og den gjengir på terminalen og vises også her, som inneholder DataFrame med alle verdier. Dette er den originale DataFrame som vi har lagt til i koden, og under den viser de unike verdiene til "SubJ" -kolonnen. Den slipper duplikatverdiene og viser de unike verdiene til "SubJ" -kolonnen i DataFrame.

Eksempel # 02

Vi oppretter “Sample_list” som inneholder litt informasjon. Vi setter inn “Layla, 21, 28, 31, 14 og 39” som vil vises som den første kolonnen når vi konverterer denne listen til DataFrame. Deretter legger vi til “Lusy, 31, 25, 34, 26 og 21” som den andre raden i DataFrame. Etter dette har vi “Peter, 38, 20, 20, 35 og 24” og “Layla 38, 23, 39 24, 23” som vil være den tredje og fjerde raden i DataFrame. Vi setter også inn tre data som er “Stella, 21, 24, 24, 28, 31”, “Layla, 33, 32, 26, 30, 25” og også “Peter, 21, 21, 31, 21, 29”.

Nå konverterer vi “Sample_list” til “DF_Sample” som er navnet på DataFrame her ved å sette “PD.DataFrame () ”-funksjon. Vi setter også navnet på kolonnene i denne DataFrame, og disse navnene er "Navn, ASS_1, ASS_2, ASS_3, ASS_4 og ASS_5". Deretter bruker vi "print ()" som hjelper til med å vise DataFrame "DF_Sample". Nå bruker vi en annen metode i dette eksemplet for å få de unike verdiene i DataFrames kolonne. Denne metoden er “Drop_duplicates ()” -metoden til “Pandas”.

I metoden “Drop_duplicates ()” angir vi navnet på kolonnen der vi ønsker å få de unike verdiene i DataFrame -kolonnen. Vi får unike verdier av "Navn" -kolonnen ved å slippe duplikatverdiene i denne kolonnen ved hjelp av metoden “Drop_Duplicates ()” og også gjengi disse unike verdiene ved å bruke "print ()" -funksjonen her.

Navnene som dupliseres blir droppet og unike verdier blir gjengitt etter å ha brukt "drop_duplicates ()" -metoden. Du kan merke deg at "Layla" -navnet vises i tre celler i "Navn" -kolonnen. Men når metoden “Drop_Duplicates ()” blir brukt på denne kolonnen, blir alle duplikatverdier droppet og ett "Layla" -navn har dukket opp på skjermen. Etter å ha droppet duplikatverdiene, dukket den nye DataFrame opp som inneholder de unike verdiene i denne "Navn" -kolonnen. På denne måten kan vi slippe duplikatverdiene og få den unike verdien i DataFrame -kolonnen ved hjelp av metoden “Drop_Duplicates ()”.

Eksempel # 03

Den samme DataFrame brukes igjen, og nå bruker vi metoden “unike ()” her. Med den "unike ()" -metoden plasserer vi navnet på kolonnen så vel som DataFrame -navnet som vi ønsker å bruke denne "unike ()" -metoden for å få de unike verdiene. Dette vil bare gjengi de unike verdiene til den kolonnen og vil ikke vise disse verdiene i form av DataFrame.

Her inneholder DataFrame syv verdier i "Navn" -kolonnen, men når vi bruker "unike ()" -metoden på denne kolonnen, har bare fire verdier dukket opp, og dette er de unike verdiene i den kolonnen. Det gjengir ikke duplikatverdier.

Eksempel nr. 04

DataFrame som vi lager i dette eksemplet er "F_G_DF". Vi setter inn “My_Fruits” og “My_Vegs” i dette DataFrame. Kolonnen "My_Fruits" inneholder "Apple, Orange, Apple, Pear, Lychee, Apple, Apple, Pear og Apple". Deretter har vi “My_Vegs” som inneholder navnene på grønnsakene som er “chili, bringe, gulrot, potet, potet, gulrot, løk, hvitløk og ingefær”. Denne dataaframe inneholder bare to kolonner.

Nå får vi de unike verdiene i begge kolonnene ved hjelp av metoden “unike ()”. Vi nevner navnet på DataFrame. Sett deretter kolonnen første kolonnenavn. Etter dette bruker vi vedlegg () -metoden. I dette vedlegget plasserer vi igjen navnet på DataFrame og det andre kolonnenavnet og plasserer "unike ()" -metoden. Dette vil få de unike verdiene til begge kolonnene og deretter legge de unike verdiene til begge kolonnene og vises dem på skjermen.

DataFrame blir gjengitt først som inneholder alle verdier. Etter dette blir den "unike ()" -metoden brukt, og de unike verdiene til begge kolonnene er gjengitt nedenfor. I denne koden får vi de unike verdiene i flere kolonner i DataFrame ved å bruke metoden “unike ()”.

Konklusjon

Den fulle forklaringen på å få de unike verdiene i DataFrames kolonne finnes i denne guiden. Vi har diskutert “unike ()” og “drop_duplicates ()” -metodene som hjelper oss med å få de unike verdiene i DataFrame -kolonnen. Vi har undersøkt hvordan vi bruker disse metodene i "Pandas" -koden ved å bruke disse metodene her i kodene våre. Vi har illustrert forskjellige eksempler i denne guiden og har vist deg hvordan du kan få de unike verdiene til en kolonne ved å bruke metoden “unik ()”, så vel som “drop_duplicates ()” -metoden. Vi har også undersøkt hvordan vi kan få de unike verdiene i flere kolonner ved å bruke metoden “unike ()” i denne guiden.

Python

Python Ikke alle argumenter som er konvertert under strengformatering

Denne feilen kan fikses ved å korrigere syntaksen til % operatøren, ved å bruke format () -funksjone...

Simen Ødegård

Python

Pandas read_csv multiprocessing

For å forbedre databelastningshastigheten, inkludert fordelene og begrensningene PD.read_csv () ”-fu...

Daniel Berntsen

Python

Python Chmod

“OS.CHMOD () ”-funksjonen til OS -modulen brukes til å endre eierskapet til Python -filen ved å godt...

Anders Fjeld Moe