Pandas nlarest

Pandas nlarest
"Pandaene" er biblioteket som hjelper oss med å utføre flere oppgaver enkelt og effektivt. Vi kan bruke "Pandas" -biblioteket når vi trenger å manipulere i tillegg til å analysere dataene. “Pandas” gir også muligheten til å lage DataFrame. Dataframe genereres ved hjelp av “Pandas” -metoden. Vi kan også finne den største verdien av DataFrames kolonner. Når vi oppgir noen numeriske data i DataFrame -kolonnen, finner vi også de største verdiene som er til stede i den kolonnen ved hjelp av "Pandas" -metoden. Metoden som vi kan bruke for å finne de største verdiene i kolonnene i DataFrame er “Nlarest ()” -metoden. Vi vil bruke denne "nlargeste" metoden i "pandas" -kodene i denne guiden og forklare dens fungerer her.

Syntaks:
Dataramme.nlargest (n, kolonner, keep = "first")

"N" representerer antallet største verdier vi ønsker å få fra DataFrames kolonner. Deretter, i stedet for "kolonnene" -parameteren, legger vi navnet på kolonnen som vi ønsker å få de største verdiene. Deretter, i "Keep" -parameteren, kan vi legge til "først" eller "sist". "First" brukes til å vise den første verdien av de dupliserte verdiene, og den "siste" brukes til å vise den siste verdien av duplikatverdiene.

Eksempel 1:

Den første koden til denne guiden er her. Alle skriptene som vi dekker i denne guiden er ferdig med "Spyder" -verktøyet. Vi importerer noen få "pandas" -moduler hver gang vi ønsker å skrive nye "pandas" -kode. Disse kan importeres ved å bare skrive “Pandas som PD” etter nøkkelordet “Import”, og det er det vi gjør her. Nå, ved å sette inn "PD" i denne koden, får vi tilgang til funksjonene til "Pandas". Nå designer vi DataFrame her ved å sette “PD.Dataramme()".

Vi designer “num_df” dataaframe og legger tre kolonner i den. "Cola" er den første kolonnen som vi oppretter i denne dataaframe. “Cola” har “10, 4, 6, 9 og 18” i den. Etter “Cola” legger vi til den andre kolonnen “Colb” der vi også legger til noen tall som er “13, 28, 48, 12 og 11”. Deretter er den siste kolonnen som vi setter inn her "COLC" -kolonnen. I "COLC" -kolonnen satte vi “21, 24, 31, 44 og 59”. Alle kolonnene sammen med noen data settes inn i "num_df" dataaframe.

Nå bruker vi “print ()” og passerer “num_df” til denne funksjonen. Dette viser “num_df” på terminalen. Vi ønsker å få de tre største verdiene fra "cola" -kolonnen i denne dataaframe. Så for dette formålet bruker vi metoden “nlarest ()” og passerer “3” som den første parameteren som representerer antallet av de største verdiene vi ønsker å få. Deretter skriver vi “cola” fordi vi ønsker å få de største verdiene i "cola" -kolonnen og lagre disse største verdiene i den "store" variabelen. Deretter skriver vi ut disse verdiene. Så vi bruker "print ()" igjen som inneholder den "store" variabelen i den. Disse tre største verdiene av "cola" vises på terminalen.

Etter å ha truffet “Shift+Enter” -tastene eller trykket på løpsikonet, kan vi enkelt få resultatet av “Pandas” -kodene i “Spyder”. Dataframe er her i dette resultatet som inneholder alle dataene vi legger til den. Deretter vises tre rader i det følgende dataaFrame. Dette er de "3" største verdiene til "cola" som er gjengitt her i synkende rekkefølge.

Eksempel 2:

“Gym_df” er designet i denne koden der vi legger til “Weight_Loser” og “Vekter” som kolonner. I kolonnen “Weight_Loser” er "Theo, Harper, Oscar, Sue, Grace, Jayden, Larry og Taylor" lagt til. Deretter har vi "vekter" -kolonnen der vi legger vektene som er "99, 101, 119, 89, 102, 85, 86 og 120". Nå kaller vi “print ()” og gir argumentet “gym_df”. Dette får terminalen til å vise “gym_ df”. Vi ønsker å få det "4" største antallet av "vektene" -kolonnen i denne dataaframe.

For å oppnå dette bruker vi metoden “Nlargest ()” og passerer tallet “4” som den første parameteren, som står for antallet største verdier vi ønsker å få. Deretter skriver vi "vekter" for å skaffe "vekter" -kolonnes største verdier. Vi lagrer også disse største verdiene i variabelen “Large_weight”. Verdiene må deretter skrives ut. Derfor bruker vi “print ()” en gang til. Det inkluderer variabelen “Large_weights”. Terminalen viser “vektene” største fire verdier.

Etter de originale dataene vises de største fire verdiene i kolonnen "Vekter" i form av en annen ny DataFrame. Vi får disse fire største verdiene ved å bruke “Nlarest ()” -metoden til “Pandas” i koden.

Eksempel 3:

I dette eksemplet leste vi CSV -filen ved hjelp av "read_csv" -metoden til "pandas" og opprette DataFrame fra CSV -filen. Vi lagrer denne DataFrame i "Data_DF" -variabelen. Nå bruker vi “dropna ()” -metoden der vi justerer “inplace” -parameteren til “True”. Dette fjerner de radene der nullverdien vises. Etter dette får vi “Nlarest ()” -metoden og legger til “5” fordi vi ønsker å få de første fem største verdiene i "enhetene" -kolonnen. Disse fem største verdiene er lagret i "største5" -variabelen. Denne "største5" er satt i "trykket ()" for visning.

Den viser alle dataene fra CSV -filen her som DataFrame etter å ha lest den. Deretter får det de første fem største verdiene av "enheter" og fortrenger dem i dette utfallet.

Eksempel 4:

Denne koden oppretter “Sales_df” og legger til kolonnene “Salesman” og “Sales/Day” til det. “ABC, ABD, ABE, ABF, ABG, ABH, ABI, ABJ, ABK og ABL” er nå oppført i "Salesman" -kolonnen. Kolonnen "Salg/dag" følger hvor vi viser følgende salgspriser: “60000, 25000, 30000, 18000, 29000, 21000, 40000, 54000, 33000 og 41000”. Nå plasserer vi “Print ()” med “Sales_df” -argumentet. Denne "Sales_df" DataFrame vises i terminalen som et resultat. De "4" største tallene i spalten "Salg/dag" i denne DataFrame er det vi ønsker å få fra denne DataFrame.

"Nlargest ()" -metoden brukes til å gjøre dette. Den første parameteren som representerer antallet av de største verdiene vi ønsker å motta er “4”, som er lagt til her. Deretter legger vi til navnet på kolonnen som vi ønsker å få tilgang til de største verdiene. Navnet på den kolonnen er kolonnen "Salg/dag". Vi legger til denne "nlargest ()" -metoden i "print ()", så den vises også på terminalen.

Dette utfallet inneholder DataFrame med alle dataene vi bidro til den i koden. Deretter vises fire rader i følgende DataFrame. Dette er de "4" største verdiene i kolonnen "Salg/dag". De vises i synkende rekkefølge i følgende illustrasjon:

Konklusjon

Denne guiden beskrev fullstendig “nlargest ()” -metoden til “pandaer” i detalj. Vi lærte syntaks for denne guiden i detalj, så vel som bruken av denne metoden. Vi diskuterte parametrene for denne metoden grundig, og vi benyttet oss av denne "nlargest ()" -metoden i "pandas" -koden for å vise arbeidet med denne "nlargest ()" -metoden. Vi forklarte hvordan vi skulle nevne antallet største verdier som vi ønsker å få, så vel som kolonnenavnet for å få de "n" største verdiene fra DataFrame -kolonnen. Vi forklarte også hvordan du får de største verdiene fra CSV -filen etter å ha lest dataene fra CSV -filen i denne guiden.