Pandas isna

Pandas isna
“Pandas er en av pakkene med Python -språk som gjør dataanalysen mye bedre og lettere å fortsette med. På domenet til informatikk er det nesten å analysere data og forbehandling. Så her kommer "Pandas isna", som er en funksjon som brukes til å oppdage de manglende verdiene fra dataene. Det fungerer på en måte som returnerer et boolsk lignende størrelse, som indikerer at verdiene i de gitte dataene er “NA”, som betyr ingen, og tegnene som strenger som er tomme erklærte.

De manglende verdiene viser som "nan" eller "ingen", som forklart. Pandas ISNA -metoden har ingen parametere involvert. Returtypen er en dataaframme med en boolsk. "Nan" indikerer "sanne" verdier. Ellers blir alle andre data kartlagt som "falsk". For implementering av kodene vil vi bruke verktøyet "Spyder", som er i tilført "Python" -språk. Pandas isna er et nytt objekt av Panda hvis inngangsobjekt er av samme størrelse.”

Syntaksen for Pandas isna ()

Vi kan bruke Panda ISNA -metoden på forskjellige datastrukturer. Komme i gang med syntaks.

Dataramme.isna ()

I syntaks ovenfor Pandas isna () Dataframe, må vi ganske enkelt oppgi navnet på DataFrame vi vil jobbe med. Å ringe metoden gjøres ved hjelp av “Dot isna.”Vi kan også bruke metoden til Pandas ISNA () på seriedataene. For det må vi tilordne navnet på serieobjektet med ISNA () -metoden.

La oss nå gjøre eksemplene for en bedre forståelse av Pandas ISNA -metoden. Følgende er måtene vi vil implementere i eksemplene for å oppdage de manglende verdiene i pandaer ved bruk av ISNA () -metoden:

  • Identifisere manglende verdier i en DataFrame -kolonne ved hjelp av Pandas ISNA.
  • Identifisere manglende verdier i hele DataFrame ved hjelp av Pandas ISNA.
  • Bruke Pandas ISNA for å telle nullverdiene i hver kolonne i DataFrame.

Opprette DataFrame for implementering av Pandas ISNA ()

For det første må vi importere Pandas -biblioteket som "PD" Pandas er et open source -bibliotek for å manipulere dataene, og deretter importere Numpy -biblioteket som "NP", som brukes til de numeriske beregningene av dataene. Etter å ha importert bibliotekene, vil vi begynne å lage en dataaframe som også kan skrives som "DF". I "DF" har vi navn, land, salg og utgifter. Det er "fire" variabler der 2 kolonner har karakterdata og de to andre har numeriske data. Følg opp med kommandoen for å skrive ut "salgsdata". “NP.Nan ”i koden er“ NP ”som forklart ovenfor, og“ Nan ”står for ikke et tall; Til sammen er det for å lage de manglende verdiene i DataFrame.

Utgangen viser en opprettet DataFrame i henhold til dataene som er gitt, og vi kan se at noen av verdiene mangler som "NAN". Eksemplene nedenfor vi skal gjøre vil gjøre det klart hvordan du fikser dette.

Eksempel 01: Identifisere manglende verdier i en DataFrame -kolonne ved bruk av Pandas ISNA ()

Her vil vi identifisere de manglende verdiene i kolonnen. Vi har valgt kolonnen "Salg" for å oppdage manglende vilkår. Denne metoden vil bidra til å finne de manglende verdiene i kolonnen vi vil vite eller å jobbe med i stedet for å bruke metoden på hele DataFrame for å fokusere på begrepene vi trenger å vite. Vi har DataFrame opprettet som vi kan se at i salget er det en verdi som mangler, skrevet som “NP.nan ”; det fungerer med teknikken til ekte og usant. Det vil vise verdiene tildelt som "falsk" og de manglende som "sanne".

Utgangen viser resultatene i boolsk, som betyr ekte og usant. De sanne og falske verdiene der vi tydelig kan se hvor den manglende verdien er skrevet er som "sanne".

Eksempel 02: Identifisere manglende verdier i hele DataFrame ved hjelp av Pandas ISNA -metoden

I dette eksemplet vil vi oppdage det manglende begrepet som vi gjorde i forrige eksempel, men her vil vi implementere det i hele DataFrame. Dette betyr at vi vil oppdage manglende vilkår i hele "DF". "DF" opprettet har salgsdataene, som består av navn, landsnavn, salg og utgifter. Den neste kodelinjen forklarer salgsdataene, som er navnet på "DF" som er gitt til den; Vi kan velge det selv, hvilket navn vi vil gi til din "DF", og så er det "Dot" ISNA () som utfører, metoden og skriver ut utgangen som ekte og falsk oppdagelse av manglende begreper i hele "DF ”.

Produksjonen viser at hele DataFrame er merket som "sann" og "falsk", som viser de manglende verdiene, for eksempel salg (3) er merket som "sant" og utgifter (2) er også skrevet som "sant", som betyr Det er enheten til DataFrame som dataene mangler.

Eksempel 03

Nå, i dette eksemplet, vil vi gjøre telling av verdier i DataFrame med Pandas ISNA -metoden, utførelsen av denne metoden ville være mulig ved å bruke to metoder for Pandas, Pandas “ISNA” og Pandas “Sum” -metoden. Som vi vet brukes Isma () for å identifisere den manglende verdien, og summen vi vil bruke er for telling av de manglende verdiene i "DF". Denne metoden er veldig gunstig, ikke brukt veldig ofte, men ettersom trikset blir anerkjent, øker bruken da den får prosessutgangen til å se så tydelig ut at det ikke er behov for å telle i hver rad eller hver kolonne, spesielt, outputtellingen Gjør det enklere å forstå antall manglende vilkår i "DF".

Dette er en vanskelig syntaksmetode for å sette to forskjellige metoder innenfor samme parentes, men med forskjellige linjer. Dette er en veldig nyttig, men kraftig teknikk for dataene som er kranglet og analysen utført på dataene. Vi kan kalle det en kompleks metode, som gjør feilsøking og lesing av dataene enklere.

Her viser utgangen telleversjonen av de manglende verdiene, noe som gjør det klart hvilken kolonne og hvor mange tall som mangler. Salget og utgiftskolonnen har begge “2” manglende verdier. Mens navnet og landet ikke har manglende vilkår.

Konklusjon

I denne artikkelen har vi lært alle måtene Pandas ISNA () fungerer på. I "DF" er det den raske måten å sjekke ut de manglende verdiene. Vi har utført eksemplene for en bedre forståelse av hele DataFrame of Pandas ISNA -metoden, som ved ønsket den valgte kolonnen Pandas ISNA -metoden og tellemetoden til Pandas ISNA. Alle disse metodene, i stor skala, jobber for forbedring og enkel av brukerne, da det vil være vanskelig å oppdage en manglende verdi i millioner av datasett. Så denne tilnærmingen vil være en livredder for alle som jobber med en enorm mengde data mot enhver utviklingsprosess.