Filtrer Nan Pandas

Filtrer Nan Pandas

Mens de jobber med et stort antall datasett, møter brukere ofte flere null- eller NAN -verdier. Nullverdiene representerer nullverdiene i et datasett. I Python kommer utviklere også over NAN -verdier når de jobber med pandaer i Python. For å filtrere disse nullverdiene, inkluderer Python forskjellige funksjoner.

Resultatene fra denne bloggen er:

  • Hva er "pandas" i python?
  • Hva er NAN -verdier?
  • Hvordan filtrere spesifikk rad fra datasettet som inneholder NAN -verdi ved bruk av Pandas dataaframe i Python?
  • Hvordan filtrere flere rader fra datasettet som inneholder NAN -verdi ved hjelp av Pandas DataFrame i Python?
  • Hvordan filtrere alle rader fra datasettet som inneholder NAN -verdi ved hjelp av Pandas DataFrame i Python?

Hva er "pandas" i python?

I Python, “Pandas”Er det mest brukte biblioteket for å jobbe med flottøren, datetiden, strengen osv., typer datasett. Den har flere funksjoner for å utforske, analysere, rengjøre og manipulere ønskede data. Med andre ord, lar brukere filtrere ut radene som har NAN -verdiene ved å bruke "Dataramme”Funksjoner, for eksempel“Dataramme.dropna ()”, Og“Dataramme.ikke null()”Funksjoner.

Hva er NAN -verdier?

Nesten hvert datasett har nullverdier, null er en spesiell flytende punktverdi som står for “Ikke et tall”. Data kommer i flere former og former inkludert blanke/manglende verdier som er representert som en NAN. Som andre utviklingsspråk har Python også flere måter å representere de manglende verdiene i datasettene.

Hvordan filtrere bestemte datrader fra datasettet som inneholder NAN -verdi ved å bruke Pandas DataFrame i Python?

For å filtrere spesifikke rader fra datasettet som inneholder NAN -verdier, vil vi først opprette et datasett som inneholder NAN -verdier. For å gjøre det, importer "numpy”, Og”Pandas”Bibliotekmoduler og opprette et nytt datasett. Sjekk deretter det nyopprettede datasettet:

Importer pandaer som PD
Importer numpy som NP
DataFrame = PD.DataFrame ('Forfattere': ['Maria', 'Henry', 'Marry', NP.Nan, 'Alex'],
'Brukernavn': ['FMN018', NP.Nan, 'FM012', 'MG002', 'MA025'],
'Erfaring': ['1 år', '2 år', NP.Nan, '6 måneder', '9 måneder']
)
Dataramme

Som du ser inkluderer det opprettede datasettet flere NAN -verdier:

Nå, bruk "ikke null()”Funksjon for å filtrere den spesifikke raden fra den aktuelle kolonnen som inneholder NAN -verdier:

DataFrame [DataFrame ['Experience'].ikke null()]

Produksjon

Hvordan filtrere flere datrader fra datasettet som inneholder NAN -verdi ved å bruke Pandas DataFrame i Python?

Noen ganger trenger brukere å filtrere ut flere rad fra det medfølgende datasettet fra mer enn en kolonne. For å gjøre det, spesifiser de ønskede kolonnenavnene og bruk deretter "alle()”Funksjon med“ikke null()”Funksjon:

kolonner = ['opplevelse', 'brukernavn']
DataFrame [DataFrame [kolonner].ikke null().alle (1)]

Det kan observeres at flere rader er filtrert fra datasettet som inneholder NAN -verdier fra de spesifiserte kolonnene:

Hvordan filtrere alle rader fra datasettet som inneholder NAN -verdi ved hjelp av Pandas DataFrame i Python?

Hvis brukere vil filtrere alle rader fra datasettet som inneholder NAN -verdier ved å bruke Pandas dataaframe i Python, ""dropna ()”Funksjon kan brukes:

Dataramme.dropna ()

Produksjon

Vi har samlet de enkleste måtene å filtrere NAN -verdiene i Python.

Konklusjon

For å filtrere ut radene som har NAN -verdiene i Python, “Dataramme”Funksjoner, for eksempel“Dataramme.ikke null()”, Og“Dataramme.dropna ()”Funksjoner brukes. Denne bloggen ga de forskjellige måtene å filtrere NAN -verdiene i Python.