Så i denne artikkelen vil vi utforske forskjellige metoder for å sjekke om en bestemt celleverdi er null eller ikke (nan eller ingen).
De forskjellige metodene vi skal diskutere er:
La oss diskutere hver metode i detalj.
Metode 1: Bruke ISNULL -funksjonen
I denne metoden vil vi bruke en veldig enkel metode som heter ISNull () for å finne ut om den aktuelle cellen har en NAN -verdi.
# Python IsNull.pyProduksjon: Python IsNull.py
x yLinje 3 til 4: Vi importerer bibliotekets pandaer og numpy.
Linje 6: Vi oppretter en ordbok med X- og Y -nøkler og deres verdier med noen NP.Nan.
Linje 8 til 10: Vi konverterer ordboken til DataFrame og skriver deretter ut den dataaframet som vi kan se i utdataene ovenfor.
Linje 12 til 13: Vi kaller DataFrame -metoden er Null og sjekk en bestemt celle [5, 0] DataFrame -verdien er null eller ikke. I dette tilfellet sjekker vi ikke etter hele DataFrame og for encellet DataFrame-verdien. Så det gir utgangen sant, som vises i output ovenfor. Den første verdien 5 [5, 0] som representerer indeksposisjonen, og den andre verdien, 0, representerer kolonneindeksnavnet.
Metode 2: Bruke ISNAN () -metode
I eksemplet ovenfor sjekket vi NAN -verdien ved å bruke ISNULL -metoden til DataFrame. Nå skal vi bruke en annen metode som heter Isnan. Denne metoden tilhører Numpy og ikke DataFrame. Programmet nedenfor er for det som bare sjekker for den aktuelle cellen.
# Vi kan også sjekke cellen NAN -verdien i DataFrameProduksjon:
x yLinje 2: Vi oppretter en ordbok med X- og Y -nøkler og deres verdier med noen NP.Nan.
Linje 4 og 5: Vi konverterer ordboken til DataFrame og skriver deretter ut den dataaframet som vi kan se i utdataene ovenfor.
Linje 6: Vi filtrerte den spesielle celleverdien ved å bruke indeks- og kolonnens navn [5, 'x'] og tildelte den verdien til variabel verdi. Den første verdien 5 som representerer indeksposisjonen, og 'X' representerer kolonnenavnet.
Linje 7: Vi sjekker om verdien er nan eller ikke.
Linje 9: Vi skriver endelig ut utdataene våre som viser at verdien har Nan er sann.
Metode 3: Cell NAN -verdi i en serie som bruker ISNAN
Vi sjekket inn forrige eksempel NAN -verdien i en celle dataframe. Vi kan også sjekke inne i Pandas -serien om noen celleverdi er nan eller ikke. Så la oss se hvordan vi kan implementere det.
# Vi kan også sjekke Cell NAN -verdien i DataFrame -serienProduksjon:
0 2.0Linje 3: Vi opprettet Pandas -serien.
Linje 6: Vi tildeler celleverdien som vi vil sjekke til en annen variabel.
Linje 7: Vi sjekker enten verdien i den variabelen er Nan eller ikke.
Metode 4: Bruke pandaer.isna
En annen metode vi kan bruke er å sjekke om en bestemt DataFrame -celleverdi er null eller ikke ved bruk av pandaene.ISNA -metoden.
data = 'x': [1,2,3,4,5, NP.Nan, 6,7, NP.Nan, 8,9,10, NP.nan],Produksjon:
x yLinje 1: Vi oppretter en ordbok med X- og Y -nøkler og deres verdier med noen NP.Nan.
Linje 3 til 5: Vi konverterer ordboken til DataFrame og trykker deretter den dataaframet som vi kan se i output ovenfor.
Linje 8: Vi sjekker om cellen [5, 0] verdien er nan eller ikke. Den første verdien 5, som representerer indeksposisjonen, og 0 representerer kolonnenavnet. Vi skriver endelig ut utdataene våre som viser at verdien har Nan er sann.
Metode 5: Bruke pandaer.NOTNULL -metode
En annen metode som vi kan sjekke en av bestemt celleverdier er NAN eller ikke ved å bruke Notnull -metoden. I denne metoden, hvis celleverdien er nan eller mangler, vil den returnere en boolsk falsk, som vist i programmet nedenfor.
data = 'x': [1,2,3,4,5, NP.Nan, 6,7, NP.Nan, 8,9,10, NP.nan],Produksjon:
x yLinje 1: Vi oppretter en ordbok med X- og Y -nøkler og deres verdier med noen NP.Nan.
Linje 3 til 5: Vi konverterer ordboken til DataFrame og trykker deretter den dataaframet som vi kan se i output ovenfor.
Linje 8: Vi sjekker om cellen [5, 0] verdien ikke er NAN. Den første verdien 5, som representerer indeksposisjonen, og 0 representerer kolonnenavnet. Vi skriver endelig ut utdataene våre som viser at verdien har NAN og returnerer som falsk fordi vi sjekker om cellen er Notnull, men cellen er faktisk null.
Konklusjon
I denne bloggen har vi sett forskjellige metoder for å bestemme en bestemt celleverdi er Nan eller ingen fordi vi noen ganger må finne ut celleverdien og ikke hele DataFrame. Derfor er denne bloggen spesielt for celleverdifokus. Vi har sett Pandas og Numpy, begge metodene for å sjekke manglende verdier. Vi fokuserer på konseptet bare for å vise enkle opplæringsprogrammer og ikke bruke noen iterasjonssløyfe. Alle de ovennevnte metodene som vi diskuterte er raske i utførelse selv om du vil sjekke hele DataFrame.
Koden for denne bloggen er tilgjengelig på GitHub -lenken.