Signum () -funksjon
Signum () -funksjonen er en matematisk funksjon som brukes i Pyspark. Det er tilgjengelig i Pyspark.SQL.Funksjonsmodul.
Den kan brukes med SELECT -metoden fordi SELECT () viser signumverdiene i PySpark DataFrame.
Syntaks:
DataFrame_obj.Velg (Signum (DataFrame_OBJ.kolonne))
Parameter:
Det tar kolonnenavnet som en parameter for å returnere signumverdier for den kolonnen.
Nå vil vi se noen eksempler for å forstå denne funksjonen bedre.
Eksempel 1
La oss lage en Pyspark DataFrame med 3 rader og 4 kolonner, pluss alle numeriske typer og returnerte signumverdier.
Produksjon:
Så for kolonneverdi1 returnerte vi signumverdiene.
3.141592653589793 er større enn 0. Så signumet er 1.
1.5707963267948966 er større enn 0. Så signumet er 1.
1.0471975511965976 er større enn 0. Så signumet er 1.
Eksempel 2
Nå vil vi returnere signumverdiene for Value2 og Value3 kolonner.
Produksjon:
Kolonne - Verdi2:
0 er 0. Så signumet er 0.
1 er større enn 0. Så signumet er 1.
-5 er mindre enn 0. Så signumet er -1.
Kolonne - Verdi3:
7.8 er større enn 0. Så signumet er 1.
0.5 er større enn 0. Så signumet er 1.
-12.9 er mindre enn 0. Så signumet er -1.
Merk: Signum () -funksjonen vil returnere null hvis du bruker den i strengverdier. Det fungerer bare på numeriske data.
Konklusjon
I denne pyspark -opplæringen diskuterte vi Signum () -funksjonen. Signum () er en matematisk funksjon som kan brukes i Pyspark. Det er tilgjengelig i Pyspark.SQL.Funksjonsmodul. I en DataFrame -kolonne, hvis verdien er mindre enn 0, returnerer signum -1 -1. Hvis verdien er lik 0, returnerer signumet 0. Ellers returnerer det 1.