Pyspark Signum -funksjon

Pyspark Signum -funksjon
Den største fordelen med signumfunksjonen er å gi et tegn på de gitte verdiene. I PySpark DataFrame med de numeriske kolonnene, hvis verdien er mindre enn 0, returnerer signumet -1. Hvis verdien er lik 0, returnerer signumet 0. Ellers returnerer det 1.

Signum () -funksjon

Signum () -funksjonen er en matematisk funksjon som brukes i Pyspark. Det er tilgjengelig i Pyspark.SQL.Funksjonsmodul.

Den kan brukes med SELECT -metoden fordi SELECT () viser signumverdiene i PySpark DataFrame.

Syntaks:
DataFrame_obj.Velg (Signum (DataFrame_OBJ.kolonne))

Parameter:
Det tar kolonnenavnet som en parameter for å returnere signumverdier for den kolonnen.

Nå vil vi se noen eksempler for å forstå denne funksjonen bedre.

Eksempel 1
La oss lage en Pyspark DataFrame med 3 rader og 4 kolonner, pluss alle numeriske typer og returnerte signumverdier.

Importer pyspark
Importer matematikk
Fra Pyspark.SQL Import SparkSession
Fra Pyspark.SQL.Funksjoner importerer signum
Spark_app = SparkSession.bygger.AppName ('_').getorCreate ()
#Create Math Values
Verdier = [(matematikk.pi, 0,7.8,120),
(matte.PI/2,1,0.5.180),
(matte.PI/3, -5, -12.9.360)
]
#Assignalkolonner ved å lage PySpark DataFrame
DataFrame_OBJ = Spark_App.CreateTataFrame (Values, ['Value1', 'Value2', 'Value3', 'Value4'])
DataFrame_obj.forestilling()
#få signumverdiene til verdien1 -kolonnen
DataFrame_obj.Velg (Signum (DataFrame_OBJ.verdi1)).forestilling()

Produksjon:

Så for kolonneverdi1 returnerte vi signumverdiene.
3.141592653589793 er større enn 0. Så signumet er 1.
1.5707963267948966 er større enn 0. Så signumet er 1.
1.0471975511965976 er større enn 0. Så signumet er 1.

Eksempel 2
Nå vil vi returnere signumverdiene for Value2 og Value3 kolonner.

Importer pyspark
Importer matematikk
Fra Pyspark.SQL Import SparkSession
Fra Pyspark.SQL.Funksjoner importerer signum
Spark_app = SparkSession.bygger.AppName ('_').getorCreate ()
#Create Math Values
Verdier = [(matematikk.pi, 0,7.8,120),
(matte.PI/2,1,0.5.180),
(matte.PI/3, -5, -12.9.360)
]
#Assignalkolonner ved å lage PySpark DataFrame
DataFrame_OBJ = Spark_App.CreateTataFrame (Values, ['Value1', 'Value2', 'Value3', 'Value4'])
DataFrame_obj.forestilling()
#Få signumverdiene til Value2 og Value3 kolonne
DataFrame_obj.Velg (Signum (DataFrame_OBJ.Value2), signum (dataaframe_obj.verdi3)).forestilling()

Produksjon:

Kolonne - Verdi2:

0 er 0. Så signumet er 0.
1 er større enn 0. Så signumet er 1.
-5 er mindre enn 0. Så signumet er -1.

Kolonne - Verdi3:

7.8 er større enn 0. Så signumet er 1.
0.5 er større enn 0. Så signumet er 1.
-12.9 er mindre enn 0. Så signumet er -1.

Merk: Signum () -funksjonen vil returnere null hvis du bruker den i strengverdier. Det fungerer bare på numeriske data.

Konklusjon

I denne pyspark -opplæringen diskuterte vi Signum () -funksjonen. Signum () er en matematisk funksjon som kan brukes i Pyspark. Det er tilgjengelig i Pyspark.SQL.Funksjonsmodul. I en DataFrame -kolonne, hvis verdien er mindre enn 0, returnerer signum -1 -1. Hvis verdien er lik 0, returnerer signumet 0. Ellers returnerer det 1.