Pyspark - Pandas -serien representerer Pandas -serien, men den holder Pyspark -kolonnen internt.
Pandas Support Series Datastruktur, og Pandas importeres fra Pyspark -modulen.
Før det må du installere Pyspark -modulen.”
Kommando
PIP installer pysparkSyntaks for å importere
Fra Pyspark Import PandasEtter det kan vi lage eller bruke serien fra Pandas -modulen.
Syntaks for å lage Pandas -serier
Pyspark.Pandas.Serie()Vi kan passere en liste eller liste over lister med verdier.
La oss lage en Pandas -serie gjennom Pyspark som har fem numeriske verdier.
#import pandaer fra pyspark -modulenProduksjon
Nå vil vi gå inn på opplæringen vår.
Kumulative operasjoner brukes til å returnere kumulative resultater på tvers av verdiene i Pyspark Pandas -serien.
La oss se dem en etter en.
Pyspark.Pandas.Serie.Cumsum ()
Cumsum () vil returnere den kumulative summen av serien for hvert element. Det kan brukes på hele Pyspark Pandas -serien.
Syntaks
pyspark_series.Cumsum ()Hvor pyspark_series er pyspark pandas -serien
Eksempel
I dette eksemplet vil vi utføre en kumulativ sumoperasjon på serien.
Produksjon
Arbeider:Pyspark.Pandas.Serie.cumprod ()
Cumprod () vil returnere det kumulative produktet av serien for hvert element. Det kan brukes på hele Pyspark Pandas -serien.
Syntaks
pyspark_series.cumprod ()Hvor pyspark_series er pyspark pandas -serien
Eksempel
I dette eksemplet vil vi utføre en kumulativ produktoperasjon i serien.
Produksjon
Arbeider:Pyspark.Pandas.Serie.cummin ()
Cummin () vil returnere den kumulative minimumsverdien til serien for hvert element. Det kan brukes på hele Pyspark Pandas -serien.
Syntaks
pyspark_series.cummin ()Hvor pyspark_series er pyspark pandas -serien
Eksempel
I dette eksemplet vil vi utføre en kumulativ minoperasjon på serien.
Produksjon
Arbeider:Pyspark.Pandas.Serie.cummin ()
Cummin () vil returnere den kumulative minimumsverdien til serien for hvert element. Det kan brukes på hele Pyspark Pandas -serien.
Syntaks
pyspark_series.CUMMAX ()Hvor pyspark_series er pyspark pandas -serien
Eksempel
I dette eksemplet vil vi utføre en kumulativ maksimal operasjon på serien.
Produksjon
Arbeider:Konklusjon
I denne Pyspark Pandas -opplæringen diskuterte vi kumulative operasjoner utført på Pyspark Pandas -serien. Cumsum () brukes til å returnere den kumulative summen, cumprod () brukes til å returnere det kumulative produktet i, cummin () brukes til å returnere den kumulative minimumsverdien, og CumMax () brukes til å returnere den kumulative maksimale verdien.