Pyspark - Pandas -serien representerer Pandas -serien, men den holder Pyspark -kolonnen internt.
Pandas Support Series Datastruktur, og Pandas importeres fra Pyspark -modulen.
Før det må du installere Pyspark -modulen.”
Kommando
PIP installer pysparkSyntaks for å importere
Fra Pyspark Import PandasEtter det kan vi lage eller bruke serien fra Pandas -modulen.
Syntaks for å lage Pandas -serier
Pyspark.Pandas.Serie()Vi kan passere en liste eller liste over lister med verdier.
La oss lage en Pandas -serie gjennom Pyspark som har fem numeriske verdier.
#import pandaer fra pyspark -modulenProduksjon
Nå vil vi gå inn på opplæringen vår.
Aggregatefunksjoner brukes til å utføre aggregeringsoperasjoner som sum (), Min (), Mean () og Max ().Disse operasjonene fungerer bare på numeriske data som heltall, dobbel osv
La oss se dem en etter en.
Pyspark.Pandas.Serie.sum()
sum () i Pyspark Pandas -serien brukes til å returnere den totale summen.
Syntaks
pyspark_series.sum()Hvor pyspark_series er pyspark pandas -serien.
Eksempel
Retursum av ovennevnte Pyspark Pandas -serie.
Produksjon:
278Pyspark.Pandas.Serie.mener()
Gjennomsnitt () i Pyspark Pandas -serien brukes til å returnere det totale gjennomsnittet.
Syntaks
pyspark_series.mener()Hvor pyspark_series er pyspark pandas -serien.
Eksempel
Returgjennomsnitt av ovennevnte Pyspark Pandas -serie.
Produksjon
55.6Pyspark.Pandas.Serie.min ()
min () i Pyspark Pandas -serien brukes til å returnere minimumsverdi.
Syntaks
pyspark_series.min ()Hvor pyspark_series er pyspark pandas -serien.
Eksempel
Returner minimumsverdi fra ovennevnte Pyspark Pandas -serie.
Produksjon
0Pyspark.Pandas.Serie.Max ()
Max () i Pyspark Pandas -serien brukes til å returnere maksimal verdi.
Syntaks
pyspark_series.Max ()Hvor pyspark_series er pyspark pandas -serien.
Eksempel
Returner maksimal verdi fra ovennevnte Pyspark Pandas -serien.
Produksjon
90Konklusjon
I denne Pyspark Pandas Series -opplæringen så vi fire forskjellige aggregeringsfunksjoner utført på serien. sum () vil returnere den totale summen, AVG () brukes til å returnere det totale gjennomsnittet, min () brukes til å returnere minimumsverdien, og maks () vil returnere maksimal verdi.