Pyspark - Vismetode

Pyspark - Vismetode
I Python er Pyspark en Spark -modul som brukes til å gi en lignende type prosessering som Spark ved hjelp av DataFrame. Den gir Show () -metoden, som viser DataFrame i tabellformat.

Syntaks:

Dataramme.show (n, vertikal, avkortet)

Hvor DataFrame er inngangen Pyspark DataFrame

Parametere:

1. N er den første valgfrie parameteren som representerer heltallverdien for å få toppradene i DataFrame, og N representerer antall topprader som skal vises. Som standard vil den vise alle rader fra DataFrame

2. Vertikal parameter tar boolske verdier, som brukes til å vise DataFrame i den vertikale parameteren når den er satt til sann. og vis DataFrame i horisontalt format når det er satt til FALSE. Som standard vises den i horisontalt format

3. Avkortet brukes til å få antall tegn fra hver verdi i DataFrame. Det vil ta et heltall som noen tegn som skal vises. Som standard vil den vise alle tegnene.

Eksempel 1:

I dette eksemplet vil vi lage en Pyspark DataFrame med 5 rader og 6 kolonner og vise DataFrame ved å bruke Show () -metoden uten parametere.

Så dette resulterer i et tabelldataframe ved å vise alle verdier i DataFrame

#import pyspaprk -modulen
Importer pyspark
#import SparkSession for å lage en økt
Fra Pyspark.SQL Import SparkSession
#Create en app som heter Linuxhint
Spark_app = SparkSession.bygger.AppName ('Linuxhint').getorCreate ()
# Lag studentdata med 5 rader og 6 attributter
Studenter = ['Rollno': '001', 'Navn': 'Sravan', 'Age': 23, 'Height': 5.79, 'vekt': 67, 'adresse': 'guntur',
'Rollno': '002', 'Navn': 'Ojaswi', 'Age': 16, 'Height': 3.79, 'vekt': 34, 'adresse': 'hyd',
'Rollno': '003', 'Navn': 'Gnanesh Chowdary', 'Age': 7, 'Height': 2.79, 'Vekt': 17, 'Adresse': 'Patna',
'Rollno': '004', 'Navn': 'Rohith', 'Age': 9, 'Height': 3.69, 'vekt': 28, 'adresse': 'hyd',
'Rollno': '005', 'Navn': 'Sridevi', 'Age': 37, 'Height': 5.59, 'vekt': 54, 'adresse': 'hyd']]
# Lag DataFrame
df = spark_app.CreateTataFrame (studenter)
# Dataramme
df.forestilling()

Produksjon:

Eksempel 2:

I dette eksemplet vil vi lage en Pyspark DataFrame med 5 rader og 6 kolonner og vise DataFrame ved å bruke Show () -metoden med N -parameteren. Vi setter N -verdien til 4 for å vise de 4 øverste radene fra DataFrame.

Så dette resulterer i et tabelldataframe ved å vise 4 verdier i DataFrame.

#import pyspaprk -modulen
Importer pyspark
#import SparkSession for å lage en økt
Fra Pyspark.SQL Import SparkSession
#Create en app som heter Linuxhint
Spark_app = SparkSession.bygger.AppName ('Linuxhint').getorCreate ()
# Lag studentdata med 5 rader og 6 attributter
Studenter = ['Rollno': '001', 'Navn': 'Sravan', 'Age': 23, 'Height': 5.79, 'vekt': 67, 'adresse': 'guntur',
'Rollno': '002', 'Navn': 'Ojaswi', 'Age': 16, 'Height': 3.79, 'vekt': 34, 'adresse': 'hyd',
'Rollno': '003', 'Navn': 'Gnanesh Chowdary', 'Age': 7, 'Height': 2.79, 'Vekt': 17, 'Adresse': 'Patna',
'Rollno': '004', 'Navn': 'Rohith', 'Age': 9, 'Height': 3.69, 'vekt': 28, 'adresse': 'hyd',
'Rollno': '005', 'Navn': 'Sridevi', 'Age': 37, 'Height': 5.59, 'vekt': 54, 'adresse': 'hyd']]
# Lag DataFrame
df = spark_app.CreateTataFrame (studenter)
# Få topp 4 rader i DataFrame
df.Vis (4)

Produksjon:

Eksempel 3:

I dette eksemplet vil vi lage en Pyspark DataFrame med 5 rader og 6 kolonner og vise DataFrame ved å bruke Show () -metoden med en vertikal parameter. Vi setter vertikal til usant for å vise DataFrame i horisontalt visning.

Så dette resulterer i et tabelldatafram ved å vise alle verdier i horisontalt visning.

#import pyspaprk -modulen
Importer pyspark
#import SparkSession for å lage en økt
Fra Pyspark.SQL Import SparkSession
#Create en app som heter Linuxhint
Spark_app = SparkSession.bygger.AppName ('Linuxhint').getorCreate ()
# Lag studentdata med 5 rader og 6 attributter
Studenter = ['Rollno': '001', 'Navn': 'Sravan', 'Age': 23, 'Height': 5.79, 'vekt': 67, 'adresse': 'guntur',
'Rollno': '002', 'Navn': 'Ojaswi', 'Age': 16, 'Height': 3.79, 'vekt': 34, 'adresse': 'hyd',
'Rollno': '003', 'Navn': 'Gnanesh Chowdary', 'Age': 7, 'Height': 2.79, 'Vekt': 17, 'Adresse': 'Patna',
'Rollno': '004', 'Navn': 'Rohith', 'Age': 9, 'Height': 3.69, 'vekt': 28, 'adresse': 'hyd',
'Rollno': '005', 'Navn': 'Sridevi', 'Age': 37, 'Height': 5.59, 'vekt': 54, 'adresse': 'hyd']]
# Lag DataFrame
df = spark_app.CreateTataFrame (studenter)
# Få DataFrame på horisontal måte
df.vis (vertikal = falsk)

Produksjon:

Eksempel 4:

I dette eksemplet vil vi lage en Pyspark DataFrame med 5 rader og 6 kolonner og vise DataFrame ved å bruke Show () -metoden med en vertikal parameter. Vi setter vertikal til sann for å vise DataFrame i vertikal visning.

Så dette resulterer i en tabelldataframe ved å vise alle verdier i vertikal visning.

#import pyspaprk -modulen
Importer pyspark
#import SparkSession for å lage en økt
Fra Pyspark.SQL Import SparkSession
#Create en app som heter Linuxhint
Spark_app = SparkSession.bygger.AppName ('Linuxhint').getorCreate ()
# Lag studentdata med 5 rader og 6 attributter
Studenter = ['Rollno': '001', 'Navn': 'Sravan', 'Age': 23, 'Height': 5.79, 'vekt': 67, 'adresse': 'guntur',
'Rollno': '002', 'Navn': 'Ojaswi', 'Age': 16, 'Height': 3.79, 'vekt': 34, 'adresse': 'hyd',
'Rollno': '003', 'Navn': 'Gnanesh Chowdary', 'Age': 7, 'Height': 2.79, 'Vekt': 17, 'Adresse': 'Patna',
'Rollno': '004', 'Navn': 'Rohith', 'Age': 9, 'Height': 3.69, 'vekt': 28, 'adresse': 'hyd',
'Rollno': '005', 'Navn': 'Sridevi', 'Age': 37, 'Height': 5.59, 'vekt': 54, 'adresse': 'hyd']]
# Lag DataFrame
df = spark_app.CreateTataFrame (studenter)
# Få DataFrame på en vertikal måte
df.vis (vertikal = sant)

Produksjon:

Eksempel 5:

I dette eksemplet vil vi lage en Pyspark DataFrame med 5 rader og 6 kolonner og vise DataFrame ved å bruke Show () -metoden med avkortningsparameter. Vi setter avkortet verdi til 1 for å vise det første tegnet i hver rad i DataFrame.

Så dette resulterer i et tabelldatafram ved å vise det første tegnet i horisontalt syn.

#import pyspaprk -modulen
Importer pyspark
#import SparkSession for å lage en økt
Fra Pyspark.SQL Import SparkSession
#Create en app som heter Linuxhint
Spark_app = SparkSession.bygger.AppName ('Linuxhint').getorCreate ()
# Lag studentdata med 5 rader og 6 attributter
Studenter = ['Rollno': '001', 'Navn': 'Sravan', 'Age': 23, 'Height': 5.79, 'vekt': 67, 'adresse': 'guntur',
'Rollno': '002', 'Navn': 'Ojaswi', 'Age': 16, 'Height': 3.79, 'vekt': 34, 'adresse': 'hyd',
'Rollno': '003', 'Navn': 'Gnanesh Chowdary', 'Age': 7, 'Height': 2.79, 'Vekt': 17, 'Adresse': 'Patna',
'Rollno': '004', 'Navn': 'Rohith', 'Age': 9, 'Height': 3.69, 'vekt': 28, 'adresse': 'hyd',
'Rollno': '005', 'Navn': 'Sridevi', 'Age': 37, 'Height': 5.59, 'vekt': 54, 'adresse': 'hyd']]
# Lag DataFrame
df = spark_app.CreateTataFrame (studenter)
# Få DataFrame ved å få bare første karakter i hver rad
df.vis (avkortet = 1)

Produksjon:

Konklusjon

Denne artikkelen diskuterte Show () -metoden i Pyspark og dens funksjonalitet. Vi vurderte alle parametrene med verdier for DataFrame for å vise DataFrame i tabellformat.