I Python er Pyspark en Spark -modul som brukes til å gi en lignende type prosessering som Spark ved hjelp av DataFrame. Den gir Show () -metoden, som viser DataFrame i tabellformat.
Syntaks:
Dataramme.show (n, vertikal, avkortet)
Hvor DataFrame er inngangen Pyspark DataFrame
Parametere:
1. N er den første valgfrie parameteren som representerer heltallverdien for å få toppradene i DataFrame, og N representerer antall topprader som skal vises. Som standard vil den vise alle rader fra DataFrame
2. Vertikal parameter tar boolske verdier, som brukes til å vise DataFrame i den vertikale parameteren når den er satt til sann. og vis DataFrame i horisontalt format når det er satt til FALSE. Som standard vises den i horisontalt format
3. Avkortet brukes til å få antall tegn fra hver verdi i DataFrame. Det vil ta et heltall som noen tegn som skal vises. Som standard vil den vise alle tegnene.
Eksempel 1:
I dette eksemplet vil vi lage en Pyspark DataFrame med 5 rader og 6 kolonner og vise DataFrame ved å bruke Show () -metoden uten parametere.
Så dette resulterer i et tabelldataframe ved å vise alle verdier i DataFrame
#import pyspaprk -modulen
Importer pyspark
#import SparkSession for å lage en økt
Fra Pyspark.SQL Import SparkSession
#Create en app som heter Linuxhint
Spark_app = SparkSession.bygger.AppName ('Linuxhint').getorCreate ()
# Lag studentdata med 5 rader og 6 attributter
Studenter = ['Rollno': '001', 'Navn': 'Sravan', 'Age': 23, 'Height': 5.79, 'vekt': 67, 'adresse': 'guntur',
'Rollno': '002', 'Navn': 'Ojaswi', 'Age': 16, 'Height': 3.79, 'vekt': 34, 'adresse': 'hyd',
'Rollno': '003', 'Navn': 'Gnanesh Chowdary', 'Age': 7, 'Height': 2.79, 'Vekt': 17, 'Adresse': 'Patna',
'Rollno': '004', 'Navn': 'Rohith', 'Age': 9, 'Height': 3.69, 'vekt': 28, 'adresse': 'hyd',
'Rollno': '005', 'Navn': 'Sridevi', 'Age': 37, 'Height': 5.59, 'vekt': 54, 'adresse': 'hyd']]
# Lag DataFrame
df = spark_app.CreateTataFrame (studenter)
# Dataramme
df.forestilling()
Produksjon:
Eksempel 2:
I dette eksemplet vil vi lage en Pyspark DataFrame med 5 rader og 6 kolonner og vise DataFrame ved å bruke Show () -metoden med N -parameteren. Vi setter N -verdien til 4 for å vise de 4 øverste radene fra DataFrame.
Så dette resulterer i et tabelldataframe ved å vise 4 verdier i DataFrame.
#import pyspaprk -modulen
Importer pyspark
#import SparkSession for å lage en økt
Fra Pyspark.SQL Import SparkSession
#Create en app som heter Linuxhint
Spark_app = SparkSession.bygger.AppName ('Linuxhint').getorCreate ()
# Lag studentdata med 5 rader og 6 attributter
Studenter = ['Rollno': '001', 'Navn': 'Sravan', 'Age': 23, 'Height': 5.79, 'vekt': 67, 'adresse': 'guntur',
'Rollno': '002', 'Navn': 'Ojaswi', 'Age': 16, 'Height': 3.79, 'vekt': 34, 'adresse': 'hyd',
'Rollno': '003', 'Navn': 'Gnanesh Chowdary', 'Age': 7, 'Height': 2.79, 'Vekt': 17, 'Adresse': 'Patna',
'Rollno': '004', 'Navn': 'Rohith', 'Age': 9, 'Height': 3.69, 'vekt': 28, 'adresse': 'hyd',
'Rollno': '005', 'Navn': 'Sridevi', 'Age': 37, 'Height': 5.59, 'vekt': 54, 'adresse': 'hyd']]
# Lag DataFrame
df = spark_app.CreateTataFrame (studenter)
# Få topp 4 rader i DataFrame
df.Vis (4)
Produksjon:
Eksempel 3:
I dette eksemplet vil vi lage en Pyspark DataFrame med 5 rader og 6 kolonner og vise DataFrame ved å bruke Show () -metoden med en vertikal parameter. Vi setter vertikal til usant for å vise DataFrame i horisontalt visning.
Så dette resulterer i et tabelldatafram ved å vise alle verdier i horisontalt visning.
#import pyspaprk -modulen
Importer pyspark
#import SparkSession for å lage en økt
Fra Pyspark.SQL Import SparkSession
#Create en app som heter Linuxhint
Spark_app = SparkSession.bygger.AppName ('Linuxhint').getorCreate ()
# Lag studentdata med 5 rader og 6 attributter
Studenter = ['Rollno': '001', 'Navn': 'Sravan', 'Age': 23, 'Height': 5.79, 'vekt': 67, 'adresse': 'guntur',
'Rollno': '002', 'Navn': 'Ojaswi', 'Age': 16, 'Height': 3.79, 'vekt': 34, 'adresse': 'hyd',
'Rollno': '003', 'Navn': 'Gnanesh Chowdary', 'Age': 7, 'Height': 2.79, 'Vekt': 17, 'Adresse': 'Patna',
'Rollno': '004', 'Navn': 'Rohith', 'Age': 9, 'Height': 3.69, 'vekt': 28, 'adresse': 'hyd',
'Rollno': '005', 'Navn': 'Sridevi', 'Age': 37, 'Height': 5.59, 'vekt': 54, 'adresse': 'hyd']]
# Lag DataFrame
df = spark_app.CreateTataFrame (studenter)
# Få DataFrame på horisontal måte
df.vis (vertikal = falsk)
Produksjon:
Eksempel 4:
I dette eksemplet vil vi lage en Pyspark DataFrame med 5 rader og 6 kolonner og vise DataFrame ved å bruke Show () -metoden med en vertikal parameter. Vi setter vertikal til sann for å vise DataFrame i vertikal visning.
Så dette resulterer i en tabelldataframe ved å vise alle verdier i vertikal visning.
#import pyspaprk -modulen
Importer pyspark
#import SparkSession for å lage en økt
Fra Pyspark.SQL Import SparkSession
#Create en app som heter Linuxhint
Spark_app = SparkSession.bygger.AppName ('Linuxhint').getorCreate ()
# Lag studentdata med 5 rader og 6 attributter
Studenter = ['Rollno': '001', 'Navn': 'Sravan', 'Age': 23, 'Height': 5.79, 'vekt': 67, 'adresse': 'guntur',
'Rollno': '002', 'Navn': 'Ojaswi', 'Age': 16, 'Height': 3.79, 'vekt': 34, 'adresse': 'hyd',
'Rollno': '003', 'Navn': 'Gnanesh Chowdary', 'Age': 7, 'Height': 2.79, 'Vekt': 17, 'Adresse': 'Patna',
'Rollno': '004', 'Navn': 'Rohith', 'Age': 9, 'Height': 3.69, 'vekt': 28, 'adresse': 'hyd',
'Rollno': '005', 'Navn': 'Sridevi', 'Age': 37, 'Height': 5.59, 'vekt': 54, 'adresse': 'hyd']]
# Lag DataFrame
df = spark_app.CreateTataFrame (studenter)
# Få DataFrame på en vertikal måte
df.vis (vertikal = sant)
Produksjon:
Eksempel 5:
I dette eksemplet vil vi lage en Pyspark DataFrame med 5 rader og 6 kolonner og vise DataFrame ved å bruke Show () -metoden med avkortningsparameter. Vi setter avkortet verdi til 1 for å vise det første tegnet i hver rad i DataFrame.
Så dette resulterer i et tabelldatafram ved å vise det første tegnet i horisontalt syn.
#import pyspaprk -modulen
Importer pyspark
#import SparkSession for å lage en økt
Fra Pyspark.SQL Import SparkSession
#Create en app som heter Linuxhint
Spark_app = SparkSession.bygger.AppName ('Linuxhint').getorCreate ()
# Lag studentdata med 5 rader og 6 attributter
Studenter = ['Rollno': '001', 'Navn': 'Sravan', 'Age': 23, 'Height': 5.79, 'vekt': 67, 'adresse': 'guntur',
'Rollno': '002', 'Navn': 'Ojaswi', 'Age': 16, 'Height': 3.79, 'vekt': 34, 'adresse': 'hyd',
'Rollno': '003', 'Navn': 'Gnanesh Chowdary', 'Age': 7, 'Height': 2.79, 'Vekt': 17, 'Adresse': 'Patna',
'Rollno': '004', 'Navn': 'Rohith', 'Age': 9, 'Height': 3.69, 'vekt': 28, 'adresse': 'hyd',
'Rollno': '005', 'Navn': 'Sridevi', 'Age': 37, 'Height': 5.59, 'vekt': 54, 'adresse': 'hyd']]
# Lag DataFrame
df = spark_app.CreateTataFrame (studenter)
# Få DataFrame ved å få bare første karakter i hver rad
df.vis (avkortet = 1)
Produksjon:
Konklusjon
Denne artikkelen diskuterte Show () -metoden i Pyspark og dens funksjonalitet. Vi vurderte alle parametrene med verdier for DataFrame for å vise DataFrame i tabellformat.