Pandas to_records

Pandas to_records
Pandas DataFrame er en heterogen todimensjonal størrelse-mutable tabelldataformat med navngitte akser. For matematiske operasjoner må rad- og kolonnetikettene alltid justeres. Pandas 'grunnleggende datastruktur er sammenlignbar med et dikter ved at den fungerer som en beholder for serieartikler.

Dataframe konverteres til en numpy plate -matrise ved hjelp av pandas dataaframe.til poster () -funksjon. Indeksen er vanligvis gitt som det første feltet for posten. Vi vil diskutere Pandas to_records () -metoden med eksempler i denne artikkelen.

Hva er en dataramme?

Pandas er en populær Python Data Science -pakke av en grunn: den gir kraftige, uttrykksfulle og fleksible datastrukturer som letter datamanipulering og analyse, blant annet. Dataframe er en av disse strukturene.

En dataramme er en todimensjonal datastruktur der dataene er representert i form av rader og kolonner. En Pandas DataFrame består av tre primære komponenter: data, rader og kolonner.

Fordi de gir en fleksibel og enkel måte å lagre og jobbe med data, er dataframes en av de mest brukte datastrukturer i moderne dataanalyse.

For å lage en Pandas DataFrame, lister, serier, Dicts, Numpy NdArrays og en annen DataFrame kan alle brukes til å lage en Pandas DataFrame.

Hva er syntaksen til pandaer.Dataramme.to_records () funksjoner?

To_Records () -metoden er for å konvertere en DataFrame til en relevant Numpy Record -matrise. To_Records () -funksjonen i Pandas har følgende syntaks.

# Dataramme.to_records (indeks = true, column_dtypes = ingen, index_dtypes = ingen)

Alle detaljene om parametrene er i følgende avsnitt.

Indeks

Inkluder indeksen i den resulterende postoppstillingen, som kan lagres i feltet 'indeks' eller få tilgang til via indeksetiketten, hvis en er satt.

Kolonne_dtypes

Hvis datatypen er en streng eller en type, vil den bli brukt til å lagre alle kolonnene.

INDEX_DTYPES

Hvis datatypen er en streng eller kanskje en type, vil den bli brukt til å holde alle indeksnivåer. Hvis det er en ordbok, brukes kartlegging av indeksnivå, så vel som indekser, til å spesifisere datatyper. Bare hvis indeks = sant brukes denne kartleggingen.

La oss diskutere emnet grundig med forskjellige eksempler. Du kan implementere disse eksemplene og se for å forstå det overordnede konseptet på en bedre måte.

Eksempel 1:

Dataframe.To_Records () -funksjonen til Python er å endre den spesifiserte DataFrame til en Numpy Record -matrise. Vurder den gitte koden nedenfor som et eksempel.

Vi konstruerte en dataaframe med verdier for tre forskjellige egenskaper: 'lønn, ansattes navn og alder'; 39000, 44000, 25000 og 55000 er verdiene for eiendommen 'lønn.'Alex, Andrew, Zack og Kim er blant verdiene for attributtet' ansattes navn.'

På samme måte omfatter aldersattributtet verdiene 39, 44, 25 og 55. Indeksen ble konstruert og satt. Dataframe skrives deretter ut.

Importer pandaer
d_frame = pandas.DataFrame ('lønn': [39000, 44000, 25000, 55000],
'Ansatt navn': ['Alex', 'Andrew', 'Zack', 'Kim'],
'Alder': [39, 44, 25, 55])
INDEX_ = PANDAS.date_range ('2020-08-05 07:30', perioder = 4, freq = 'h')
d_frame.indeks = indeks_
Print (D_Frame)

Lønns-, ansattes navn og aldersverdier, så vel som dato og klokkeslett, vises på skjermbildet nedenfor.

I det følgende skjermbildet vises det spesifiserte DataFrame til en relevant Numpy Record Array -representasjon.

Importer pandaer
d_frame = pandas.DataFrame ('lønn': [39000, 44000, 25000, 55000],
'Ansatt navn': ['Alex', 'Andrew', 'Zack', 'Kim'],
'Alder': [39, 44, 25, 55])
INDEX_ = PANDAS.date_range ('2020-08-05 07:30', perioder = 4, freq = 'h')
d_frame.indeks = indeks_
Print (D_Frame)
utfall = d_frame.to_records ()
trykk (utfall)

Det neste vedlagte bildet forklarer at DataFrame.To_Records () -funksjonen brukes til å endre DataFrame til en relevant Numpy Record Array Representation.

Eksempel 2:

Vi ser på hvordan du bruker DataFrame.to_records () funksjon i det andre eksemplet. Koden ligner den som er nevnt ovenfor. Vi har importert Pandas -modulen først denne gangen, og deretter generert DataFrame.

Indeksen ble deretter dannet som vist i koden: index_ = ['første rad', 'andre rad', 'tredje rad', 'fjerde rad' og 'femte rad']. Til slutt har vi angitt indeksen og skrevet ut DataFrame -resultatene. Se på kodens siste linje.

Importer pandaer
dta_frame = pandas.DataFrame ("1": [9, 3, 4, ingen, 6],
"2": [8, 1, 22, 35, ingen],
"3": [19, 9, 17, 6, 9],
"4": [55, 2, ingen, 1, 9])
index_ = ['first_row', 'Second_row', 'Third_row', 'Fourth_row', 'Fifth_row']
DTA_FRAME.indeks = indeks_
Print (DTA_Frame)

Du kan se resultatet her, som inkluderer indeksen og DataFrame.

Ved å bruke DataFrame.Til poster () -funksjonen konverterte vi den gitte DataFrame. Du kan se det i følgende skjermbilde vedlagt.

Importer pandaer
dta_frame = pandas.DataFrame ("1": [9, 3, 4, ingen, 6],
"2": [8, 1, 22, 35, ingen],
"3": [19, 9, 17, 6, 9],
"4": [55, 2, ingen, 1, 9])
index_ = ['first_row', 'Second_row', 'Third_row', 'Fourth_row', 'Fifth_row']
DTA_FRAME.indeks = indeks_
Print (DTA_Frame)
Resultat = DTA_Frame.to_records ()
trykk (utfall)

Etter å ha gjort minimale endringer i referansekoden ovenfor, er dette resultatet. Dataframe.To_Records () -funksjonen endrer en spesifikk DataFrame til en relevant Numpy Record Array Representation.

Eksempel 3:

I vårt siste eksempel skal vi se på hvordan du konverterer en Pandas Dataframe ved å bruke Numpy Technique-Pandas. TO_NUMPY -metoden kan brukes til å transformere denne datastrukturen til en numpy matrise.

Du kan se i koden at vi har importert Pandas og Numpy -modulene, som er avgjørende for at koden skal kjøres. Vi bygde DataFrame etter å ha importert modulene. Det er 5 rader og 3 kolonner med data i DataFrame.

Etter det blir DataFrame forvandlet til en numpy matrise. Den transformerte DataFrame og dens type vises.

Importer pandaer
Importer numpy
data_frame = pandas.Dataramme(
data = numpy.tilfeldig.Randint (
0, 10, (5,3))),
kolonner = ["a", "b", "c"])
cls_res = data_frame.to_numpy ()
Print (CLS_RES)
Print (Type (CLS_RES))

Utgangen er i neste skjermbilde. Dataverdiene i den konstruerte DataFrames 5 rader og 3 kolonner kan sees her. Klassen vises også i utgangens siste linje. Som illustrert ovenfor, gjør Pandas DataFrame to Numpy () -metoden en DataFrame til en numpy matrise.

Konklusjon:

TO_RECORD () -funksjonen i Python er beskrevet i denne artikkelen. Pandas dataaframe er også godt undervist med eksempler. Trinnene for å konvertere en dataaFrame ved å bruke DataFrame to_Records () -metoden er også forklart.