Pandas Dataframe fra Dict

Pandas Dataframe fra Dict
En Pandas dataaframe kan genereres ved hjelp av et Python Dict (Dictionary) som er et nøkkelverdipar. I sanntid produserer vi vanligvis en Pandas dataaframe ved å importere en CSV-fil eller en annen ressurs, men det er mulig å generere den ved hjelp av et dikter (ordbok) objekt også.

Python Pandas blir ofte distribuert i både data vitenskap/databehandling og maskinlæringsoppgaver. Det er utviklet på grunnlaget av Numpy, et annet fremtredende Python -bibliotek som støtter de vitenskapelige beregningene. I Python er Pandas Dataframes ekstremt nyttige for å jobbe med 2D (todimensjonale) data. En Pandas DataFrame kan konstrueres i en rekke metoder, en av disse er ved å trekke ut dataene fra en gitt ordbok.

Eksempel 1: Bruke standardkonstruktøren PD.DataFrame () for å generere en dataaframe fra en ordbok

Denne tilnærmingen starter med å generere en Python -ordbok med lister, som vi deretter gir til PD.DataFrame () -metode. Den siste, men ikke minst, PD.DataFrame () Metode gir ut et Pandas DataFrame -objekt som inneholder innholdet fra listens ordbok.

La oss nå utføre det ved å bruke Python -skriptet.

I Python -filen importerer vi først det nødvendige biblioteket som er pandaer i denne illustrasjonen, da vi vil bruke Pandas -funksjonene her.

Vi oppretter deretter en ordbok "Data" og initialiserer den med tre lister med henholdsvis titlene 'Navn ",' Age 'og' Institute '. Vi tildeler hver liste med fire verdier. Vi påkaller metoden Print () for å vise ordboken på terminalen.

Utgangen vi får ved å kjøre den forrige koden er vedlagt her:


Vi konverterer nå denne Pandas Dictionary til en Pandas Dataframe.

For å generere DataFrame fra en ordbok, bruker vi den enkleste metoden. Her ansetter vi Pandas standardkonstruktør for å generere en DataFrame. Et DataFrame -objekt med navnet "Output" opprettes og tildeles utgangen til å påkalle PD.DataFrame () -funksjon. Dikten "data" som vi tidligere har laget, blir gitt som en parameter til PD.DataFrame () -funksjon. PRINT () uttalelsen med objektet “output” som et argument utfører for å vise DataFrame opprettet fra den spesifiserte ordboken.

Dette gir oss følgende resulterende Pandas DataFrame:

Eksempel 2: Bruke de brukerdefinerte indeksene for å generere en datafram fra en ordbok

Ved hjelp av en ordbok med de brukerdefinerte indeksene, kunne vi konstruere et Pandas dataaframe-objekt i Python. Denne teknikken begynner ved å generere en Python -ordbok, som deretter sendes samtidig med indekslisten på PD.DataFrame () -metode. PD.DataFrame () Metode returnerer til slutt et Pandas DataFrame -objekt som inneholder ordbokens innhold sammen med indeksene fra den medfølgende indekslisten.

Vi vil her utforske hvordan Python -koden brukes til å utføre den.

For å lage et DataFrame fra et dikter som bruker brukerdefinerte indekser, må vi først ha en ordboksliste. Siden vi genererte en ordbok i forrige eksempel, vil vi også bruke den samme ordboken i dette tilfellet.

Nå, for å konstruere DataFrame fra DICT, bruker vi den samme Pandas DataFrame -konstruktøren, men med en mer innovasjon til det, slik vi vil at DataFrame skal vises med indekser som vi tildeler den i stedet for dets forhåndsdefinerte indekser. Vi bruker "indeks" -parameteren inne i parentesen med navnet på dikten, atskilt med et komma. Vi tildeler verdiene til "indeks" -parameteren ved å bruke "=" -oppgaveoperatøren og legge verdiene i parentesene. Til slutt bruker vi Print () -metoden for å utvise resultatet av programmet.

Følgende bilde viser utdata DataFrame med brukerdefinerte indekser “R, X, Y, Z” i stedet for 0-indekseringsmetoden.

Eksempel 3: Generer en dataafram fra en ordbok med de nødvendige kolonnene

For tredje forekomst blir visse søyler ignorert når vi genererer en datafram fra en ordbok. Kolonnens parameter gjør å utføre denne oppgaven enkel. Som parameter godtar dette argumentet en liste, elementene som er de spesifiserte kolonnene. Den returnerer bare dataaframe med de valgte kolonnene.

La oss bare sjekke ut måten å skrive et Python -skript for å generere en DataFrame ved hjelp av de valgte ordbokskolonne.

I dette eksemplet la vi til en ny post til det tidligere opprettet DICT “Data” som “Roll” og tildelte den med samme lengde på verdiene som vi brukte til de tre andre postene. Nå, samlet, har vi et dikter med 4 poster. Når vi kjører metoden Print (), får vi en ordbok med fire poster denne gangen.

Dette er utgangen:

Nå utforsker vi hvordan vi kan konstruere en dataaframe ut av en ordbok med noen spesifiserte kolonner.

Pandas DataFrame -funksjonen gir oss en parameter "kolonne" for å spesifisere navnene på kolonnene du spesielt ønsker i DataFrame. Mellom seler på PD.DataFrame () -metode, vi passerte "kolonnene" -argumentet og tildelte navnene på kolonnene i parentesene. Her valgte vi to kolonner, “Navn” og “Institute”. Utskrift () -uttalelsen presenteres på terminalen som DataFrame som bare inneholder de tidligere nevnte kolonnene.

Vi fikk DataFrame med to utvalgte kolonner.

Eksempel 4: Generer en dataaframe fra en ordbok med en endret orientering ved å bruke FREE_DICT () -funksjonen

I likhet med forrige måte genererer vi først en Python -ordbok med lister og sender den deretter til DataFrame.fra_dict () -metoden. Etter hvert returneres et Pandas DataFrame -objekt som inneholder informasjonen om ordboken til lister av DataFrame.fra_dict () -metoden. Det er forskjellige alternativer når du spesifikt bruker funksjonen fra DICT () for å konstruere en DataFrame fra en ordbok. Dikts nøkler vil som standard være kolonnene som den vanlige oppførselen. Ordbokstastene vises som rader når orienteringen er “Index.”

Her ser vi først standardinnstillingene og endrer deretter orienteringen til "indeks".

Vi bruker DICT “Data”. For å generere en DataFrame fra ordboken, bruker vi fra_dict () -metoden i stedet. Ordbokens nøkler brukes som kolonnenavn som standard når du bruker FRAD_DICT () -metoden. Oppføringene fra ordboken brukes som dataframdyrverdier. Så vi kjører denne metoden med standardinnstillingen og gir den navnet på DICT “Data”. Vi ser utdata gjennom print () -funksjonen.

Følgende er utfallet generert fra forrige Python -skript:

Nå, for å endre orienteringen til DataFrame som genereres fra den oppgitte ordboklisten, endrer vi standardinnstillingene for FRE_DICT () -funksjonen.

Når du leverer Orient = "Index" -argumentet, konstrueres en dataaframe ved å bruke verdiene fra DICT -verdiene hvis du foretrekker å bruke DICT -nøklene som rader. Vi la dermed til "Orient" -parameteren for å endre orienteringen og tilordne "indeksen" -verdien. Dette betyr at indeksens verdierorientering blir endret fra kolonner til rader.

Dette er utgangen fra dette programmet:

Konklusjon

Denne guiden forklarer generasjonen av en DataFrame fra en ordboksliste. Vi utdypet alle de forskjellige måtene og aspektene ved å bruke denne tilnærmingen. Med de praktiske eksemplene fikk vi deg til å forstå hvordan du bruker Pandas DataFrame -funksjonen, så vel som Pandas fra_DICT -funksjonen. Den gitte trinnvise implementeringen vil hjelpe deg å få den beste læringsopplevelsen innen Python.