Hvordan du bruker tildeling () -funksjonen i pandaer
For å bruke tildeling () -funksjonen i pandaer, må vi først forstå syntaks.
Syntaks: Dataramme.tilordne (** nøkkelordargumenter, selv)
Hvor,
Nøkkelordargumenter: Kolonnenavn og setningsfraser fungerer som søkeordargumenter. Hvis egenskapene kan kalles, behandler DataFrame dem og tildeler dem til de nye DataFrame -kolonnene. Selv om pandaer ikke sjekker det, kan ikke de kallbare endre inngangen Dataframe. Hvis egenskapene, for eksempel serie eller klynger, ikke er kallbare. På en måte tildeles de. En ordbok med strenger eller lister kan brukes som søkeordargumenter.
selv-: Den returnerer en helt ny dataramme med kolonner som er lagt til eksisterende som en utgang.
Vi kan nå forstå hvordan Pandas tilordnede () -funksjonen fungerer. Under alle omstendigheter kan vi ikke redusere størrelsen på dataframet vårt fordi hele antallet 64 byte tar opp den samme mengden plass som 64 byte strenger eller flytende punktverdier, omtrent som hvordan 100 kilo murstein veier det samme som 100 pund av blokker. Vi forenklet prosessen med senere å motvirke disse segmentene. Vi har utrolig få egenskaper her, så hvis vi lager en mulighet som tar en undergruppe av et kolonneundersett og prøver å bestemme den til den minste formen den kan ta, skal den kunne operere. Følgende eksempler vil hjelpe deg bedre å forstå det.
Eksempel 1: Bruke tildeling () -funksjonen i pandaer
Temperaturen blir beregnet i dette eksemplet ved å bruke tilordningsmetoden. Mens den numpy modulen stort sett fungerer med numeriske data, fungerer Pandas -modulen først og fremst med tabelldata. Etter å ha importert modulene, vil vi opprette en dataaFrame som vi kan bruke tilordnede () -funksjonen.
Lambda -funksjonen har samme potensial til å oppføre seg som en standardfunksjon som er spesifisert ved hjelp av DEF -nøkkelordet til Python. Vi kan se datarammen vår ved å bruke PRINT () -funksjonen og passere navnet på datarammen vår etter å ha brukt tilordningen () -funksjonen, i.e., “DF_ASSIGN” som et argument i print () -funksjonen. Du kan også illustrere det ved å bare skrive dataramens navn.
Numpy importeres etter pandaer i manuset som tidligere er nevnt. Temperaturene til de to landene blir deretter registrert når vi genererer DataFrame og DataFrames indeks for dem. Til slutt bruker vi tilordningen () -metoden for å beregne temperaturene ved å bruke programmets leverte ligning. Når vi tildeler utskriftsfunksjonen, beregner DF -variabelen, som representerer DataFrame, den matematiske ligningen og skriver ut utgangen som tidligere er sett. Tilordningen () -funksjonen kalibrerer ligningen, som vurderer variabler. For å konvertere fra grader Fahrenheit til grader Celsius, blir 32 lagt til verdiene til denne variabelen “A” sammen med Lambda. Deretter fullfører kommandoen denne ligningen og sender ut resultatene.
Eksempel 2: Ny variabel oppretting og en konstant tildeling
Før du kjører noen av disse eksemplene, må du importere pandaer og lage den nødvendige DataFrame.
Vi kalte vår dataaframe “S-Data”. Denne dataaframe inkluderer variabler for salg og utgifter og simulerte data for salg for hver enkelt. Vi kan legge til noen tilleggsvariabler herfra ved å bruke tilordningen () -metoden.
Hvis alle personene i dette datasettet er ansatt i samme virksomhet eller selskap, la oss si at du jobber med den informasjonen. I motsetning til “S_Data”, som bare inneholder data fra ansatte som jobber for det samme selskapet, kan andre Dataframes ha poster for selgere som jobber for forskjellige virksomheter. Hva om vi ønsket å lage en variabel for individene i denne DataFrame som inneholdt firmanavnet deres? Med tildelingen () -funksjonen kan vi oppnå følgende:
Vi la til en ny variabel som heter "virksomhet" i dette tilfellet. Verdien til forretningsvariabelen er den samme for hver datadata. Det står "maskinvare" som verdien. Teknisk sett er verdien den samme for hver rad. Det er en strengverdi, for å være mer presis. Etter å ha uttalt at vi, mens vi lager variabler med konstante verdier, med kontinuerlige numeriske data eller verdi, kan tilordne en ny variabel i tillegg til å legge til tekstverdier som i dette eksemplet.
Eksempel 3: Legg til en beregnet verdivariabel med tildeling () -metoden
Vi vil bruke den samme datarammen “S_Data” i dette eksemplet. For å være mer presis, vil vi legge til "fortjeneste" som en ny variabel, like salg minus kostnader (finans- og regnskapseksperter vil vite at dette ikke er en nøyaktig metode for å beregne overskudd; vi vil imidlertid bruke denne skjeve beregningen som et eksempel.).
Ved å bruke denne koden får vi følgende utdata:
I dette tilfellet la vi til en ny beregnet kolonne som heter “Profit”. Fortjeneste, som det fremgår av, er bare salgskravutgifter. Husk imidlertid at vi må bruke navnene “s_data.Salg ”og“ S_Data.utgifter ”for å referere til salgs- og utgiftsvariablene inne i tilordningen (). Vi kan også referere til dem som "s_data ['utgifter']" og "s_data ['salg']". Du kan velge hvilken som helst, men for dette eksemplet vil det tidligere viste bli brukt.
Eksempel 4: Legge til flere kolonner ved å bruke tilordning () -funksjonen
Vi legger til to variabler samtidig i dette eksemplet. "Virksomheten" og "fortjeneste" -variablene vil bli lagt til. Vi vil bruke den samme datarammen fra tidligere eksempler 2 og 3, i.e., s_data.
Variablene “Profit” og “Business” blir lagt til samtidig i dette eksemplet. Du vil se at vi startet en ny kodelinje for den andre variabelen når det gjelder syntaks. Du kan beholde all koden din på en enkelt linje hvis du vil, selv om jeg ikke foreslår det spesielt. Direkte overskriving av originale data er et annet alternativ.
Bare utfør tildelingsmetoden og send resultatene til "S_Data" DataFrame som er spesifisert i det originale DataFrame -navnet. I visse situasjoner er det helt passende å gjøre dette. Du vil av og til vil erstatte dataene dine helt.
Konklusjon
Vi vil oppsummere ved å si at tildelingen () -funksjonen i pandaer gjør oss i stand til å utføre forskjellige oppgaver når vi oppretter en ordreferanse for seksjonsnavnene. I denne opplæringen implementerte vi forskjellige eksempler for å lære deg hvordan du bruker tildelingen () -funksjonen, hvordan du legger til en ny kolonne med konstant verdi eller data, hvordan du legger til en kolonne med beregnede verdier, og hvordan du legger til flere kolonner i en dataFrame Bruke tildeling () -funksjonen.