Pandas kolonner

Pandas kolonner
Et rektangulært rutenett kalt en pandas dataaframe brukes til å lagre data. Dataene som er lagret i en dataaframe er enkle å visualisere og manipulere. DataFrame kan bestå av flere rader og kolonner i den. Hver rad representerer en måling av en enkelt forekomst, mens hver kolonne er en vektor som inneholder dataene til en spesifikk attributt eller variabel. DataFrame -radene kan ha heterogene eller homogene data i en gitt rad, men hver DataFrame -kolonne inneholder homogene data gjennom en gitt kolonne. Aksene til en dataafram i pandaer er merket, i motsetning til de med en todimensjonal matrise. I denne artikkelen diskuterer vi de forskjellige metodene for å legge til, endre og slette Pandas -kolonnene eller verdiene i kolonnene til en DataFrame i Pandas. Dette kan gjøres gjennom forskjellige metoder. La oss se noen av disse metodene i detalj.

Hvordan legge til kolonner eller verdier i en kolonne i pandaer

Kolonner kan legges til en dataaframe ved hjelp av flere metoder. I det følgende eksemplet bruker vi Apply () og Sett inn () -funksjonene for å legge til kolonner til DataFrame.

Eksempel 1: Legg til kolonne i DataFrame ved hjelp av Apply () -funksjon
Du kan legge til flere kolonner i en dataaframe ved å bruke pandaene.Dataramme.tilordne () Metode. Først lager vi et eksempel på dataaframe ved hjelp av PD.DataFrame () fungerer med noen rader og kolonner. "Pandas" -biblioteket importeres først for å opprette Pandas DataFrame.

Vi opprettet “DF” Dataframe ved å passere en ordbok med to nøkler - “C1” og ”C2” - med verdier [“A”, “B”, “C”] og [“D”, “E”, “F ”] Henholdsvis. Ved å passere ordboken i PD.Dataframe, tastene blir etiketten til kolonner og verdiene i listen blir dataene til hver celle i kolonner i DataFrame.

Som det kan sees, opprettet vi en dataaframe med to kolonner nå. Ved hjelp av tildelingen () -funksjonen legger vi til ytterligere kolonner eller kolonner til vår "DF" DataFrame.

Funksjonen gir en ny DataFrame “New_DF” som inneholder både den ekstra (nylig lagt til “C3”) kolonnen og alle de gamle kolonnene (“C1” og “C2”) som et resultat. Husk at hvis noen gjeldende kolonner blir tildelt, vil alle bli overskrevet.

Eksempel 2: Legg til kolonne i DataFrame ved hjelp av insert () -funksjon
“DataFrame.Sett inn () ”-metode kan også brukes til å legge til kolonner i en dataaframe. La oss først lage en dataaframe med noen rader og kolonner.

For å vise vår "DF" DataFrame, brukes print () -funksjonen.

Dataframe har to rader - A og B - med verdier [“1”, “2”, “3”] og [“4”, “5”, “6”]. Nå bruker vi Insert () -metoden for å legge til en annen kolonne i "DF" DataFrame.

Før vi brukte Insert () -funksjonen, opprettet vi en liste med verdier [“7”, “8”, “9”]. Dataframets indeksering av kolonner begynner på null. Da vi brukte innsatsen () -funksjonen med "DF" DataFrame, spesifiserte vi indeksen 1 for å plassere den nye kolonnen "C". Vi passerte også "verdiene" -listen i parametrene til innsatsen () -funksjonen for å lagre verdiene til kolonnen "C".

Du kan legge merke til at den nye kolonnen vår er lagt til på 2nd Kolonneplassering mellom “A” og “B” fordi vi spesifiserte indeksen “1” i parametrene til Insert () -funksjonen.

Hvordan velge kolonner i pandaer

Kolonner kan velges av deres indeksposisjoner, etiketter eller datatyper. Vi vil se hvordan du velger de spesifikke og flere kolonnene i følgende eksempler.

Eksempel 1: Velg en spesifikk kolonne ved hjelp av kolonnenavn/etiketter
Vi oppretter et eksempel på DataFrame for å vise deg hvordan du kan velge en spesifikk kolonne i DataFrame.

Vi opprettet DataFrame med kolonner “Col1” og “COL2”. Den enkleste måten å få en spesifikk DataFrame -kolonne er å skrive kolonnenavnet som en streng med sitater i parentes [].

I den gitte dataaframe har vi to numeriske kolonner - “Col1” og “Col2” - med henholdsvis verdiene (3, 1, 5) og (7, 2, 6).

Ved å bruke en liste med flere navn på DataFrame -kolonnene i "[]" -brakettene, kan du velge flere kolonner.

Som det kan sees, passerte vi en liste som inneholder både kolonnenavn “COL1” og “COL2” i parentesene.

Eksempel 2: Velg en spesifikk kolonne etter datatype
Vi oppretter en dataaframe med kolonner med forskjellige datatyper.

Kolonnen "Navn" lagrer navnene på personer ("Tim", "Alex", "Joe", "Rick"). Mens “alder” -søylen lagrer alderen til personer (12, 11, 11, 13). La oss sjekke datatypene til DataFrame -kolonnene våre ved å bruke "Dtypes" -attributtet.

Datatypen til "Navn" -kolonnen er "Objekt" og "INT64" er datatypen til "Alder" -kolonnen. Nå velger vi kolonnene ved datatypen deres ved hjelp av "loc []" -funksjonen.

Inne i DF.Loc [] -funksjon, vi spesifiserte dtypene == 'int64'. Verdiene returneres der datatypen er 'int64' ved å bruke ".verdier ”attributt med DF.loc [:, (df.dtypes == 'int64') funksjon.

Eksempel 3: Velg flere kolonner etter indeksene deres
Vi oppretter en ny prøve DataFrame for å vise deg hvordan du velger flere eller alle kolonnene i DataFrame ved å bruke “ILOC []” -metoden.

Siden vi opprettet DataFrame, bruker vi nå ILOC [] -metoden for å velge flere kolonner fra DataFrame. Når en enkelt kolonne er valgt, returnerer ILOC [] -metoden et serieobjekt. Når mer enn 1 kolonne er valgt, returneres en Pandas DataFrame.

Vi spesifiserte indeksområdet for kolonner fra 0 til 3. Merk at kolonnen ved indeks 3 ikke er en del av gruppen. Bare kolonnene fra indeks 0 til 2 er valgt.

Som det kan sees, blir kolonnene “W”, “X” og “Y” valgt ved å spesifisere området 0: 3.

Hvordan endre kolonnenavn og kolonneverdier

I det følgende eksemplet vil vi endre kolonnenavnene ved å bruke RENAME () -funksjonen og endringen verdiene ved å bruke erstatningsfunksjonen ().

Eksempel 1: Endre kolonnens etikett ved hjelp av Rename () -funksjonen
Først oppretter vi en dataaFrame med en eller flere kolonner.

Når DataFrame er opprettet, kan vi gi nytt navn til kolonnen ved å bruke Pandas Rename () -funksjonen. Inne. Og vi spesifiserer gjeldende etikett og den nye etiketten (som vi vil legge til).

Som du kan observere, endret vi navnet på kolonnen “A” til “Navn” og navnet på kolonnen “B” til “Emne”.

Eksempel 2: Endre kolonneverdiene ved å bruke erstatningsfunksjonen
Vi oppretter en dataaframe som har antall kolonner som lagrer verdier. Deretter modifiserer vi verdiene til kolonner ved å bruke erstatningsfunksjonen.

Siden vi opprettet vår DataFrame, la oss nå endre verdiene til kolonnen ved å bruke erstatning () -funksjonen. Erstatningsmetoden bytter verdien i DataFrame -kolonnen med den nye spesifiserte verdien.

Erstatning () -funksjonen erstattet verdien av kolonnen “x” fra kolonnen “5” til 9.

Hvordan fjerne Pandas -kolonnene

DataFrame -kolonnene kan slettes ved hjelp av Drop () og Del -metoden i pandaer.

Eksempel: Slette en kolonne fra en Pandas DataFrame
La oss opprette en DataFrame først som vi vil slette de spesifikke kolonnene ved hjelp av Drop () og Del Methods.

Vi har en DataFrame “DF” med 4 kolonner (“A”, “B”, “C”, “D”). DataFrame's Drop () -metoden sletter radene eller kolonnene basert på tilsvarende akser og spesifiserte kolonne (etikett) navn. La oss slette kolonnen “A” ved hjelp av Drop () -funksjonen.

Aksen = 1 betegner at vi fjerner kolonnen, ikke raden.

Drop () -funksjonen fjernet kolonnen “A” med hell “A”. La oss nå bruke "Del" -metoden på kolonnen "D".

Kolonnen “D” fjernes fra DataFrame ved hjelp av “Del” -metoden.

Konklusjon

I denne opplæringen diskuterte vi hva som er kolonner i Pandas DataFrame. Vi brukte de forskjellige funksjonene for å legge til, endre og slette kolonner fra DataFrame. Denne opplæringen er designet for å lære de forskjellige operasjonene du kan utføre på en DataFrames kolonne i Pandas. Vi implementerte flere eksempler for å lære deg hvordan du kan legge til kolonner eller verdier i en kolonne, hvordan du velger kolonner, hvordan du endrer kolonnenavn og kolonneverdier, og hvordan du sletter kolonnen fra en Pandas dataFrame.