Pandas til streng

Pandas til streng
“DataFrame og Series -tilnærminger som pandaer tilbyr oss kan brukes til hver kolonne i DataFrame og er designet for å fungere med strenger. Ved hjelp av “ApplyMap (Str)” -metoden, kan vi endre DataFrame til strenger, som du kan se i prøven nedenfor. Denne metoden vil enkelt konvertere en datatype til en strengtype. I pandaer brukte vi først og fremst “objekt” som datatype for streng. Vi kan bestemme det totale antallet tegn som er inkludert i kolonneverdiene ved å bruke "lengde ()" -teknikken i strengbehandlingen.”

Syntaksen for å konvertere DataFrame til streng

Syntaks for å få lengden på strengverdier til stede i en kolonne

Eksempel 1: Konverter DataFrame til strenger ved å bruke ApplyMap (STR)

I Python er det mange konstruerte metoder for å jobbe med strenger. Hver av disse metodene returnerer en ny verdi uten å endre den opprinnelige strengen. For strengverdier brukes "objekt" datatype. I Python Pandas blir tekstdatatypen referert til som en "streng" eller et "objekt". En streng kan inneholde en ordfrase eller kan også være et tall. I dette tilfellet vil vi bruke "ApplyMap (STR)" for å gjøre en hel dataaframe til en strengtype. “Apply (Str)” brukes til å konvertere heltalene til strenger, og ApploMap (STR) brukes til å konvertere hele DataFrame til strenger.

La oss nå snakke om å utføre koden vår. For å utføre koden vår, brukte vi “Spyder” -verktøyet. Pandas -biblioteket må importeres først som "PD". Vi ville da bygge vår dataaframe. DataFrame heter “Data”. Vi har tre kolonner i dette DataFrame “Course”, “Fee” og “Credit Hour”. Disse kolonnene har nå visse verdier tilordnet dem. Vi har en liste over kurs “Python”, “OOP”, “Virtual_ Studio” og “Java” i kolonnen “Course”. Verdiene for kolonnen “Fee” har vi “35000”, “30000”, “20000” og “15000” og i den siste kolonnen “Credit_hour”, har vi “3”, “4”, “3” og “ 3 ”. Derfor “PD.DataFrame ”brukes til å lage datarammen. I denne illustrasjonen viser vi også "datatyper" av programmet vårt ved å bruke "print ()" -funksjonen med "DF. datatyper ”. I hovedsak “DF.Datatyper ”brukes til å lage en datatype for en DataFrame.

Vi flytter nå til programmets hovedformål. For å konvertere DataFrame til en streng, bruker vi “DF.ApplyMap (STR) ”. Ved hjelp av “ApplyMap ()” -metoden kan en funksjon brukes to ganger på et hvilket som helst DataFrame -element. I pandaer brukes "STR" for det meste for å hente verdiene til dataframmer eller serier. Det som skjer i dette programmet er at denne funksjonen konverterer datatypene fra "heltall" til "streng" datatyper. Påkaller "PRINT ()" -funksjonen, viser vi nå DataFrame og datatyper etter å ha brukt "ApplyMap (STR)".

To dataframmer med datatypene vises i programmets utgangsbilde. Vi kan se i den andre DataFrame at den konverterte DataFrame til en streng ved å endre datatypen. Heltalldatatypene er nå vist som "objekt" datatyper. For streng bruker vi "objekt" som datatype. Denne "objektets" strengdatatype gjør at det kan være en enkelt verdi, antall eller setning. I den første DataFrame var datatypene for kolonnene “Fee” og “Credit_hour” heltall; Etter å ha blitt konvertert til strenger, vises imidlertid datatypene for disse kolonnene som "objekter". Til slutt viser den “DType: Object”, som indikerer at det er konvertert til en streng.

Eksempel 2: Konvertering av kolonneverdier til strengtype ved å bruke "astype ()" -funksjonen

I dette eksemplet vil en datatype av en enkelt kolonne bli konvertert til en "streng" -type. I det forrige eksemplet ble hele DataFrame konvertert til strenger, mens i dette tilfellet bare en enkelt kolonne konverteres til strenger. Vi konverterte kolonnen til strengtype ved å bruke "astype ()" -funksjonen. "AstType ()" -funksjonen i pandaer brukes først og fremst når vi ønsker å gjøre en datatype til en annen datatype; Imidlertid er det andre alternative metoder i Python for samtidig å endre en eller flere datatyper.

Start nå kodingen. Pandas -biblioteket må først importeres som en "PD.”Følgende trinn innebærer å lage DataFrame med samme navn som“ data ”fra forrige trinn. Denne dataaframe har fire kolonner “kurs”, “gebyrer”, “varighet” og “rabatt”. For hver av disse kolonnene har vi listet opp visse verdier. Verdiene i den første kolonnen er som følger “Java”, “Graphic_Desiging”, “Android_Studio” og “OOP”. I den andre kolonnen, "Charges", har vi "20000", "21000", "20000," og "24000". Vi har verdiene “1_month”, “2_month,” og “3_ month” i den tredje kolonnen, “Varighet”, og i den endelige oppføringen har vi rabattene “20%” og “30%” for kursene. Dataframe genereres deretter ved hjelp av “PD.Dataramme". DataFrame vil nå vises på skjermen ved hjelp av "print ()" -funksjonen, og datatypene vil også bli skrevet ut ved hjelp av “DF.dtypes ”-kommando.

Vi vil nå bruke “Astypes ()” -funksjonen for å konvertere den spesielle kolonnen til en streng. Med “AstType ()” og parameterkolonnenavnet “Ladninger” og datatype “Streng” inne i den, konverterer vi kolonnen “Ladninger” til en streng i dette tilfellet. Nå bruker vi "print ()" -funksjonen for å vise resultatene på skjermen.

Som vi kan se, er datatypen for kolonnen "ladning" i det første tilfellet "int64", noe som betyr at verdiene i kolonnen er heltall, men når kolonnen ble konvertert til en streng, ble en "streng" vist i foran "ladningen" som en datatype. Datatypen for en streng i Python er et "objekt", og ettersom de resterende tre kolonnene er strenger, indikerer dette at nå vil hele DataFrame bli transformert til strenger.

Eksempel 3: Bestemme strengens lengde for en bestemt kolonne i en DataFrame

I dette eksemplet bestemmer vi lengden på hver strengverdi for en bestemt kolonne i DataFrame. Ved hjelp av "lengde ()" -funksjonen kan vi bestemme lengden på strengverdiene. Denne metoden brukes til å bestemme de totale tegnene i en inngangsstreng.

Etter å ha importert Pandas -biblioteket for å starte det tredje eksemplet på artikkelen vår, må vi konstruere en dataaframe med tre kolonner, lik det forrige eksemplet, ved å bruke “PD.Dataramme". “Student_name”, “Roll_number,” og “Total_marks” er tilgjengelige som kolonner. Disse kolonnene er oppført med noen verdier. “Albert”, “Jhon”, “Ava”, “Oliver” og “Amelia” er listet opp i den første kolonnen, mens rulletallene deres er oppført i den andre kolonnen som “1”, “2”, “3”, “ 4 ”og“ 5 ”. Og i den endelige kolonnen gir vi deres endelige merker “498”, “470”, “444”, “390,” og “489”, henholdsvis. Nå som utsagnet “DataFrame” er skrevet ut, vil vi bruke “Print ()” -funksjonen for å vise DataFrame under den.

Etter dette viser vi en uttalelseslinje som sier: "Beregning av lengden på strengen i en kolonne", og vi beregner dette ved å bruke "lengde ()" -funksjonen. Vi kan observere fra vår dataaframe at kolonnen "Student_name" inneholder strengverdier slik at vi kan bestemme lengden på dens verdier. Vi bruker denne kolonnen. Derfor bruker vi “DF [studentnavn]” med “Apply (LEN)”. Dette vil legge til det totale antallet av hver av verdiene i denne kolonnen, som deretter vises som en ny kolonne i DataFrame med navnet "Student_name_length". La oss vende oss til resultatene for tiden.

To dataframes vises her, som du kan se. Den andre DataFrame har en ekstra kolonne, "Student_name_length," og som vi kan se, vil den beregne hele antallet ord og vise den der. For eksempel har navnet “Albert” totalt 6 tegn. Dette indikerer at denne funksjonen fungerer vellykket i programmet vårt.

Konklusjon

Pandas tilbyr forskjellige metoder for å gjøre en dataaframe til en streng. Hele DataFrame kan konverteres til en streng ved bruk av "ApplyMap (STR)", som vil transformere datatypen heltall til streng. Å beregne tegnene til strengverdier i en kolonne ved hjelp av “lengde ()” -metoden er også veldig nyttig. Hvis vi ønsker å beregne flere enkeltverdier, vil denne Pandas -teknikken forenkle oss. Det vil være enklere for oss å jobbe hvis vi bruker små, enkle strategier. Vi forventer at hvis vi bruker disse strategiene effektivt, vil arbeidet vårt være altfor enkelt.