Strenger i r

Strenger i r
“Strenger er ikke de mest glamorøse eller kjente R-komponentene, men de tjener en viktig rolle i en rekke datafiltrerings- og forberedelsesaktiviteter. R anser enhver verdi vedlagt av et par enkelt- eller doble sitater som en streng. Selv når du genererer strenger med enkelt sitater, lagrer R dem alle innen doble sitater internt. I denne artikkelen kan du lære om Rs strenger, inkludert deres regel- og grunnleggende strengattributter, samt hvordan du kan trekke ut og erstatte en tegnstreng og formatere en streng.”

Hva er strenger i R -programmeringsspråket i Ubuntu 20.04?

Begrepet "streng" refererer til en gruppe tegn. En endimensjonal matrise brukes til å organisere karakterene. I R er en streng definert som en samling av bokstaver omsluttet av et sett med identiske enkelt- eller dobbeltkvots. Strenger er tekstlige representasjoner som kan produsere heltall, mellomrom og spesialtegn. Karakteren ”står for en tom streng. I r holdes alltid dobbeltkjørte verdier for strenger. Innenfor en dobbelt sitert streng er enkelt sitater tillatt. Det kan ikke være noen enkelt sitater i en enkelt sittende streng. Doble sitater kan på sin side ikke pakkes inn med dobbeltkjørt.

Strengdannelsesregler i R i Ubuntu 20.04

Når du bruker strengen på R -språket, er det noen få trinn som bør følges.

  • Både doble og enkelt sitater skal brukes i starten og slutten av en streng. Det er umulig å kombinere dem.
  • I en streng som starter og slutter med et enkelt sitat, kan doble sitater introduseres.
  • Et enkelt sitat kan settes mellom to doble sitater i en streng.
  • Flere sitater kan ikke inkluderes i en streng som begynner og avslutter med dobbeltkvoter.
  • Det kan ikke være et enkelt sitat i en streng som begynner med ett og avsluttes med en annen.

Hvordan evaluere standardfeilen i R i Ubuntu 20.04?

De grunnleggende ideene for å konstruere strengvektorer og karakterstrenger i R er dekket i dette kapittelet. Du vil også oppdage hvordan R håndterer objekter med karakterer i dem.

Eksempel 1: Program for å lage strengen i R i Ubuntu 20.04

Tildeling av karakterverdier til en variabel kan brukes til å bygge strenger. For å konstruere en større streng, kan slike strenger kobles sammen ved å bruke mange formål og metoder.

Over har vi vist forskjellige måter å erklære strengen i R -skriptet. For det første har vi strengrepresentasjonen i dobbeltkjørt. Deretter, med R CAT () -metoden, skrives strengen på skjermen. Etter det opprettet vi strengen i et enkelt sitat i en ny variabel, Str2. På denne måten kan vi også lage strengen. Deretter, i Str3, har vi brukt den enkeltkjørte strengen i strengen med den dobbeltkjørte. Inne i variablene Str4 og Str5 har vi en annen måte å starte opprettelse i R. Når disse variablene blir utført, viser STR4 strengen, men Str5 -utførelsen stoppet da den genererte unntaket. Dette viser at denne representasjonen av streng ikke er akseptabel i r.

Eksempel 2: Program for å vurdere lengden på strengen i R i Ubuntu 20.04

Mange funksjoner for å jobbe med strenger er inkludert i base R, men vi vil ignorere dem siden de kan være upålitelige, noe som gjør dem vanskelige å huske. I stedet bruker vi Stringrs funksjonaliteter. Stringr -pakken inneholder en samling metoder som gjør interaksjon med strenger så enkelt som mulig. Strengens lengde er antall bokstaver den består av. For å bestemme strenglengden i R, bruk STR -lengden () -funksjonen fra strengens modul eller den iboende funksjonen NCHAR ().

Her har vi importert R Stringr -modulen og deretter kalt STR_Length -funksjonen som strengen er bestått. Strenglengdeverdien genereres når funksjonskommandoen utføres.

For å få lengden på strengen, har vi brukt en annen metode som er nChar (), der strengen er passert. Når denne kommandoen påberopes, vises lengden på den spesifiserte strengen.

Eksempel nr. 3: Program for å få substr fra strengen i R i Ubuntu 20.04

Tydelige tegn kan tas ut fra en streng ved hjelp av strengens indekseringsmekanismer. For å oppnå både det spesifikke tegn og strengens underlag, har R to innebygde funksjoner. I R trekker substr eller substring -metoden ekstrakter underlag fra en streng som starter ved den første indeksen og slutter ved sluttindeksen.

Substring fra den definerte strengen får tilgang til her. Strengen sendes inne i substr -metoden. Hvis startindeksen og sluttindeksen er lik, blir strengens tilsvarende karakter hentet. Den første karakteren, "R," er skrevet ut i dette tilfellet.

Eksempel 4: Program for String Case Convertering i R i Ubuntu 20.04

Rs innebygde funksjoner toupper (), som endrer alle tegn til kapitalbrevet, tolower (), som endrer alle tegn til små bokstaver, og casefold (…, øvre = true/usann), som transformerer seg basert på beløpet som er tilordnet til tilordnet til tilordnet til å tildelt det høyere argumentet, kan transformere strengtegn til enten øvre eller små bokstaver. Alle disse funksjonene kan også ta flere strenger som parametere.

Inne i variabelen STR har vi passert en streng som inneholder store bokstaver og små bokstaver. Deretter har vi en utskriftskommando som vi må tilordne Toupper -funksjonen og legge inn STR -variabelen inni den. Hele strengen skrives ut i store bokstaver. På samme måte har vi utført tolower -funksjonen på den definerte strengen, og den konverterer alle strengene til små bokstaver.

Konklusjon

Denne artikkelenes mål var å fjerne din forståelse av strengene i R -skriptspråket. R har mange funksjoner for å håndtere forskjellige typer data. Det er ingen avvik til denne regelen, inkludert strenger og karaktervektorer. Vi har lært om noen få R -funksjoner som kan brukes til å manipulere strenger eller gi mer informasjon om dem i dette R -innlegget. Du kan lage strenger med visse mønstre eller tilfeldig ved å bruke disse funksjonene. Du har hele autoritet over hvordan de blir redigert og justert.