Hvordan tokeniserer en streng i JavaScript

Hvordan tokeniserer en streng i JavaScript

For å ta opp spørsmålet om strengtokenisering, tilbyr noen språk spesielle klasser. I JavaScript støtter ingen dedikerte klasser eller funksjoner som tokeniserer strengproblemer. Vi har imidlertid en effektiv mekanisme i form av vanlige uttrykk. Bruk derfor regelmessige uttrykk med en JavaScript forhåndsdefinert metode for å analysere strenger til symboler for tokenisering.

Denne artikkelen vil illustrere prosedyren for JavaScript String -tokenisering.

Hvordan tokeniserer en streng i JavaScript?

For å tokenisere en streng i JavaScript, bruk JavaScript innebygd metode som heter “dele()”Metode. JavaScript Split () -metoden deler en streng i en rekke underlag. Den opprinnelige strengen er ikke endret. Det krever to valgfrie parametere som indikerer hvordan metoden skal fungere.

Hvordan tokeniserer en streng ved hjelp av Split () -metode?

Følg syntaksen nedenfor av Split () -metoden for å tokenisere en streng i JavaScript:

streng.split (separator, grense);
    • Her, "separator”Er en alfanumerisk eller ikke-alfanumerisk karakter, for eksempel et rom, eller et regex-mønster, brukes som separatorparameter for å spesifisere hvor du skal dele strengen.
    • grense”Er et heltall som indikerer antall splitter.
    • Metoden påberopes på en variabel som har en strengverdi ved hjelp av DOT -notasjon.
    • Den returnerer en rekke underlag basert på argumentene, og hvis ingen parameter sendes i metoden, vil den returnere hele strengen.

Eksempel 1

I det følgende eksemplet, først, lag en variabel "str”Og lagre en streng i den:

var str = "Linuxhint er det beste nettstedet for læringsferdigheter";


Del nå strengen i symboler ved å bruke "dele()”Metode ved å passere (““) som et argument. Plassen indikerer at strengen vil bli delt når plassen oppstår:

var strtoken = str.split ("");


Til slutt, skriv ut symbolene på konsollen med "konsoll.Logg()”Metode:

konsoll.logg (strtoken);


Utgangen viser en rekke underlag basert på separatoren “rom”(""):


Split () -metoden tar også “regex mønster”Som separator i stedet for en spesifikk karakter som et argument:

var strtoken = str.split (/\ w+/);


Her, i Regex -mønster, skråser de fremre (/) indikerer start og slutt på et mønster, mens (\ W) er metakarakteren som samsvarer med alle alfanumeriske tegn A-Z, A-Z, 0-9 uten hvite rom. Samtidig som (+) indikerer flere kamper.

Produksjon


Hvis du vil få symboler av en bestemt lengde fra en streng, følg den gitte delen.

Eksempel 2

Nå, tokeniserer en streng med lengde tre fra en streng. For å gjøre dette, bruk "filter()”Metode med“dele()”Metode:

var strtoken = str.split ("").filter (funksjon (token)
Return Token.lengde == 3;
);


Skriv ut de resulterende symbolene på konsoll:

konsoll.logg (strtoken);


Utgangen indikerer at bare underlag av lengde 3 returneres fra strengen:

Konklusjon

For å tokenisere en streng i JavaScript, kan du bruke "dele()”Metode. Split () -metoden deler strengen avhengig av inngangen "separator”. Den kan dele en streng i et antall mindre strenger avhengig av argumentene. Hvis metoden ikke mottar noen parametere, vil hele strengen bli skrevet ut. Hvis du vil få tokens av en bestemt lengde fra en streng, bruk "filter()”Metode med Split () -metoden. I denne artikkelen illustreres prosessen med å tokenisere en streng i JavaScript med eksempler.