STR_EXTRACT og STR_DETECT FUNKSJONER I R

STR_EXTRACT og STR_DETECT FUNKSJONER I R
I denne artikkelen vil vi diskutere om Str_extract () & Str_Detect () -funksjonene i R.

La oss se dem en etter en.

Str_extract ()

STR_Extract () -funksjonen brukes til å trekke ut strengene/tallene fra den gitte strengen. Dette er tilgjengelig i Stringr -pakken. Derfor må vi laste inn strengbiblioteket.

Syntaks:

str_extract (“Object”, ”mønster”)

Parametere:

Det tar to parametere:

  1. Objekt refererer til strengen eller vektoren eller en liste
  2. Mønster brukes til å trekke ut typen tegn fra objektet

Mønstrene er:

  1. Streng - det tar en normal streng. Hvis den er til stede i objektet, returneres strengen. Ellers blir Na returnert.
  2. \\ d+ - det brukes til å sjekke den numeriske verdien som er til stede i objektet. Hvis det er til stede, vil den returnere det tallet. Ellers blir Na returnert. Hvis det er flere numeriske verdier, returneres den første numeriske verdien.
  3. [A -Z]+ - Den brukes til å sjekke strengverdien som er til stede i objektet. Hvis den er til stede, vil den returnere den strengen uten plass. Ellers blir Na returnert. Hvis det er flere strengverdier, returneres den første strengverdien uten plass.

Eksempel 1:

I dette eksemplet vil vi vurdere en streng og sjekke for et mønster - “Linux”.

Bibliotek (Stringr)
#sjekk om strengen linux er til stede i det faktiske eller ikke
Print (STR_Extract ("Velkommen til Linux Hint 100% koding", "Linux"))

Resultat:

Vi kan finne Linux -mønsteret. Derfor returnerer det det.

Eksempel 2:

I dette eksemplet vil vi vurdere en streng og sjekke for det numeriske mønsteret - “\\ d+”.

Bibliotek (Stringr)
#sjekk det numeriske mønsteret
Print (STR_Extract ("Velkommen til Linux hint 100% koding", "\\ d+"))

Resultat:

Vi kan finne den numeriske verdien 100. Derfor returnerer det det.

Eksempel 3:

I dette eksemplet vil vi vurdere en streng og sjekke for et strengmønster - “[A -Z]+”.

Bibliotek (Stringr)
#sjekk strengmønsteret
Print (STR_Extract ("Velkommen til Linux Hint 100% koding", "[A-Z]+"))

Resultat:

Vi kan finne den første nonspace -strengverdien, "Velkommen". Derfor returnerer det det.

I en vektor

Nå bruker vi Str_extract () -funksjonen i en vektor på tre strenger.

Eksempel:

Her bruker vi alle mønstrene på en vektor som heter Vector_Fruits.

Bibliotek (Stringr)
#skap en vektor med 3 strenger
Vector_Fruits = C ("Papayya er tilgjengelig i 100 Sale", "Water-Lemons", "Det er 11 frukt i en kurv")
#Display den faktiske vektoren
Print (Vector_Fruits)
print (lim inn ("strenger med er:", str_extract (vector_fruits, "er")))
print (lim inn ("strenger med første alfabeter:", str_extract (vector_fruits, "[a-z]+")))
print (lim inn ("strenger med tall:", str_extract (vector_fruits, "\\ d+")))

Resultat:

Vi kan se at hvert strengelement i en vektor brukes med str_extract () og returnerer "er" i den første og siste strengen siden "er" er til stede. Siden "er" ikke er i den andre strengen, går den tilbake til NA.

Neste, mønsteret -[A-Z]+ Returnerer den første strengen fra de tre strengene i en vektor.

Til slutt returnerer det siste mønsteret - de numeriske verdiene i den første og siste strengen, siden 100 og 11 er til stede.

I en liste

Nå bruker vi Str_Extract () -funksjonen i en liste over tre strenger.

Eksempel:

Her bruker vi alle mønstrene på en liste som heter List_Fruits.

Bibliotek (Stringr)
#Lag en liste med 3 strenger
LIST_FRITS = LIST ("Papayya er tilgjengelig i 100 Sale", "Water-Lemons", "Det er 11 frukt i en kurv")
#display selve listen
print (list_fruits)
print (lim inn ("strenger med er:", str_extract (list_fruits, "er")))
print (lim inn ("strenger med første alfabeter:", str_extract (list_fruits, "[a-z]+")))
print (lim inn ("strenger med tall:", str_extract (list_fruits, "\\ d+")))

Resultat:

Vi kan se at hvert strengelement i en liste brukes med str_extract () og returnerer "er" i den første og siste strengen siden "er" er til stede. Siden "er" ikke er til stede i den andre strengen, går den tilbake til NA.

Neste, mønsteret -[A-Z]+ Returnerer den første strengen fra de tre strengene i en liste.

Til slutt returnerer det siste mønsteret - de numeriske verdiene i den første og siste strengen siden 100 og 11 er til stede.

Str_Detect ()

Str_detect () er tilgjengelig i Stringr -biblioteket som brukes til å sjekke om strengen eller mønsteret er til stede i et objekt. Hvis det eksisterer, går det tilbake til True. Ellers går det tilbake til falsk.

Syntaks:

STR_DETECT (Object, ”String”)

Parametere:

  1. Objekt refererer til streng/vektor/liste
  2. streng representerer mønsteret for å sjekke om det eksisterer i et objekt eller ikke

Eksempel 1:

I dette eksemplet vil vi vurdere en streng og sjekke for et mønster - “Linux”.

Bibliotek (Stringr)
#sjekk om strengen linux er til stede i det faktiske eller ikke
Print (STR_DETECT ("Velkommen til Linux Hint 100% koding", "Linux"))

Resultat:

Vi kan finne Linux. Derfor returnerte det sant.

Eksempel 2:

I dette eksemplet vil vi vurdere en streng og sjekke for et numerisk mønster - “\\ d+”.

Bibliotek (Stringr)
#sjekk det numeriske mønsteret
print (str_dect ("Velkommen til Linux hint 100% koding", "\\ d+"))

Resultat:

Vi kan finne den numeriske verdien 100. Derfor returnerer det sant.

Eksempel 3:

I dette eksemplet vil vi vurdere en streng og sjekke for strengmønsteret - "[A -Z]+".

Bibliotek (Stringr)
#sjekk strengmønsteret
Print (Str_Detect ("Velkommen til Linux Hint 100% koding", "[A-Z]+"))

Resultat:

Vi kan finne den første nonspace -strengverdien “Velkommen”. Derfor returnerer det sant.

I en vektor

Nå bruker vi Str_Detect () -funksjonen i en vektor på tre strenger.

Eksempel:

Her vil vi bruke alle mønstrene på en vektor som heter Vector_Fruits.

Bibliotek (Stringr)
#skap en vektor med 3 strenger
Vector_Fruits = C ("Papayya er tilgjengelig i 100 Sale", "Water-Lemons", "Det er 11 frukt i en kurv")
#Display den faktiske vektoren
Print (Vector_Fruits)
print (lim inn ("strenger med er:", str_detect (vector_fruits, "er")))
print (lim inn ("strenger med første alfabeter:", str_detect (vector_fruits, "[a-z]+")))
print (lim inn ("strenger med tall:", str_detect (vector_fruits, "\\ d+")))

Resultat:

Vi kan se at hvert strengelement i en vektor brukes med str_detect () og returnerer sann i den første og siste strengen siden "er" er til stede. Siden "er" ikke er til stede i den andre strengen, returnerer den falsk.

Neste, mønsteret -[A-Z]+ går tilbake til True fra tre strenger i en vektor.

Til slutt er det siste mønsteret - returnerer de numeriske verdiene i sannhet siden 100 og 11 er til stede i den første og siste strengen og returnerer falsk i den andre strengen.

I en liste

Nå vil vi bruke Str_Detect () -funksjonen i en liste over tre strenger.

Eksempel:

Her bruker vi alle mønstrene på en liste som heter List_Fruits.

Bibliotek (Stringr)
#Lag en liste med 3 strenger
LIST_FRITS = C ("Papayya er tilgjengelig i 100 Sale", "Water-Lemons", "Det er 11 frukt i en kurv")
#display selve listen
print (list_fruits)
print (lim inn ("strenger med er:", str_detect (list_fruits, "er")))
print (lim inn ("strenger med første alfabeter:", str_detect (list_fruits, "[a-z]+")))
print (lim inn ("strenger med tall:", str_detect (list_fridits, "\\ d+")))

Resultat:

Vi kan se at hvert strengelement i en liste brukes med str_detect () og returnerer sann i den første og siste strengen siden "er" er til stede. Siden "er" ikke er til stede i den andre strengen, returnerer den falsk.

Neste, mønsteret -[A-Z]+ går tilbake til True fra tre strenger i en liste.

Til slutt er det siste mønsteret - returnerer de numeriske verdiene i sannhet siden 100 og 11 er til stede i den første og siste strengen og returnerer falsk i den andre strengen.

Konklusjon

I denne artikkelen så vi Str_Extract () og Str_Detect () -funksjonene i R og hvordan du bruker disse funksjonene i vektoren og listen. Str_detect () brukes til å sjekke om mønsteret er til stede i det gitte objektet. Hvis ja, vil det komme tilbake til True. Ellers går det tilbake til falsk. Str_extract () brukes til å sjekke om mønsteret er til stede i det gitte objektet. Hvis ja, returnerer det mønsteret. Ellers blir Na returnert.