Konverter streng til Unicode Python

Konverter streng til Unicode Python
“Python” er et dataspråk. Det er et språk på høyt nivå som brukes mye. Hvis vi snakker om Python 2, kalles strengene der "byte strenger". Unicode () -funksjonen brukes til konverteringen. Mens det i Python 3 er innebygde funksjoner som kan brukes til konvertering av en streng til Unicode. Vi vil videre diskutere konverteringseksemplifiseringen for en bedre forståelse. Eksempelimplementeringen vi skal utføre i artikkelen for konverteringsytelsen til strengen til Unicode kan brukes i noen av Python -versjonene.

Viktig notat:

En liten feil oppstår til tider mens konverteringsytelsen. En liten endring eller til og med bare en enkelt karakter eller nummer gjør en stor forskjell fordi det er konverteringsytelsen. Det er noen viktige konsepter og forklaringer på grunnleggende arbeid som man bør vite før konverteringsytelsen.

Hva er en streng i Python?

Strengen er en sekvens av tegn som også kan kalles en matrise. I Python fungerer det det samme som andre programmeringsspråk som en int, røye, bool, float, etc. Strengen i Python er en rekke byte som representerer Unicode -tegnene. Strengverdiene er omgitt av sitatene. De kan være enkelt sitater ('), doble sitater (“) og trippel sitater ("). Bruk også de samme sitatene mens du åpner og lukker strengen. Hvis vi bruker et enkelt sitat på åpningen og lukker det med to sitater, vil feilen oppstå. Når en streng opprettes, konverterer datasystemet det til 1 og 0 -kombinasjonen. Denne konverteringen kalles koding. Vi vil gjøre det i eksemplene nedenfor.

Hva er Unicode i Python?

Unicode gjør arbeidet med å korrelere hver av karakterene eller symbolene gitt med et bestemt antall av sine egne. Hvert unike nummer kalles et kodepunkt. Kodepunktet er verdien av et heltall som varierer fra “0 til 0 * 10FFFF” i kodingen av Hexa Decimal. En-karakterstrengen kan opprettes ved hjelp av Chr (), som er en innebygd funksjon i Python. Det tar argumentet som et enkelt heltall og returnerer unicode av karakteren gitt. Det er en annen innebygd funksjon i Python “Ord ()” som fungerer som en CHR () -funksjon.

Metodene for å konvertere streng til Unicode i Python:

Følgende er måtene vi vil implementere eksempler for konvertering av streng til Unicode i Python:

  • Konvertering av streng til Unicode ved hjelp av kodemetoden i Python.
  • Konvertering av streng til Unicode ved hjelp av en kode -metodefeil som oppstår i Python.
  • Konvertering av streng til Unicode ved bruk av (bli med+format+ord) i python.
  • Konvertering av streng til unicode ved bruk av (ord+lambda+re.sub) i python.

Eksempel nr. 01: Konvertering av streng til Unicode ved hjelp av kodemetode i Python:

I dette tilfellet vil vi lære å konvertere den vanlige strengverdien til Unicode ved å bruke kodingsmetoden. "Kodingen" som brukes som "kode ()" er en metode som er en kodet verdi av en streng. Kodingen kalles også karakterkoding, da kodepunktene blir konvertert til en sekvens av byte. Kodingstypene kan være som "ASCII-tegn", "UTF = 8", "UTF-16", etc.

Som standard bruker Python UTF-8-koding. “UTF” står for “Unicode Transformation Format” og “8” med det er for koding av verdiene, som er 8 biter. Vi kan bruke 1 til 4 byte lange tegn i UTF-8-kodingsytelsen. Strengverdien gitt her er "Nö" for konvertering til Unicode. Deretter skrives syntaksen etter å ha tilordnet verdien for konvertering. Enkod () -metoden tar ikke noen parameter, som standard som vi kan se på linje 2 i koden.

Deretter brukes utskriftsfunksjonen for utskriftsresultatene i konverteringens utgang. Verdien kan også returnere en feil hvis kodingen ikke kan behandles riktig i henhold til kodingsmetoden.

Utgangen viser vellykket den konverterte strengen til Unicode ved hjelp av enkod () -metoden.

Eksempel nr. 02: Konvertering av streng til Unicode ved hjelp av en kode -metodefeil som oppstår i Python:

I dette tilfellet vil vi konvertere strengen til Unicode ved hjelp av ENCODE -feilmetoden. Det er mange parametere for Unicode -feilmetoden. Her vil vi følge backslash -erstatningen. Her er strengen vi har valgt for konverteringen “Örange”. Syntakskoden for koding med parameterfeilen som backslash erstatter. Bruk deretter utskriftsfunksjonen for utskriften for å se konverteringen på utgangsskjermen.

Utgangen viser konverteringen utført av strengen til Unicode med kodingsfeilmetoden i Python. Vi kan se at utgangen har “XS6” som er unicode -nummeret til “Ö”. O med de to prikkene på den. Resten av karakteren er trykt som den er.

Eksempel # 03: Konvertering av streng til Unicode ved bruk av (bli med+format+ord) i python:

I dette eksemplet vil vi se hvordan vi skal utføre konvertering av strengen til Unicode ved hjelp av tre funksjoner. De tre funksjonene vi vil bruke i dette eksemplet er sammenføyd (), Format () og Ord (). Først må vi importere det vanlige uttrykket som "import re". Initialiser deretter strengen her. Vi har tatt strengen som "vann plantene". Skriv først ut teststrengen og bruk deretter Funksjonen til Format for Conversion Join (), Format () og Ord () -metoden helt. Deretter vil utskriftsfunksjonen bli brukt til utskrift av utgangsskjermen.

Skjermbildet viser Unicode konvertert til streng ved hjelp av Join (), Format () og Join () -metodene. Hver strengverdi har sin unicode som vist i utgangen nedenfor.

Eksempel nr. 03: Konvertering av streng til Unicode ved bruk av (Ord+Lambda+RE.sub) i Python:

Her skal vi utføre konverteringen av strengen til Unicode ved å bruke de tre funksjonene igjen. I dette eksemplet er funksjonene som brukes “ord ()”, “lambda ()” og “re. under". Vi må importere det vanlige uttrykket her, som i eksempel 2. Deretter må vi initialisere strengen for konverteringen. Vi har initialisert strengen som "himmelen er blå". Skriv deretter ut strengen for videre behandling. Etter det vil vi bruke sub () -funksjonen for å utføre erstatningene. Vi vil også bruke ord () -funksjonen som brukes til konvertering av strengen. Lambda () som brukes er for å lage anonyme funksjoner som jobber sammen. Deretter bruker du utskriftsfunksjonen for utskrift med brukes.

I displayet kan vi se konvertering av strengen til utført Unicode.

Konklusjon:

I denne artikkelen har vi forstått hvordan konverteringen kan utføres av strengen til en unicode. Det er en nyttig metode som direkte kan utføre utførelsen i stedet for å gjøre det en etter en for hver karakter. Vi har ryddet alle scenariene ved hjelp av å implementere eksemplene som vil hjelpe oss å forstå bedre. Vi har gjort konvertering av strengen til Unicode ved hjelp av kodemetoden og også kodefeilmetoden ved hjelp av parameterens tilbakeslag. Vi har også utført konvertering av en streng med de tre metodene som ord (), lambda () og re. sub () og den andre ved hjelp av join (), format () og ord () i python.