Karakter satt i HTML

Karakter satt i HTML
Hver gang en datamaskinbruker treffer en tast på tastaturet, genereres en relevant karakterkode for å representere det tastetrykk. Disse karakterkodene danner et tegnsett som må kunne kommunisere med datamaskinen. HTML -tegnsett lar deg laste inn sidene riktig ved å bruke karakterkoder på symboler/tegn. I dette innlegget vil du få de forskjellige karaktersettene som brukes i HTML.

Karakter satt i HTML

Det er mange karaktersett som ble brukt i tidligere versjoner av HTML. Her vil vi diskutere alt det tidligere og for øyeblikket støttede karaktersettet.

ASCII -karaktersett

ASCII er et 7-biters karaktersett som lar 128 tegn representere de engelske språkbetingelsene i datamaskinens forståelige format. Noen kjennetegn ved ASCII er beskrevet nedenfor:

- Sifrene (0-9) og alle de 26 alfabetiske bokstavene kan være representert ved hjelp av ASCII

- Alle karaktersettene som brukes i HTML er basert på ASCII

Den primære begrensningen av ASCII-karaktersettet er at det bare støttet 128 tegn som bare kan støtte engelskspråklige begreper (alfabeter), sifre (0-9) og tegnsettingsmerker. Språkavhengig og begrenset.

ISO 8859-1 karaktersett

Fra de nylige versjonene, HTML 4.0 kom med ISO-8859-1 som standardkaraktersett. ISO 8859-1 er en utvidelse av ASCII-karaktersettet, og det representerer karakterene i 8-biters kode. Den kan representere 256 tegn som også gjør det til et språkavhengig kodingsskjema. Et tegnsett er definert i metakoden til HTML-dokumentet, og følgende kode vil hjelpe deg med å bruke ISO 8859-1 i HTML-dokumentet:

Merk: Selv om HTML5 inneholder et UTF-8-tegnsett, kan det også brukes sammen med ISO-8859-1 ved å bruke følgende linje i hodemerket ditt.

UTF-8 karaktersett

Unicode -karaktersettet består av desimalverdiene som representerer karakterene, symbolene og tegnsettingskemerkene. Disse Unicode-baserte desimalverdiene blir deretter konvertert til datamaskinens forståelig format ved bruk av UTF-8, UTF-16 eller UTF-32. UTF-8 anbefales imidlertid for websider, da den dekker alle tegn/symboler/tegnsettingsmerker som kan brukes i et HTML-dokument.

Følgende er de fremtredende trekkene i UTF-8

- Siste karaktersett kom som standard for HTML5.

- Den kan også legges til HTML4 -versjonen.

- UTF-8 fungerer på grunnlag av ASCII og de første 128 tegnene i UTF-8 er de samme som av ASCII.

- Støtter alle symbolene, karakterene og tegnsettingsmerket som brukes over hele kloden

- Konverterer tallene/tegnene/symbolene/tegnsettingsmerket i en til fire byte

Fra diskusjonen ovenfor gjorde viktigheten av UTF-8 en solid grunn for foreldelse av ASCII og ISO-8859-1-karaktersett.

Merk: Unicode.org gir alle unicodes av karakterene, symbolene, emojis, tegnsettingstegn.

Hvordan bruke UTF-8 i HTML4

HTML4 kom med ISO-889-1 som standardkaraktersettet. Du kan imidlertid legge til UTF-8-karaktersettet i HTML4 ved å bruke følgende metakode.

Hvordan bruke ISO-8859-1 i HTML5

Ettersom standardkaraktersettet til HTML5 er UTF-8 som overgår det eldre karakteren SETS. Du kan imidlertid legge til ISO-8859-1-tegnsettet i HTML-dokumentet ditt ved å bruke følgende linje i hodemerket vårt.

Konklusjon

Karaktersettet konverterer symbolene, tegnene eller ethvert tastetrykk til et datamaskinlesbart format. Denne artikkelen gir en oversikt over karaktersett brukt i HTML fra tidligere versjoner til den nyeste HTML5. ASCII er den eldste karakteren som er satt med begrenset støtte for karakterer og språk (bare engelsk språk). Senere ble ASCII utvidet til 256 tegn med 8-biters støtte for å bygge et nytt karaktersett som heter ISO-8859-1. ISO-8859-1 er standardkarakteren som er satt for HTML4, men tilbyr begrenset støtte av karakterer (256). UTF-8 dekker alle manglene på ISO-8859-1, og dermed kom UTF-8 som et standardkarakter satt i HTML5.