ICONV -kommando i Linux

ICONV -kommando i Linux
Sørg for å oppdatere Linux -maskinen din før du går dypt ned mot implementering av denne artikkelen. For oppdateringen, bruk "Apt" -verktøyet til Linux med "oppdatering" -tnøkkelordet og kjør denne instruksjonen ved å bruke "sudo" -rettighetene. Selv om vi kan hoppe til implementeringen nå, vil vi foretrekke å oppgradere dette systemet også, jeg.e., En oppgradering ville redusere sjansen for forekomst av feil, og systemet vil kunne løse problemene mer nøyaktig. Bruk derfor “APT” -verktøyet i "oppgradering" -instruksjonen.

La oss se på ICONV -verktøyet til Linux i sin terminalkonsoll nå. Så vi har utført instruksjonen “Iconv” med “-L” -flagget for å vise alle de kjente og mest brukte kodede karaktersettene på vår terminalskjerm. Den vil vise de kodede karaktersettene sammen med aliasene deres. Du kan se en lang liste over kodede karaktersett etter å ha bla litt ned.

Nå er det på tide å komme i gang med implementeringen av ICONV -kommandoen i Linux. Først trenger vi forskjellige typer filer i systemet vårt for å konvertere en type fil til en annen type. Dermed bruker vi "berørings" -spørsmålet på konsollterminalen for å lage tre forskjellige filer, i.e., Java -type, C -type og teksttype. Liste over det gjeldende kataloginnholdet, finner du de nylig genererte filene i den.

Etter dette vil vi se på typen av hver fil separat ved å bruke "filen" -spørsmålet sammen med navnet på hver fil. Denne spørringen trenger alternativet “-i” for å vise typen kodingspersonell for hver fil separat. Hvis du glemte å bruke alternativet “-i”, bruk "-Mime" -flagget i stedet. Både "-i" og "-mime" -flaggene fungerer det samme.

Nå, etter å ha utført "filen" -instruksjonen for "txt" -typefilen, fikk vi "US-ASCII" -kodingskoding. Mens du bruker den samme instruksjonen for Java- og C -filene, viser det at begge filene inneholder "binær" karaktertype -koding. Sammen med det viser denne instruksjonen at alle disse tre filene er tomme.

Nå vil vi illustrere bruken av ICONV -instruksjon på konsollen for å konvertere en spesifikk tegnsettkodingsfil til et annet tegnsettkoding. Før det må vi legge til litt kode eller data i filene våre. Derfor har vi lagt til Java -koden i “teksten.Java ”-fil, C -kode i“ Teksten.C ”-fil, og lagt til tekstdata i“ Testen.txt ”-fil. CAT -spørringen ble brukt her for å vise innholdet i alle tre filene, som presentert nedenfor:

Nå som vi har lagt til dataene, vil vi se karaktersettet som koder for disse filene igjen. Så vi har prøvd den samme filinstruksjonen i skallet med “-i” -flagget og filnavnene, i.e., test.txt, test.Java, og test.c. Å kjøre disse tre instruksjonene separat for alle tre filene viser at tegnsettet koding er oppdatert for Java- og C -filene mens de forblir den samme for tekstfilen, i.e., US-ASCII. Kodingen av Java- og C -filer var tidligere "binær"; Nå er det “US-ASCII”. Den viser også at tekstfilen inneholder vanlige tekstdata, mens de to andre kodefilene inneholder skriptene som innholdet.

Det er på tide å utføre den faktiske oppgaven som trengs for denne artikkelen, jeg.e., Konverter en koding til en annen ved hjelp av ICONV -kommandoen i skallet. Dermed har vi brukt "ICONV" -instruksjonen i skallterminalen med "sudo" -rettighetene. Denne kommandoen tar alternativet "-f" for "fra", og alternativet "-t" står for "til", i.e., fra en koding til en annen.

Etter alternativet "-f", må du spesifisere kodingen av filen din allerede har, i.e., US-ASCII. Mens du etter "-t" -alternativet, må du spesifisere kodingen du vil erstatte med den gamle kodingen, i.e., Unicode. Du må spesifisere navnet på en fil som brukes som kilde med alternativet -o for å opprette objektbildet. Objektbildet ville være en annen fil, jeg.e., "ny.c ”, av samme type, men med den nye kodingen og de samme dataene.

Etter å ha utført følgende instruksjon, vil du få en ny fil i samme katalog, i.e., I henhold til "LS" -spørsmålet. Nå vil vi se etter karaktersettet som kodes av en ny fil generert ved hjelp av ICONV -instruksjonen. Vi vil igjen bruke "filen" -instruksjonen med alternativet "-i" og det nye filnavnet, i.e., ny.c.

Du vil se at tegnsettet for denne nye filen har vært annerledes enn karaktersettet med en gammel fil, i.e., UTF-16LE-karaktersettet. Dette er fordi vi har oversatt USA-ASCII-kodingen til Unicode-kodingen ved hjelp av ICONV-instruksjonen for vår nye.C -fil. Spørringen "CAT" viste den samme C -koden i filen, men startet med noen Unicode -tegn, som allerede presentert.

På en veldig lik måte vil vi endre kodingen av testen.txt tekstfil. Filinstruksjonen viser at den har et amerikansk-ASCII-karaktersett. ICONV -kommandoen har blitt brukt med samme format for å konvertere kodingen av testen.txt-fil fra US-ASCII til tyrkisk8. Du vil se at det ikke endrer USA-ASCII til tyrkisk.

Etter dette brukte vi den samme kommandoen for å dekke US-ASCII til UTF-32-tegnsett som koder for den samme filen. Denne gangen fungerer det. Dette er fordi det noen ganger kan være et problem som konverterer det ene kodingssettet til et annet, eller det andre kodingen ikke støtter det.

Konklusjon

Denne artikkelen diskuterte hvordan du bruker ICONV Linux -instruksjonene for å konvertere en kodingskarakter som er satt til et annet ved hjelp av aliasene sine. På denne måten måtte vi lage noen filer av forskjellige typer.