Hvordan installere og bruke EasyCr i Linux

Lars Solberg

Denne artikkelen vil dekke en guide om installasjon og bruke EasyCr -kommandolinjeverktøyet og Python -modulen. Tilgjengelig som en gratis og open source -applikasjon, den kan brukes til å identifisere og trekke ut tekst fra bilder. Den bruker optisk karaktergjenkjenning (OCR) teknologi og en rekke forskjellige algoritmer og språkmodeller for å oppdage teksten.

Hovedfunksjonene til EasyCr

EasyCr kan oppdage tekst på over 80 språk og skript. Det inkluderer forhåndsutdannede modeller for disse språkene, men du kan bruke EasyCr for å trene dine egne modeller fra bunnen av. Foruten digitalt og trykt tekstbasert innhold som finnes i bilder, kan EasyCr også oppdage og trekke ut håndskrevet tekst. Andre hovedfunksjoner i EasyCr inkluderer evne til å batchprosesser flere bilder samtidig, evne til å begrense og blokkere visse tegn fra et språk, et alternativ for å konvertere ekstraherte linjer til avsnitt, evne til å endre størrelse og forstørre bilder for å forbedre deteksjonsnøyaktigheten, og så videre.

Installere EasyCr i Linux

Du kan installere EasyCr i Linux ved hjelp av Pip Package Manager. For å installere Pip Package Manager i Ubuntu, bruk følgende kommando:

$ sudo apt install python3-pip

Pip Package Manager er tilgjengelig i offisielle depoter av mange Linux -distribusjoner, slik at du kan installere den fra aksjepakkeansvarlig. Du kan også følge offisielle installasjonsinstruksjoner som er tilgjengelige her for å installere Pip Package Manager i Linux -systemet ditt.

Etter at du har installert Pip Package Manager, kjører du følgende kommando for å installere EasyCr i Linux:

$ pip3 installer EasyCr

Bruker EasyCr i Linux

Følgende bilde vil bli brukt til å trekke ut tekst gjennom forskjellige EasyOCr -kommandoer forklart nedenfor:

For å trekke ut tekst fra bildet ovenfor, må du kjøre en kommando i følgende format:

$ easyoch -l en -f image.png

Det første alternativet "-l" kan brukes til å spesifisere språket i tekstinnholdet du vil bli fanget av EasyOCr. Du kan spesifisere flere språk ved å bruke kommandos adskilte språkkoder. “-F” -bryteren brukes til å spesifisere inngangsbildefilen. En liste over alle språk støttet av EasyCr og deres koder finner du her (bla nedover for å se dem).

Etter å ha kjørt kommandoen ovenfor, bør du se følgende utdata i terminalen:

Utgangen viser visse tall og teksten trukket ut fra bildet. Denne utgangen kan leses i følgende format: Koordinater for individuelle tekststykker> Detektert tekst> Tillitsnivå. Så tallene på venstre side representerer koordinater for de identifiserte tekstboksene mens tallet til høyre mest side indikerer hvor nøyaktig den ekstraherte teksten er.

Hvis du bare vil få oppdaget tekst i menneskelig lesbar form, kan du legge til "-detail 0" -bryter til kommandoen ovenfor:

$ easyoch -l en -detalj 0 -f bilde.png

Etter å ha kjørt kommandoen ovenfor, bør du få noe utgang som ligner på dette:

Som du kan se i utdataene, er den ekstraherte teksten ikke i riktig rekkefølge. Du kan prøve alternativet "-Paragraph" kommandolinje for å bli med i individuelle brikker og setninger i riktig ordre.

$ easyoch -l en -detalj 0 -Paragraph true -f image.png

Etter å ha kjørt kommandoen ovenfor, bør du få noe utgang som ligner på dette:

Merk at avhengig av kvaliteten og klarheten til et bilde og tekstinnholdet i bildet, kan visse unøyaktigheter alltid være til stede i den ekstraherte teksten, og du må kanskje gjøre manuelle korreksjoner for å fikse dem.

For å lagre den identifiserte teksten i en ekstern fil, bruk “>” -symbolet og oppgi et navn for utdatafilen. Her er en eksempelkommando:

$ easyoch -l en -detalj 0 -Paragraph true -f image.PNG> utgang.tekst

For å vite mer om alle kommandolinjealternativer støttet av EasyCr, bruk følgende kommando:

$ Easyoch --hjelp

Bruker EasyCr i Python -programmer

EasyCr er også tilgjengelig som et Python -bibliotek, slik at du kan importere hovedmodulen i Python -programmene dine. Nedenfor er en kodeeksempel som illustrerer bruken i et Python -program:

Importer lettok
Leser = Easyocr.Leser (['en'])
Resultat = leser.readText ('image.png ', detalj = 0, avsnitt = sant)
med åpen ("output.txt "," w ") som f:
for linje i resultatet:
skriv ut (linje, fil = f)

Den første uttalelsen brukes til å importere “EasyCr” -modulen i Python -programmet ditt. Deretter opprettes en ny forekomst av "Reader" -klasse (baseklasse) ved å levere en liste over språk støttet av EasyCr som hovedargument. Hvis bildet ditt inneholder tekst på flere språk, kan du legge til flere språkkoder på listen. Deretter kalles "ReadText" -metoden "leser" -forekomsten, og banen til bildefilen leveres som den første parameteren. Denne metoden vil identifisere og trekke ut tekst fra det medfølgende bildet. De to valgfrie argumentene, "detalj" og "avsnitt" er de samme som kommandolinjealternativene som er forklart ovenfor. De forenkler teksten ved å fjerne unødvendige elementer.

Etter å ha kjørt kommandoen ovenfor, bør du ha følgende linje i “Output.txt ”-fil:

Du kan lese mer om Easyocrs Python API herfra. En online versjon av EasyCr er tilgjengelig her for å teste.

Konklusjon

EasyCr er et kommandolinjetekstutvinningsverktøy som følger med forhåndsutdannede modeller for mange språk. Dette gjør det enkelt for sluttbrukere å raskt identifisere og trekke ut tekst fra bilder uten å ha sine egne språkmodeller. Det gir også detaljerte koordinater for avgrensende bokser rundt identifiserte og tokeniserte ord, noe som gjør det enkelt å analysere individuelle tekster.

Python

Python OS Mkdir

“OS.mkdir () ”-metode for“ OS ”-modulen brukes til å lage en enkelt katalog, flere kataloger og nest...

Daniel Johnsen

Python

Pandas read_csv multiprocessing

For å forbedre databelastningshastigheten, inkludert fordelene og begrensningene PD.read_csv () ”-fu...

Daniel Berntsen

Docker

Hva er formålet med en Docker-komponering.YML -fil i Docker?

Hovedformålet med en “Docker-Compose.YML ”-filen er å forenkle prosessen med å distribuere og admini...

Elias Krogh Svendsen