Anonim

En af de ting, der ofte har frustreret mig, er manglende evne til let at kopiere tekst ud af billeder og visse PDF-filer (f.eks. Dem, der muligvis er oprettet fra scannede dokumenter). Heldigvis er der over tid udviklet softwareløsninger til at løse dette problem, hvilket giver mulighed for betydelige tidsbesparelser, som ellers ville være blevet brugt manuelt på at kopiere og gentype teksten. I dagens tip taler jeg om et gratis softwareværktøj kaldet Capture2Text, der bruger en OCR-algoritme (Optical Character Recognition), der giver dig mulighed for at fange tekst fra billed- og PDF-filer.

Installation og opsætning

For at begynde skal du gå videre til projektets SourceForge-side og downloade den nyeste version af Capture2Text. Softwaren leveres som et zip-arkiv og inkluderer på det tidspunkt ikke et dedikeret installationsprogram. Når det er downloadet, skal du pakke arkivet ud og starte filen Capture2Text.exe. Dette starter softwaren og lægger et ikon ned i systembakken:

For det første skal du opsætte softwarens præferencer, specifikt hvilke genvejstaster (eller genveje), du skal bruge til at starte og stoppe optagelse:

I mit tilfælde har jeg valgt at bruge "Windows + q" -tasterne til at starte optagelse og "Enter" for at stoppe det. Du kan justere disse indstillinger til det, der fungerer bedst for dig. Husk, at "Windows + s" -tasten ofte bruges til skærmoptagelse allerede (f.eks. Af programmer som Microsoft One Note).

På den næste fane kan OCR-indstillinger konfigureres inklusive indgangssproget (i øjeblikket understøttes syv sprog), og om man skal bruge OCR-forbehandling for at forbedre nøjagtigheden (anbefales stærkt). Endelig kan man på fanen Output blandt andre indstillinger vælge, om man bare skal gemme den optagne tekst på udklipsholderen, eller om man vil starte et separat popup-vindue.

Brug af softwaren

Når softwaren er installeret og konfigureret, kan du begynde at bruge den via din startoptagelsestastkombination. Brug musen til at vælge det område på billedet, der indeholder teksten, du vil optage. For at stoppe optagelse skal du blot trykke på den hurtigtast, du har valgt at stoppe optagelsen. Teksten kopieres derefter enten til udklipsholderen, et popup-vindue eller begge dele. Et eksempel kan ses nedenfor.

Fra min hurtige test af værktøjet med billeder har jeg fundet, at dets nøjagtighed er anstændigt. Der er naturligvis begrænsninger til værktøjer som dette og OCR generelt. F.eks. Fungerer stærkt modificeret tekst (meget kursiv, kursiveret eller moderne) muligvis ikke så godt, og nogle gange slet ikke. I nogle tilfælde vil det også hjælpe med at justere fangstboksens dimensioner lidt eller lege med zoom på selve billedet for at få et mere præcist resultat.

Når du optager tekst fra scannede PDF-dokumenter, er nøjagtigheden ok, med et par endelige ændringer, der generelt stadig er nødvendige på det optagne output (afhængigt af kvaliteten af ​​den indledende scanning). Jeg har også bemærket, at softwaren kan tage et par sekunder længere at behandle, især når det bliver bedt om at konvertere store mængder tekst.

Når det er sagt, synes jeg, alt i alt værktøjet gør et godt stykke arbejde, især da det er frit tilgængeligt - jeg opfordrer dig til at prøve det.

Tillæg 16/16/2015:

Som en anden mulighed for dem, der har Google-konti, er det også muligt at bruge Googles OCR-kapaciteter ved at uploade en fil til dit Google Drev (flere detaljer findes her). Desuden er der også et OCR-plugin til rådighed for Google Chrome-brugere kaldet Copyfish, som du muligvis også vil tjekke ud.

Sådan fanges tekst fra billeder med ocr-software