Realizat de Guardian.co.ukAcest articol intitulat “Cum îmi pot converti notele mele scrise de mână în documente Word?” a fost scris de Jack Schofield, pentru theguardian.com joi, 18 decembrie 2014 16.19 UTC

Am multe tampoane A4 de note scrise de mână, pe care aș dori să converti în documente Microsoft Word. Pentru a le introduce toate într-ar lua foarte mult timp. Am observat că capacitatea Google de a citi textul din fotografii sa îmbunătățit foarte mult în ultimele luni. Cunoașteți un instrument de la Google sau de oricine altcineva care poate face o treabă bună a acestui, Vă rog? Michael

Ideea de a converti scrise sau tipărite de text în text digital este, în general, numit OCR pentru recunoașterea optică a caracterelor, și are probleme similare cu recunoașterea vorbirii. Cu alte cuvinte, în cazul în care intrarea este aproape de a perfecta, de ieșire poate fi, de asemenea, aproape de a perfecta.

Dar, în practică, funcționează cel mai bine atunci când se ocupă cu intrări restrânse și / sau domenii limitate. De exemplu, este posibil să se recunoască numele de limba engleza pentru numerele și numele marilor orașe din Marea Britanie, mai ales dacă puteți obține oameni să scrie fiecare literă în propria cutie mică. În același software-ul nu ar avea expertiza de domeniu pentru a face față cu un medic legist vorbitor de limbă rusă, care îi plăcea să includă citate sanscrite autopsiile sale scrise de mână.

probleme de scriere de mână

OCR funcționează cel mai bine cu materiale imprimate de înaltă calitate și cel mai rău dintre toate cu scrisul de mână, astfel încât să nu porniți de la cea mai bună poziție. In experienta mea, puteți obține doar o recunoaștere a scrierii de mână pentru a lucra suficient de bine prin a face-o în timp real. Care vă permite să tren software-ul pentru a recunoaște datele introduse, în timp ce software-ul vă pregătește, de asemenea, pentru a scrie caractere în moduri care se poate înțelege. Am avut un oarecare succes cu această abordare, începând cu mai mult de un deceniu în urmă cu Microsoft OneNote (care poate înregistra, de asemenea, vocea în sincronizare) care rulează pe Windows XP Tablet Edition, și mai recent, cu un creion digital Livescribe Echo și MyScript software-ul. Totuși, toate acest lucru are mai mult de a face cu strategii de înlocuire a tastaturii decât cu OCR.

Este în general acceptat că cele mai bune programe OCR sunt ABBYY FineReader (£ 99) și OmniPage Nuance 18 (£ 79.99) și Ultimate (£ 169.99), deși nu este potrivit pentru recunoașterea scrisului de mână cursivă. Ambele companii oferă versiuni gratuite de încercare, astfel încât să le puteți testa înainte de a stropi. De asemenea, există SoftWriting CharacTell lui ($49.95), pe care compania spune ca este pentru studenții care au luat notițe în clasă și profesioniști care iau notițe în cadrul reuniunilor. Dar, se spune, de asemenea, este proiectat "pentru recunoașterea scrisului de mână de bază non-conectate și text tipărit-mașină" (accentul lor) așa că nu aș paria pe ea citind notele scrise de mână.

La fel ca majoritatea, dacă nu toate programele din acest domeniu, SoftWriting trebuie să fie instruiți să recunoască scrisul de mână. Atunci când acesta procesează un document, vă va prezenta cu cuvinte care nu le recunoaște, astfel încât să puteți spune ce ei sunt. Daca ai 250 cuvinte pe o pagină și programul devine miraculos 90% dintre ei drept, veți avea în continuare pentru a corecta 25 cuvinte.

În cazul în care doriți să încercați câteva pagini ca un experiment, atunci puteți descărca FreeOCR pentru Windows, să fie totuși atenți să nu pentru a instala orice crapware care pot fi incluse. FreeOCR se bazează pe motorul Tesseract OCR utilizat pe scară largă, care a fost inițial dezvoltat de Hewlett-Packard în Anglia în anii 1980. HP a făcut open source în 2005, și Google menține acum codul sursă.

De asemenea, puteți utiliza FreeOCR on-line prin încărcarea fișierelor PDF în free-ocr.com. Google Docs și diverse alte servicii folosesc, de asemenea, același motor OCR Tesseract.

Wikipedia avertizează că "producția Tesseract va fi foarte slabă calitate în cazul în care imaginile de intrare nu sunt preprocesate pentru a se potrivi cu ea: imagini (în special capturi de ecran) trebuie sa fie extinsa astfel încât textul x înălțime este de cel puțin 20 pixeli, orice rotație sau oblic, trebuie să fie corectate sau nici un text nu va fi recunoscut, modificări de frecvență joasă în luminozitate trebuie să fie de mare filtrat trece, or Tesseract’s binarization stage will destroy much of the page, and dark borders must be manually removed, or they will be misinterpreted as characters.”

PDFs and scanners

Your handwritten notes would be more useful in Microsoft Word format because you could do lots of things with them. De exemplu, you could change the typeface, size and spacing, correct and amend your notes, add illustrations, si asa mai departe. But unless you have extremely neat, clear and very consistent handwriting, that probably won’t be possible. În schimb, think about converting them to high-quality, scanned PDF files that you can store on a hard drive or in the cloud.

You can feed these PDF files to OCR software and hope that it will recognize enough words to make your notes searchable. Dacă nu, you will probably have to tag them manually. Oricum, if someone does come up with an OCR program that can read your handwriting – not impossible, though I’ve already waited 30 years for one – you will be ready with sharp PDF files, rather than curling originals where the paper has aged and the ink has faded.

Desigur, if you are going to scan your notes then you must already have a scanner, or be prepared to buy one. A cheap Epson sau Canon flat-bed scanner should give good results, though it is time-consuming to scan a lot of pages. If you intend to do a lot of scanning, consider a sheet-fed model like the Brother ADS-2100 (from £222). You can also get scanners that include OCR, ca Fujitsu ScanSnap iX500 Duplex (from £352), which scans both sides of the paper at once. (The scanner’s OCR software usually runs on your PC.)

Scanning services

If you have to buy a decent scanner and perhaps good quality OCR software for a one-off project, add up the cost and divide it by the number of pages of notes to find the cost per page. It’s a boring job, so perhaps you should add the cost of your time. The result might prompt you to abandon the whole idea, or start looking for a company to do it for you.

Most of the companies that provide scanning services cater for businesses that need to clear away large volumes of paper records. Totuși, some cater for low-volume and home users. One example is Oxford-based Scanning Geeks, which charges 25p per page for documents up to A3 in size. (One page means one side of a page.) They can do OCR (“Textual Data Capture”) as well. Ideal, find a good local company where you can drop off your notes securely and collect them afterwards.

It’s an expensive route if you have lots of paper: it could cost £3,000 to scan the contents of a four-drawer filing cabinet. But if you only have 100 pentru 500 pages of notes to scan, it could be the best option.

guardian.co.uk © Guardian News & Media Limited 2010

Publicate prin Guardian News Feed plugin pentru WordPress.

29047 0