Dikuasakan oleh Guardian.co.ukArtikel ini bertajuk “Bagaimana saya boleh menukar nota tulisan tangan saya ke dalam dokumen Word?” ditulis oleh Jack Schofield, untuk theguardian.com pada Khamis 18 Dis 2014 16.19 UTC

Saya mempunyai banyak pad A4 nota tulisan tangan, yang saya mahu untuk menukar ke dalam dokumen Microsoft Word. Untuk menaip mereka semua dalam akan mengambil masa yang sangat lama. Saya dapati bahawa keupayaan Google untuk membaca teks daripada foto telah bertambah baik dalam beberapa bulan kebelakangan. Adakah anda sedar alat dari Google atau sesiapa sahaja yang boleh melakukan kerja yang baik ini, sila? Michael

Idea untuk mengubah bertulis atau bercetak teks ke dalam teks digital biasanya dipanggil OCR untuk pengecaman aksara optik, dan ia mempunyai masalah yang sama untuk pengecaman pertuturan. Iaitu, jika input adalah berhampiran dengan menyempurnakan, keluaran juga boleh dekat dengan menyempurnakan.

Tetapi dalam amalan, ia berfungsi terbaik apabila berurusan dengan input terhad dan / atau domain terhad. Sebagai contoh, ia mungkin untuk mengenali nama-nama Bahasa Inggeris untuk nombor dan nama-nama bandar-bandar utama UK, terutamanya jika anda boleh mendapatkan orang untuk menulis setiap huruf dalam kotak sendiri sedikit. Perisian yang sama tidak akan mempunyai kepakaran domain untuk menghadapi koroner berbahasa Rusia yang suka untuk memasukkan petikan Sanskrit dalam autopsi tulisan tangan beliau.

perkara tulisan tangan

OCR terbaik dengan bahan-bahan bercetak yang berkualiti tinggi dan paling teruk sekali dengan tulisan tangan, supaya anda tidak bermula dari kedudukan yang terbaik. Dalam pengalaman saya, anda hanya boleh mendapatkan pengiktirafan tulisan tangan untuk bekerja dengan baik dengan melakukannya dalam masa sebenar. Yang membolehkan anda untuk melatih perisian untuk mengiktiraf input anda, manakala perisian ini juga melatih anda untuk menulis watak-watak dalam cara yang ia boleh memahami. Saya telah mempunyai beberapa kejayaan dengan pendekatan ini, bermula lebih daripada satu dekad yang lalu dengan Microsoft OneNote (yang juga boleh merakam suara anda selari) berjalan pada Windows XP Tablet Edition, dan baru-baru dengan pen digital Livescribe Echo dan MyScript perisian. Walau bagaimanapun, semua ini mempunyai kaitan yang lebih dengan strategi penggantian keyboard daripada dengan OCR.

Ia secara umumnya bersetuju bahawa program OCR terbaik adalah ABBYY FineReader (£ 99) dan Nuansa ini OmniPage 18 (£ 79,99) dan Ultimate (£ 169.99), walaupun tidak sesuai untuk pengiktirafan kursif tulisan tangan. Kedua-dua syarikat menawarkan versi percubaan percuma supaya anda boleh menguji mereka sebelum anda berbelanja. Terdapat juga CharacTell ini SoftWriting ($49.95), yang syarikat itu berkata adalah untuk pelajar mengambil nota di dalam kelas dan profesional mengambil nota dalam mesyuarat. Tetapi ia juga mengatakan ia direka "untuk mengiktiraf tulisan tangan tidak disambungkan dan teks mesin cetak" (penekanan mereka) jadi saya tidak akan bertaruh di atasnya membaca nota tulisan tangan anda.

Seperti kebanyakan jika tidak semua program dalam bidang ini, SoftWriting perlu dilatih untuk mengenali tulisan tangan anda. Apabila ia memproses dokumen, ia akan hadir anda dengan kata-kata yang tidak mengiktiraf, supaya anda boleh memberitahu apa yang mereka. Jika anda mempunyai 250 perkataan pada halaman dan program yang ajaib mendapat 90% daripada mereka hak, anda masih akan mempunyai untuk membetulkan 25 kata-kata.

Jika anda ingin mencuba beberapa muka surat sebagai percubaan, maka anda boleh muat turun FreeOCR untuk Windows, walaupun berhati-hati untuk tidak memasang apa-apa crapware yang boleh dimasukkan. FreeOCR adalah berdasarkan enjin Tesseract OCR digunakan secara meluas, yang pada asalnya dibangunkan oleh Hewlett-Packard di England pada tahun 1980-an. HP menjadikan sumber terbuka dalam 2005, dan Google kini mengekalkan kod sumber.

Anda juga boleh menggunakan FreeOCR talian ini dengan memuat naik fail PDF untuk free-ocr.com. Google Docs dan pelbagai perkhidmatan lain juga menggunakan enjin Tesseract OCR yang sama.

Wikipedia memberi amaran bahawa "output Tesseract akan menjadi kualiti yang sangat miskin jika imej input tidak dipraproses untuk memenuhi ia: Images (terutama screenshot) perlu dipertingkatkan supaya teks x ketinggian sekurang-kurangnya 20 piksel, mana-mana putaran atau condong mesti diperbetulkan atau tidak ada teks akan diiktiraf, perubahan frekuensi rendah dalam kecerahan mesti tinggi pas ditapis, or Tesseract’s binarization stage will destroy much of the page, and dark borders must be manually removed, or they will be misinterpreted as characters.”

PDFs and scanners

Your handwritten notes would be more useful in Microsoft Word format because you could do lots of things with them. Sebagai contoh, you could change the typeface, size and spacing, correct and amend your notes, add illustrations, dan sebagainya. But unless you have extremely neat, clear and very consistent handwriting, that probably won’t be possible. sebaliknya, think about converting them to high-quality, scanned PDF files that you can store on a hard drive or in the cloud.

You can feed these PDF files to OCR software and hope that it will recognize enough words to make your notes searchable. Jika tidak, you will probably have to tag them manually. Sama ada cara, if someone does come up with an OCR program that can read your handwriting – not impossible, though I’ve already waited 30 years for one – you will be ready with sharp PDF files, rather than curling originals where the paper has aged and the ink has faded.

Sudah tentu, if you are going to scan your notes then you must already have a scanner, or be prepared to buy one. A cheap Epson atau Canon flat-bed scanner should give good results, though it is time-consuming to scan a lot of pages. If you intend to do a lot of scanning, consider a sheet-fed model like the Brother ADS-2100 (from £222). You can also get scanners that include OCR, seperti Fujitsu ScanSnap iX500 Duplex (from £352), which scans both sides of the paper at once. (The scanner’s OCR software usually runs on your PC.)

Scanning services

If you have to buy a decent scanner and perhaps good quality OCR software for a one-off project, add up the cost and divide it by the number of pages of notes to find the cost per page. It’s a boring job, so perhaps you should add the cost of your time. The result might prompt you to abandon the whole idea, or start looking for a company to do it for you.

Most of the companies that provide scanning services cater for businesses that need to clear away large volumes of paper records. Walau bagaimanapun, some cater for low-volume and home users. One example is Oxford-based Scanning Geeks, which charges 25p per page for documents up to A3 in size. (One page means one side of a page.) They can do OCR (“Textual Data Capture”) serta. Sebaik-baiknya, find a good local company where you can drop off your notes securely and collect them afterwards.

It’s an expensive route if you have lots of paper: it could cost £3,000 to scan the contents of a four-drawer filing cabinet. But if you only have 100 kepada 500 pages of notes to scan, it could be the best option.

guardian.co.uk © Guardian News & Media Limited 2010

Diterbitkan melalui Guardian News Feed plugin untuk WordPress.

29085 0