Powered by Guardian.co.ukບົດ​ຄວາມ​ຫົວ​ຂໍ້​ນີ້ “ແນວໃດຂ້າພະເຈົ້າສາມາດປ່ຽນຂຽນຂໍ້ຄວາມຂອງຂ້າພະເຈົ້າເຂົ້າໄປໃນເອກະສານ Word?” ລາຍ​ລັກ​ອັກ​ສອນ​ໂດຍ Jack Schofield, ສໍາລັບ theguardian.com ໃນວັນພະຫັດ 18 ທັນວາ 2014 16.19 UTC

ຂ້າພະເຈົ້າມີ pads A4 ຈໍານວນຫຼາຍຂອງການບັນທຶກດ້ວຍລາຍມື, ທີ່ຂ້າພະເຈົ້າຈະຕ້ອງການທີ່ຈະປ່ຽນເປັນເອກະສານ Microsoft Word. ປະເພດເຂົາເຈົ້າຢູ່ໃນທັງຫມົດຈະໃຊ້ເວລາທີ່ໃຊ້ເວລາດົນນານທີ່ສຸດ. ຂ້າພະເຈົ້າໄດ້ສັງເກດເຫັນວ່າຄວາມສາມາດຂອງກູໂກເພື່ອອ່ານຂໍ້ຄວາມຈາກຮູບພາບໄດ້ດີກວ່າເກົ່າຫຼາຍໃນເດືອນທີ່ຜ່ານມາ. ທ່ານມີຄວາມຮູ້ຂອງເຄື່ອງມືການຈາກກູໂກຫຼືໃຜອື່ນວ່າສາມາດເຮັດໄດ້ວຽກເຮັດງານທໍາທີ່ດີຂອງໂຄງການນີ້, ກະ​ລຸ​ນາ? Michael

ຄວາມຄິດຂອງການເປັນລາຍລັກອັກສອນຫຼືພິມຂໍ້ຄວາມເຂົ້າໄປໃນຂໍ້ຄວາມດິຈິຕອນໄດ້ຖືກເອີ້ນວ່າໂດຍທົ່ວໄປແລ້ວ OCR ສໍາລັບການຮັບຮູ້ລັກສະນະທັດສະນະສາດ, ແລະມັນມີບັນຫາທີ່ຄ້າຍຄືກັນກັບການຮັບຮູ້ການປາກເວົ້າ. ວ່າແມ່ນການເວົ້າ, ຖ້າຫາກວ່າວັດຖຸດິບຢູ່ໃກ້ກັບທີ່ດີເລີດ, ຜົນຜະລິດຍັງສາມາດຢູ່ໃກ້ກັບທີ່ດີເລີດ.

ແຕ່ວ່າໃນການປະຕິບັດ, ການເຮັດວຽກທີ່ດີທີ່ສຸດໃນເວລາທີ່ກ່ຽວຂ້ອງກັບປັດໄຈນໍາເຂົ້າຈໍາກັດແລະ / ຫຼືໂດເມນຈໍາກັດ. ສໍາ​ລັບ​ຕົວ​ຢ່າງ, ມັນເປັນໄປໄດ້ທີ່ຈະຮັບຮູ້ຊື່ພາສາອັງກິດສໍາລັບການຈໍານວນແລະຊື່ຂອງຕົວເມືອງທີ່ສໍາຄັນປະເທດອັງກິດໄດ້, ໂດຍສະເພາະແມ່ນຖ້າຫາກວ່າທ່ານສາມາດໄດ້ຮັບປະຊາຊົນທີ່ຈະຂຽນຈົດຫມາຍແຕ່ລະຢູ່ໃນປ່ອງພຽງເລັກນ້ອຍຂອງຕົນເອງ. ຊອບແວດຽວກັນຈະບໍ່ມີຄວາມຊ່ຽວຊານໃນການຮັບມືກັບຊັນສູດສົບພາສາລັດເຊຍໃນການປາກເວົ້າຜູ້ທີ່ liked ປະກອບມີການຊື້ຂາຍສັນສະກິດໃນການຄັນຫມາກເຜັດຂຽນດ້ວຍລາຍມືຂອງຕົນ.

ເລື່ອງ handwriting

OCR ເຮັດວຽກທີ່ດີທີ່ສຸດມີອຸປະກອນການພິມຄຸນນະພາບສູງແລະຮ້າຍແຮງທີ່ສຸດຂອງທັງຫມົດທີ່ມີ handwriting, ດັ່ງນັ້ນທ່ານບໍ່ໄດ້ເລີ່ມຕົ້ນຈາກຕໍາແຫນ່ງທີ່ດີທີ່ສຸດ. ໃນປະສົບການຂອງຂ້າພະເຈົ້າ, ທ່ານພຽງແຕ່ສາມາດໄດ້ຮັບການຮັບຮູ້ handwriting ການເຮັດວຽກໄດ້ດີພຽງພໍໂດຍການເຮັດໃຫ້ມັນຢູ່ໃນທີ່ໃຊ້ເວລາທີ່ແທ້ຈິງ. ທີ່ເຮັດໃຫ້ທ່ານການຝຶກອົບຮົມຊອບແວໃນການຮັບຮູ້ການປ້ອນຂໍ້ມູນຂອງທ່ານ, ໃນຂະນະທີ່ຊອບແວຍັງໄດ້ຝຶກອົບຮົມທ່ານທີ່ຈະຂຽນຕົວອັກສອນໃນວິທີການທີ່ມັນສາມາດເຂົ້າໃຈ. ຂ້າພະເຈົ້າໄດ້ມີຜົນສໍາເລັດບາງຄົນທີ່ມີວິທີການນີ້, ເລີ່ມຕົ້ນຫຼາຍກ່ວາທົດສະວັດກ່ອນຫນ້ານີ້ມີ Microsoft OneNote (ທີ່ຍັງສາມາດບັນທຶກສຽງຂອງທ່ານໃນ sync) ເຮັດວຽກກ່ຽວກັບການ Windows XP Tablet Edition, ແລະບໍ່ດົນມານີ້ທີ່ມີ pen ດິຈິຕອນ Livescribe Echo ແລະ MyScript ຊອບແວ. ຢ່າງ​ໃດ​ກໍ​ຕາມ, ທັງຫມົດນີ້ມີຫຼາຍທີ່ຈະເຮັດແນວໃດກັບຍຸດທະສາດການທົດແທນແປ້ນພິມກ່ວາກັບ OCR.

ມັນຕົກລົງເຫັນດີໂດຍທົ່ວໄປທີ່ດີທີ່ສຸດໂຄງການ OCR ມີ ABBYY FineReader (£ 99) ແລະ ແຕກຕ່າງກັນຂອງ OmniPage 18 (£ 7999) ແລະ Ultimate (£ 16999), ເຖິງແມ່ນວ່າບໍ່ແມ່ນເຫມາະສົມສໍາລັບການຮັບຮູ້ cursive handwriting. ທັງສອງບໍລິສັດສະເຫນີສະບັບທົດລອງຟຣີດັ່ງນັ້ນທ່ານສາມາດທົດສອບໃຫ້ເຂົາເຈົ້າກ່ອນທີ່ທ່ານຈະ splash ອອກ. ມີຍັງ CharacTell ຂອງ SoftWriting ($49.95), ທີ່ບໍລິສັດເວົ້າວ່າສໍາລັບນັກສຶກສາການບັນທຶກຢູ່ໃນຫ້ອງຮຽນແລະປະກອບອາຊີບການບັນທຶກໃນກອງປະຊຸມ. ແຕ່ວ່າມັນຍັງເວົ້າວ່າມັນໄດ້ຖືກອອກແບບ "ສໍາລັບການຮັບຮູ້ handwriting ບໍ່, ການເຊື່ອມຕໍ່ແລະຂໍ້ຄວາມເຄື່ອງພິມ" (ເນັ້ນຫນັກໃສ່ການຂອງເຂົາເຈົ້າ) ດັ່ງນັ້ນຂ້າພະເຈົ້າຈະບໍ່ໄດ້ນັນກ່ຽວກັບມັນການອ່ານຂຽນຂໍ້ຄວາມຂອງທ່ານ.

ເຊັ່ນດຽວກັນກັບຫຼາຍທີ່ສຸດຖ້າຫາກວ່າບໍ່ບັນດາໂຄງການທັງຫມົດໃນພາກສະຫນາມນີ້, SoftWriting ມີຈະໄດ້ຮັບການຝຶກອົບຮົມເພື່ອຮັບຮູ້ handwriting ຂອງທ່ານ. ໃນເວລາທີ່ມັນແມ່ນການປຸງແຕ່ງເອກະສານ, ມັນຈະນໍາສະເຫນີທ່ານທີ່ມີຄໍາມັນບໍ່ໄດ້ຮັບຮູ້, ດັ່ງນັ້ນທ່ານສາມາດບອກໄດ້ວ່າມັນສິ່ງທີ່ເຂົາເຈົ້າມີ. ຖ້າຫາກວ່າທ່ານມີ 250 ຄໍາສັບຕ່າງໆກ່ຽວກັບຫນ້າທີ່ແລະໂຄງການມະຫັດສະຈັນໄດ້ຮັບ 90% ຂອງພວກເຂົາມີສິດ, ທ່ານຍັງຈະມີການແກ້ໄຂ 25 ຄໍາສັບຕ່າງໆ.

ຖ້າຫາກວ່າທ່ານຕ້ອງການທີ່ຈະພະຍາຍາມເປັນສອງສາມຫນ້າເປັນການທົດລອງ, ຫຼັງຈາກນັ້ນທ່ານສາມາດດາວນ໌ໂຫລດ FreeOCR ສໍາລັບ Windows, ເຖິງແມ່ນວ່າຈະລະມັດລະວັງບໍ່ໃຫ້ຕິດຕັ້ງ crapware ໃດທີ່ອາດຈະມີ. FreeOCR ແມ່ນອີງໃສ່ການນໍາໃຊ້ກັນຢ່າງກວ້າງຂວາງ Tesseract OCR ເຄື່ອງຈັກ, ຊຶ່ງການພັດທະນາເບື້ອງຕົ້ນໂດຍ Hewlett-Packard ໃນປະເທດອັງກິດໃນປີ 1980. HP ເຮັດໃຫ້ມັນເປີດແຫລ່ງທີ່ມາໃນ 2005, ແລະ ກູ​ໂກ ໃນປັດຈຸບັນຮັກສາລະຫັດທີ່ມາ.

ນອກນັ້ນທ່ານຍັງສາມາດນໍາໃຊ້ FreeOCR ອອນໄລນ໌ໂດຍການອັບໂຫຼດໄຟລ໌ PDF ກັບ free-ocr.com. ກູໂກ Docs ແລະບໍລິການຕ່າງໆກໍໄດ້ນໍາໃຊ້ເຄື່ອງຈັກໃນການ Tesseract OCR ດຽວກັນ.

ວິກິພີເດຍເຕືອນ ວ່າ "ຜົນຜະລິດ Tesseract ຈະມີຄຸນນະພາບທີ່ທຸກຍາກຫຼາຍຖ້າຫາກວ່າຮູບພາບປະກອບທີ່ຍັງບໍ່ໄດ້ preprocessed ໃຫ້ເຫມາະສົມກັບມັນ: ຮູບພາບ (ໂດຍສະເພາະແມ່ນ screenshots) ຕ້ອງໄດ້ຮັບການປັບໃຫ້ດີຂຶ້ນດັ່ງກ່າວວ່າຂໍ້ຄວາມ x, ລະດັບຄວາມສູງຢ່າງຫນ້ອຍ 20 pixels, ພືດຫມູນວຽນຫຼືງ່ຽງໃດຕ້ອງໄດ້ຮັບການແກ້ໄຂຫລືຂໍ້ຄວາມທີ່ບໍ່ມີຈະໄດ້ຮັບການຮັບການຍອມຮັບ, ການປ່ຽນແປງຕ່ໍາຄວາມຖີ່ໃນຄວາມສະຫວ່າງຈະຕ້ອງສູງຜ່ານການກັ່ນຕອງ, ຫຼືຂັ້ນຕອນຂອງການ binarization Tesseract ຂອງຈະທໍາລາຍຫຼາຍຂອງຫນ້າ, ແລະມີຊາຍແດນຕິດຊ້ໍາຕ້ອງໄດ້ຮັບການໂຍກຍ້າຍອອກດ້ວຍຕົນເອງ, ຫຼືພວກເຂົາຈະໄດ້ຮັບການຕີຄວາມຫມາຍຜິດເປັນລັກສະນະ. "

PDFs ແລະເຄື່ອງສະແກນ

ຂຽນຂໍ້ຄວາມຂອງທ່ານຈະມີຜົນປະໂຫຍດໃນຮູບແບບຂອງ Microsoft Word ເພາະວ່າທ່ານສາມາດເຮັດໄດ້ lots ຂອງສິ່ງທີ່ມີໃຫ້ເຂົາເຈົ້າ. ສໍາ​ລັບ​ຕົວ​ຢ່າງ, ທ່ານຈະສາມາດມີການປ່ຽນແປງອັກສອນໄດ້, ຂະຫນາດແລະສະຖານທີ່, ແກ້ໄຂແລະແກ້ໄຂບັນທຶກຂອງທ່ານ, ເພີ່ມປະກອບຮູບແຕ້ມ, ແລະ​ອື່ນໆ. ແຕ່ຍົກເວັ້ນທ່ານມີ neat ທີ່ສຸດ, handwriting ຈະແຈ້ງແລະສອດຄ່ອງທີ່ສຸດ, ທີ່ອາດຈະບໍ່ເປັນໄປໄດ້. ແທນທີ່ຈະເປັນ, ຄິດວ່າກ່ຽວກັບການແປງໃຫ້ເຂົາເຈົ້າຄຸນນະພາບສູງ, ໄຟລ໌ PDF ທີ່ສະແກນທີ່ທ່ານສາມາດເກັບຮັກສາໄວ້ໃນຮາດໄດຫຼືໃນການຟັງໄດ້.

ທ່ານສາມາດປ້ອນໄຟ PDF ກັບຊອບແວ OCR ແລະຫວັງວ່າມັນຈະໄດ້ຮັບຮູ້ຄໍາພຽງພໍທີ່ຈະເຮັດໃຫ້ບັນທຶກຂອງທ່ານທີ່ຄົ້ນຫາ. ຖ້າ​ບໍ່, ທ່ານອາດຈະມີໂຄດຄໍາສັ່ງໃຫ້ເຂົາເຈົ້າດ້ວຍຕົນເອງ. ທັງສອງວິທີ, ຖ້າຫາກວ່າຜູ້ໃດຜູ້ຫນຶ່ງບໍ່ມາເຖິງມີໂຄງການ OCR ທີ່ສາມາດອ່ານຂຽນດ້ວຍລາຍມືຂອງທ່ານ - ບໍ່ເປັນໄປບໍ່ໄດ້, ເຖິງແມ່ນວ່າຂ້າພະເຈົ້າໄດ້ລໍຖ້າແລ້ວ 30 ປີສໍາລັບການຫນຶ່ງ - ທ່ານຈະມີຄວາມພ້ອມກັບໄຟລ໌ PDF ແຫຼມ, ແທນທີ່ຈະກ່ວາຕົ້ນສະບັບ curling ບ່ອນທີ່ເອກະສານທີ່ມີອາຍຸແລະຫມຶກໄດ້ສູນຫາຍໄປ.

ແນ່​ນອນ, ຖ້າຫາກວ່າທ່ານກໍາລັງຈະສະແກນບັນທຶກຂອງທ່ານຫຼັງຈາກນັ້ນທ່ານແລ້ວຈະຕ້ອງມີເຄື່ອງສະແກນເນີ, ຫຼືໄດ້ຮັບການກະກຽມທີ່ຈະຊື້ຫນຶ່ງ. A ລາຄາຖືກ Epson ຫຼື Canon ສະແກນເນີພຽງຕຽງຄວນຈະໃຫ້ຜົນໄດ້ຮັບທີ່ດີ, ເຖິງແມ່ນວ່າມັນແມ່ນໃຊ້ເວລາທີ່ຈະສະແກນຢ່າງຫຼາຍຂອງການຫນ້າ. ຖ້າຫາກວ່າທ່ານຕັ້ງໃຈທີ່ຈະເຮັດຢ່າງຫຼາຍຂອງການສະແກນ, ພິຈາລະນາຮູບແບບເອກະສານ, ລິນຄື Brother ການໂຄສະນາ 2100 (ຈາກ£ 222). ນອກນັ້ນທ່ານຍັງສາມາດໄດ້ຮັບການສະແກນເນີທີ່ປະກອບມີ OCR, ເຊັ່ນ​ວ່າ Fujitsu ScanSnap iX500 Duplex (ຈາກ£ 352), ທີ່ສະແກນທັງສອງດ້ານຂອງເຈ້ຍໃນເວລາດຽວ. (ຊອບແວ OCR ສະແກນເນີຂອງປົກກະຕິແລ້ວທີ່ເນັ້ນໃສ່ PC ຂອງທ່ານ.)

ການບໍລິການສະແກນ

ຖ້າຫາກວ່າທ່ານມີການຊື້ເຄື່ອງສະແກນທີ່ມີກຽດແລະຊອຟແວ OCR ຄຸນນະພາບບາງທີອາດມີທີ່ດີສໍາລັບໂຄງການຫນຶ່ງໄປ, ເພີ່ມຂຶ້ນຄ່າໃຊ້ຈ່າຍແລະມັນແບ່ງອອກຈາກຈໍານວນຂອງຫນ້າຂອງການບັນທຶກໃນການຊອກຫາຄ່າໃຊ້ຈ່າຍຕໍ່ຫນ້າ. ມັນເປັນວຽກທີ່ເຈາະ, ດັ່ງນັ້ນບາງທີອາດທ່ານຄວນເພີ່ມຄ່າໃຊ້ຈ່າຍຂອງທີ່ໃຊ້ເວລາຂອງທ່ານ. ຜົນໄດ້ຮັບອາດຈະກະຕຸ້ນເຕືອນທ່ານໃຫ້ປະຖິ້ມຄວາມຄິດທັງຫມົດ, ຫຼືເລີ່ມຕົ້ນການຊອກຫາສໍາລັບບໍລິສັດເພື່ອເຮັດແນວໃດມັນສໍາລັບທ່ານ.

ຫຼາຍທີ່ສຸດຂອງບໍລິສັດທີ່ໃຫ້ບໍລິການ scanning ໃຫ້ຄວາມສໍາຄັນສໍາລັບທຸລະກິດທີ່ຈໍາເປັນຕ້ອງໄດ້ອະນາໄມທັນປະລິມານຂະຫນາດໃຫຍ່ຂອງການບັນທຶກເອກະສານ. ຢ່າງ​ໃດ​ກໍ​ຕາມ, ບາງໃຫ້ຄວາມສໍາຄັນສໍາລັບການຕ່ໍາປະລິມານແລະຜູ້ໃຊ້ທີ່ບ້ານ. ຕົວຢ່າງຫນຶ່ງແມ່ນ Oxford ທີ່ ສະແກນ Geeks, ທີ່ຄ່າບໍລິການ 25p ຕໍ່ຫນ້າສໍາລັບເອກະສານເຖິງ A3 ໃນຂະຫນາດ. (ຫນ້າຫນຶ່ງຫມາຍຄວາມວ່າຂ້າງຫນຶ່ງຂອງຫນ້າໃດຫນຶ່ງ.) ພວກເຂົາເຈົ້າສາມາດເຮັດໄດ້ OCR ("Capture Textual ຂໍ້ມູນ") ຄື​ກັນ. ໂດຍຫລັກການແລ້ວ, ຊອກຫາບໍລິສັດທ້ອງຖິ່ນທີ່ດີບ່ອນທີ່ທ່ານສາມາດລົງໄປບັນທຶກຂອງທ່ານຢ່າງປອດໄພແລະເກັບກໍາໃຫ້ເຂົາເຈົ້າຫລັງຈາກນັ້ນ.

ມັນເປັນເສັ້ນທາງທີ່ມີລາຄາແພງຖ້າຫາກວ່າທ່ານມີ lots ຂອງເຈ້ຍ: ມັນສາມາດມີລາຄາຖືກ£ 3,000 ສະແກນເນື້ອຫາຂອງຕູ້ເກັບເອກສານສີ່ລິ້ນຊັກ. ແຕ່ຖ້າຫາກວ່າທ່ານມີພຽງແຕ່ 100 ການ 500 ຫນ້າຂອງການບັນທຶກການສະແກນ, ມັນອາດຈະເປັນທາງເລືອກທີ່ດີທີ່ສຸດ.

guardian.co.uk ©​ຜູ້​ປົກ​ຄອງ News & Media Limited 2010

ຈັດ​ພີມ​ມາ​ໂດຍ​ຜ່ານ​ທາງ ຜູ້​ປົກ​ຄອງ News Feed plugin ສໍາ​ລັບ WordPress.

28996 0