ឧបត្ថម្ភដោយ Guardian.co.ukអត្ថបទ​មាន​ចំណង​ជើង​ថា​នេះ “តើខ្ញុំអាចបម្លែងភក្ដិកំណត់ត្រាកំណត់សរសេរដោយដៃរបស់ខ្ញុំដោយរបៀបចូលទៅក្នុងឯកសារពាក្យ?” ត្រូវ​បាន​សរសេរ​ដោយ​លោក Jack Schofield, សម្រាប់ theguardian.com ខែធ្នូកាលពីថ្ងៃទី 18 ថ្ងៃព្រហស្បតិ៍ 2014 16.19 UTC

ខ្ញុំមានបន្ទះជាច្រើននៃរថយន្ត A4 ភក្ដិកំណត់ត្រាកំណត់សរសេរដោយដៃ, ដែលខ្ញុំចង់បានដើម្បីបម្លែងទៅជាឯកសារ Microsoft Word. ដើម្បីវាយពួកគេនៅក្នុងការទាំងអស់នឹងត្រូវការពេលវេលាយូរណាស់. ខ្ញុំបានកត់សម្គាល់ឃើញថាសមត្ថភាពរបស់ Google ដើម្បីអានអត្ថបទពីរូបថតបានល្អប្រសើរច្រើនក្នុងរយៈពេលប៉ុន្មានខែចុងក្រោយនេះ. តើអ្នកមានបានដឹងអំពីឧបករណ៍មួយពី Google ឬនរណាម្នាក់ផ្សេងទៀតដែលអាចធ្វើការងារបានល្អនៃរឿងនេះ, សូម? លោក Michael

គំនិតនៃការបម្លែងដែលបានសរសេរឬបោះពុម្ពអត្ថបទទៅក្នុងអត្ថបទឌីជីថលត្រូវបានគេហៅជាទូទៅ OCR បានសម្រាប់ការទទួលស្គាល់តួអក្សរអុបទិក, ហើយវាមានបញ្ហាស្រដៀងគ្នាទៅនឹងទទួលស្គាល់ការនិយាយ. ថាគឺដើម្បីនិយាយ, ប្រសិនបើមានការបញ្ចូលជិតល្អឥតខ្ចោះ, លទ្ធផលអាចជាការជិតស្និទ្ធទៅកាន់ភាពល្អឥតខ្ចោះ.

ប៉ុន្តែនៅក្នុងការអនុវត្តជាក់ស្តែង, វាធ្វើការបានល្អបំផុតនៅពេលដែលការដោះស្រាយជាមួយនឹងវត្ថុធាតុរឹតបន្តឹងនិង / ឬដែនដែលបានកំណត់. ឧ​ទា​ហរ​ណ៏, វាជាការអាចធ្វើទៅបានក្នុងការទទួលស្គាល់ឈ្មោះជាភាសាអង់គ្លេសសម្រាប់លេខនិងឈ្មោះនៃទីក្រុងធំចក្រភពអង់គ្លេស, ជាពិសេសប្រសិនបើអ្នកអាចទទួលបានមនុស្សដើម្បីសរសេរលិខិតគ្នានៅក្នុងប្រអប់តិចតួចរបស់ខ្លួនផ្ទាល់. កម្មវិធីដូចគ្នានឹងមិនមានជំនាញដែនដើម្បីដោះស្រាយជាមួយនឹងការធ្វើសពវិភាគនិយាយភាសារុស្ស៊ីដែលចូលចិត្តដើម្បីរួមបញ្ចូលសម្រង់ពាក្យសំស្រ្កឹតក្នុងការពិនិត្យសាកសពសរសេរដោយដៃរបស់គាត់.

បញ្ហាការសរសេរដោយដៃ

OCR បានដំណើរការល្អបំផុតជាមួយនឹងសមា្ភារៈដែលបានបោះពុម្ពដែលមានគុណភាពខ្ពស់និងអាក្រក់បំផុតនៃការទាំងអស់ជាមួយនឹងការសរសេរដោយដៃ, ដូច្នេះអ្នកកំពុងមិនបានចាប់ផ្តើមពីទីតាំងល្អបំផុត. នៅក្នុងបទពិសោធរបស់ខ្ញុំ, អ្នកអាចទទួលបានការទទួលស្គាល់ការសរសេរដោយដៃតែទៅធ្វើការឱ្យបានគ្រប់គ្រាន់បានយ៉ាងល្អដោយការធ្វើវានៅក្នុងពេលវេលាពិតប្រាកដ. ដែលអនុញ្ញាតឱ្យអ្នកដើម្បីបណ្តុះបណ្តាកម្មវិធីដែលបានដើម្បីទទួលស្គាល់ការបញ្ចូលរបស់អ្នក, ខណៈពេលដែលកម្មវិធីនេះផងដែរហ្វឹកហាត់ឱ្យអ្នកសរសេរតួអក្សរនៅក្នុងវិធីដែលវាអាចយល់បាន. ខ្ញុំបានទទួលបានជោគជ័យមួយចំនួនជាមួយនឹងវិធីសាស្រ្តនេះ, ការចាប់ផ្តើមជាងមួយទសវត្សរ៍កន្លងមកជាមួយ OneNote ក្រុមហ៊ុន Microsoft (ផងដែរដែលអាចថតសំលេងរបស់អ្នកនៅក្នុងសមកាលកម្ម) កំពុងរត់នៅលើប្រព័ន្ធប្រតិបត្តិការ Windows XP ឧបករណ៍ Tablet បោះពុម្ពលើក, និងច្រើនបច្ចុប្បន្ននេះជាមួយនឹងការប្រើប៊ិចឌីជីថល Livescribe អេកូនិង MyScript ផ្នែកទន់. ទោះ​ជា​យ៉ាង​ណា, ទាំងអស់នេះមានច្រើនដែលត្រូវធ្វើជាមួយយុទ្ធសាស្រ្តជំនួសក្តារចុចជាជាងជាមួយ OCR បាន.

វាត្រូវបានព្រមព្រៀងគ្នាជាទូទៅថាកម្មវិធី OCR បានល្អបំផុតគឺមាន Abbyy FineReader (99 £) និង OmniPage nuances របស់ 18 (តំលៃ 79,99 £) និងជា Ultimate (169,99 £), បីជាមិនសមរម្យសម្រាប់ការទទួលស្គាល់ការសរសេរដោយដៃជាប់គ្នា. ក្រុមហ៊ុនទាំងពីរបានផ្តល់ជូននូវកំណែសាកល្បងឥតគិតថ្លៃដូច្នេះអ្នកអាចសាកល្បងពួកវាមុនពេលអ្នកប្រោះចេញ. មានផងដែរ SoftWriting CharacTell របស់ ($49.95), ដែលក្រុមហ៊ុននេះបាននិយាយថាគឺសម្រាប់សិស្សនិស្សិតនៅក្នុងថ្នាក់ទទួលយកកំណត់ត្រានិងអ្នកជំនាញទទួលយកកំណត់ត្រានៅក្នុងកិច្ចប្រជុំ. ប៉ុន្តែវាថែមទាំងនិយាយថាវាត្រូវបានរចនាឡើង "សម្រាប់ការទទួលស្គាល់ការសរសេរដោយដៃដែលមិនត្រូវបានតភ្ជាប់និងអត្ថបទម៉ាស៊ីនបោះពុម្ព" (ការផ្តោតសំខាន់របស់ពួកគេ) ដូច្នេះខ្ញុំនឹងមិនភ្នាល់លើការអានកំណត់ចំណាំសរសេរដោយដៃវារបស់អ្នក.

ដូចជាភាគច្រើនប្រសិនបើមិនមានកម្មវិធីទាំងអស់នៅក្នុងវាលនេះ, SoftWriting មានត្រូវបានទទួលការបណ្តុះបណ្តាលដើម្បីទទួលស្គាល់ការសរសេរដោយដៃរបស់អ្នក. នៅពេលដែលវាត្រូវបានដំណើរការឯកសារ, វានឹងបង្ហាញអ្នកជាមួយនឹងពាក្យវាមិនទទួលស្គាល់, ដូច្នេះអ្នកអាចប្រាប់វាអ្វីដែលពួកគេមាន. ប្រសិនបើ​អ្នក​មាន 250 ពាក្យនៅលើទំព័រមួយហើយកម្មវិធីនេះជាអព្ភូតហេតុទទួលបាន 90% នៃពួកគេនៅខាងស្ដាំ, អ្នកនឹងនៅតែមានដើម្បីកែ 25 ពាក្យ.

ប្រសិនបើអ្នកចង់សាកល្បងទំព័រមួយចំនួនមួយដែលជាការពិសោធន៍មួយ, បន្ទាប់មកអ្នកអាចទាញយក FreeOCR សម្រាប់ Windows, ទោះបីមានការប្រុងប្រយ័ត្នមិនឱ្យដំឡើង crapware ណាមួយដែលអាចត្រូវបានរួមបញ្ចូល. FreeOCR ត្រូវបានផ្អែកលើម៉ាស៊ីន tesseract OCR បានប្រើយ៉ាងទូលំទូលាយ, ដែលត្រូវបានបង្កើតឡើងដំបូងដោយក្រុមហ៊ុន Hewlett-Packard នៅប្រទេសអង់គ្លេសក្នុងឆ្នាំ 1980. ក្រុមហ៊ុន HP បានធ្វើឱ្យវាប្រភពបើកចំហនៅក្នុង 2005, និង ក្រុមហ៊ុន Google ឥឡូវរក្សាកូដប្រភព.

អ្នកអាចប្រើ FreeOCR អនឡាញដោយការផ្ទុកឯកសារ PDF ទៅ free-ocr.com. Google Docs និងសេវាកម្មជាច្រើនទៀតប្រើម៉ាស៊ីន tesseract OCR ដូចគ្នា.

វិគីភីឌាព្រមាន ថា "ទិន្នផល tesseract នឹងមានគុណភាពក្រីក្រខ្លាំងណាស់ប្រសិនបើរូបភាពបញ្ចូលមិនត្រូវបាន preprocessed ដើម្បីឱ្យសមវា: រូបភាព (ជាពិសេសរូបថតអេក្រង់) ត្រូវតែត្រូវបានធ្វើមាត្រដ្ឋានឡើងដូចជាថាអត្ថបទ X-កម្ពស់យ៉ាងហោចណាស់ 20 ភិ​ច​សែល, បង្វិលឬឆៀងណាមួយត្រូវតែត្រូវបានកែដំឬគ្មានអត្ថបទត្រូវបានទទួលស្គាល់, ការផ្លាស់ប្តូរនៅទាបប្រេកង់ខ្ពស់កម្រិតពន្លឺត្រូវតែត្រងឆ្លង, ឬដំណាក់កាល binarization tesseract នឹងបំផ្លាញច្រើននៃទំព័រ, និងការងងឹតព្រំដែនត្រូវយកចេញដោយដៃ, ឬពួកគេនឹងត្រូវបានបកស្រាយខុសថាជាតួអក្សរ "។

ឬជាឯកសារ PDF និងម៉ាស៊ីនស្កេន

ភក្ដិកំណត់ត្រាកំណត់សរសេរដោយដៃរបស់អ្នកនឹងមានច្រើនជាងនេះមានប្រយោជន៍ក្នុងទ្រង់ទ្រាយ Microsoft Word ដោយសារតែអ្នកអាចធ្វើរឿងជាច្រើនជាមួយពួកគេ. ឧ​ទា​ហរ​ណ៏, អ្នកអាចផ្លាស់ប្តូរលក្ខណៈអក្សរដែលបាន, ទំហំនិងគម្លាត, កែតម្រូវនិងការធ្វើវិសោធនកម្មចំណាំរបស់អ្នក, បន្ថែមនូវរឿងប្រៀបប្រដូច, ល​ល. ប៉ុន្តែលុះត្រាតែអ្នកមានការយ៉ាងខ្លាំងណាស់, ការសរសេរដោយដៃច្បាស់លាស់និងស្របណាស់, ដែលប្រហែលជានឹងមិនអាចធ្វើទៅបាន. ជំនួស, គិតអំពីការបម្លែងឱ្យពួកគេដែលមានគុណភាពខ្ពស់, ឯកសារ PDF ដែលបានស្កេនដែលអ្នកអាចរក្សាទុកនៅលើដ្រាយរឹងឬនៅក្នុងពពក.

អ្នកអាចចិញ្ចឹមឯកសារ PDF ទាំងនេះទៅកម្មវិធី OCR ហើយសង្ឃឹមថាវានឹងទទួលស្គាល់ពាក្យឱ្យបានគ្រប់គ្រាន់ដើម្បីធ្វើឱ្យកំណត់ត្រារបស់អ្នកអាចស្វែងរក. ប្រសិនបើមិនបាន, អ្នកនឹងប្រហែលជាមានការដាក់ស្លាកពួកវាដោយដៃ. តាមមធ្យោបាយណាមួយ, ប្រសិនបើនរណាម្នាក់មកឡើងជាមួយនឹងកម្មវិធី OCR ដែលអាចអានការសរសេរដោយដៃរបស់អ្នក - មិនអាចទៅរួចទេ, ទោះបីជាខ្ញុំបានរង់ចាំរួចទៅហើយ 30 ឆ្នាំសម្រាប់មួយ - អ្នកនឹងត្រូវបានត្រៀមខ្លួនជាស្រេចជាមួយនឹងឯកសារជា PDF មុត, ជាជាងដើម curling ដែលជាកន្លែងដែលក្រដាសដែលមានអាយុនិងទឹកថ្នាំបានរសាត់.

ជា​ការ​ពិត​ណាស់, ប្រសិនបើអ្នកកំពុងនឹងដើម្បីវិភាគរកកំណត់ចំណាំរបស់អ្នកបន្ទាប់មកអ្នកត្រូវតែមានម៉ាស៊ីនស្កេនមួយរួចទៅហើយ, ឬត្រូវបានរៀបចំដើម្បីទិញមួយ. មួយដែលមានតំលៃថោក ក្រុមហ៊ុន Epsonក្រុមហ៊ុន Canon ម៉ាស៊ីនស្កេនដែលមានគ្រែគួរផ្ទះល្វែងលទ្ធផលល្អផ្តល់ឱ្យ, ទោះបីជាវាគឺជាពេលវេលាដើម្បីវិភាគរកការប្រើប្រាស់ច្រើននៃទំព័រមួយ. ប្រសិនបើអ្នកចង់ធ្វើការជាច្រើននៃការស្កេនមួយ, ពិចារណាគំរូសន្លឹក-ចុកដូចជា បងប្រុសអេ-2100 (ពី 222 £). អ្នកអាចទទួលបានម៉ាស៊ីនស្កេនដែលរួមមាន OCR, ដូច​​​ជា​ការ Fujitsu បាន ScanSnap iX500 ពីរ (ពី 352 £), ដែលបានស្កេនភាគីទាំងពីរនៃក្រដាសក្នុងពេលតែមួយ. (កម្មវិធី OCR ម៉ាស៊ីនស្កេននេះបានរត់នៅលើកុំព្យូទ័រជាធម្មតារបស់អ្នក។)

ការផ្តល់សេវាការស្កេន

ប្រសិនបើអ្នកមានដើម្បីទិញម៉ាស៊ីនស្កេនសមរម្យនិងកម្មវិធី OCR ដែលមានគុណភាពប្រហែលជាល្អសម្រាប់គម្រោងមួយបិទ, បន្ថែមឡើងការចំណាយនិងចែកវាដោយចំនួននៃទំព័រនៃចំណាំដើម្បីស្វែងរកការចំណាយក្នុងមួយទំព័រ. វាជាការងារគួរឱ្យធុញ, ដូច្នេះប្រហែលជាអ្នកគួរតែបន្ថែមការចំណាយនៃពេលវេលារបស់អ្នក. លទ្ធផលនេះអាចជំរុញឱ្យអ្នកបោះបង់ចោលគំនិតទាំងអស់, ឬចាប់ផ្តើមសម្លឹងរកមើលក្រុមហ៊ុនមួយដើម្បីធ្វើវាសម្រាប់អ្នក.

ភាគច្រើននៃក្រុមហ៊ុនដែលផ្តល់នូវសេវាកម្មសម្រាប់អាជីវកម្មការស្កេន, ការផ្តល់ម្ហូបអាហារដែលត្រូវការជម្រះឆ្ងាយបរិមាណកំណត់ត្រាក្រដាស. ទោះ​ជា​យ៉ាង​ណា, មួយចំនួនផ្តល់លក្ខណៈតម្រូវសម្រាប់បរិមាណទាបនិងអ្នកប្រើនៅផ្ទះ. ឧទាហរណ៍មួយគឺត្រូវមានមូលដ្ឋាននៅសាកលវិទ្យាល័យ Oxford Geeks នៅស្កេន, ដែលយកកម្រៃសេវា 25p ក្នុងមួយទំព័រសម្រាប់ឯកសារឡើងទៅនៅក្នុងទំហំ A3. (ទំព័រមួយមានន័យថាម្ខាងនៃទំព័រមួយ។) ពួកគេអាចធ្វើ OCR ("ការចាប់យកទិន្នន័យជាអត្ថបទទិន្នន័យ") ដូច​​​គ្នា. តាមឧត្ដមគតិ, រកឃើញក្រុមហ៊ុនក្នុងស្រុកមួយដែលល្អដែលអ្នកអាចធ្លាក់ចុះបិទចំណាំរបស់អ្នកយ៉ាងមានសុវត្ថិភាពនិងប្រមូលពួកគេបន្ទាប់ពីនោះ.

វាជាផ្លូវដែលមានតម្លៃថ្លៃប្រសិនបើអ្នកមានច្រើននៃក្រដាស: វាអាចចំណាយអស់ 3000 នាក់£ដើម្បីវិភាគរកមាតិកានៃគណៈរដ្ឋមន្ត្រីចងក្រងថតនេះចំនួនបួន. ប៉ុន្តែប្រសិនបើអ្នកមានតែប៉ុណ្ណោះ 100 ទៅ 500 ទំព័រនៃចំណាំដើម្បីវិភាគ, វាអាចជាជម្រើសល្អបំផុត.

guardian.co.uk ©​អាណាព្យាបាល​ព័ត៌មាន & ប្រព័ន្ធ​ផ្សព្វផ្សាយ​លីមីត​ធី​ត 2010

បាន​ចេញ​ផ្សាយ​តាម​រយៈ អាណាព្យាបាល​ព័ត៌មាន​មតិ​ព័ត៌មាន កម្មវិធី​ជំនួយ សម្រាប់​ប្ល​ក​, រូបភាព.

29048 0