Guardian.co.uk द्वारा संचालितशीर्षक यो लेख “शब्द कागजातमा म कसरी मेरो हस्तलिखित टिप्पणीहरू रूपान्तरण गर्न सक्छौं?” ज्याक Schofield द्वारा लेखिएको थियो, लागि बिहीबार 18 औं डिसेम्बर theguardian.com 2014 16.19 UTC

म हस्तलिखित टिप्पणीहरू धेरै A4 पैड छ, जो म माइक्रोसफ्ट वर्ड कागजातमा रूपान्तरण गर्न चाहनुहुन्छ. तिनीहरूलाई टाइप गर्न सबै मा एक धेरै लामो समय लिनेछ. फोटो पाठ पढ्न गुगल क्षमता व्यापक हाल महिनामा सुधार भएको छ कि मैले देखे गर्नुभएको. तपाईं यो एक राम्रो काम गर्न सक्छन् कि गुगल वा अरू कसैलाई देखि एक उपकरण सचेत हुनुहुन्छ, कृपया? माइकल

डिजिटल पाठ मा पाठ लिखित वा मुद्रित रूपान्तर को विचार ओसीआर साधारण अप्टिकल क्यारेक्टर पहिचान लागि भनिन्छ, र यो वाणी पहिचान समान समस्या छ. त्यो भन्नु पर्ने हो, इनपुट परिपूर्ण नजिक छ भने, उत्पादन पनि परिपूर्ण नजिक हुन सक्नुहुन्छ.

तर व्यवहार मा, जब प्रतिबन्धित आदानों र / वा सीमित डोमेन सामना गर्ने यो भन्दा राम्रो काम गर्दछ. उदाहरणका लागि, यो संख्या लागि अंग्रेजी नाम र प्रमुख बेलायत शहर को नाम पहिचान गर्न सम्भव छ, तपाईं प्राप्त गर्न सक्छन्, विशेष गरी यदि मानिसहरूले यसका आफ्नै सानो बक्स मा प्रत्येक पत्र लेख्न. एउटै सफ्टवेयर आफ्नो हस्तलिखित autopsies मा संस्कृत कोटेशन समावेश गर्न मन पराएका गर्ने रूसी भाषा बोल्ने कोरोनर सामना गर्न डोमेन विशेषज्ञता छैन होला.

हस्तलेखन मामिलामा

ओसीआर हस्तलेखन संग र उच्च गुणस्तरीय मुद्रित सामाग्री राम्रो काम गर्दछ सबै को खराब, त्यसैले तपाईं सबै भन्दा राम्रो स्थिति बाट सुरु गरिरहनु भएको छैन. मेरो अनुभव मा, तपाईं मात्र वास्तविक समयमा यो गरेर राम्रो पर्याप्त काम गर्न हस्तलिपि पहिचान प्राप्त गर्न सक्छन्. त्यो आफ्नो आगत पहिचान गर्न सफ्टवेयर तालिम गर्न मदत गर्छ, सफ्टवेयर पनि गाडिहरु गर्दा यो बुझ्न गर्न सक्ने तरिकामा वर्ण लेख्न. म यो दृष्टिकोण केही सफलता थियो गर्नुभएको, माइक्रोसफ्ट OneNote संग अधिक एक दशक पहिले सुरु (जो पनि सिंक आफ्नो आवाज रेकर्ड गर्न सक्नुहुन्छ) Windows XP गोली संस्करण चलिरहेको, र एक Livescribe इको डिजिटल कलमले थप हालै र MyScript सफ्टवेयर. तथापि, यो सबै ओसीआर भन्दा किबोर्ड प्रतिस्थापन रणनीति संग गर्न थप छ.

यो सामान्यतया सबै भन्दा राम्रो ओसीआर कार्यक्रम हो कि सहमत गर्नुपर्छ Abbyy FineReader (£ 99) र Nuance गरेको OmniPage 18 (£ 79,99) र परम (£ 169,99), न cursive हस्तलिपि पहिचान लागि उपयुक्त छ हुनत. तपाईं बाहिर छप अघि तपाईंले तिनीहरूलाई परीक्षण गर्न सक्छ त दुवै कम्पनीहरु निःशुल्क परीक्षण संस्करण प्रस्ताव. त्यहाँ पनि छ CharacTell गरेको SoftWriting ($49.95), जो कम्पनी भन्छन् वर्ग टिप्पणीहरू लिएर विद्यार्थी र व्यवसायीक सभाहरूमा टिप्पणीहरू लिनका लागि हो. तर यो पनि यसलाई "गैर-जडित हस्तलेखन र मिसिन-छापिएको पाठ चिनन लागि" डिजाइन गरिएको छ भन्छन् (आफ्नो जोड) त्यसैले म यो आफ्नो हस्तलिखित टिप्पणीहरू पढ्दा मा शर्त छैन.

यस क्षेत्र सबैभन्दा भने सबै कार्यक्रम जस्तै, SoftWriting आफ्नो हस्तलिपि पहिचान गर्न प्रशिक्षित गर्न छ. जब यो कागजात प्रक्रियामा छ, यो पहिचान गर्दैन शब्दहरू तपाईंलाई प्रस्तुत हुनेछ, तपाईं यसलाई बताउन तिनीहरूले के हुन् सक्छ भनेर. यदि 250 एक पृष्ठमा शब्द र कार्यक्रम चमत्कारपूर्ण ढङ्गमा हुन्छ 90% तिनीहरू सही, तपाईं अझै पनि सच्याउन हुनेछ 25 शब्द.

तपाईं एउटा प्रयोग रूपमा केही पृष्ठहरू प्रयास गर्न चाहनुहुन्छ भने, त्यसपछि तपाईं डाउनलोड गर्न सक्छन् FreeOCR Windows को लागि, हुनत समावेश हुन सक्छ कि कुनै पनि crapware स्थापना गर्न होसियार हुन. FreeOCR को व्यापक प्रयोग TesseracT OCR इन्जिन मा आधारित छ, जो मूल 1980 को दशक मा बेलायतमा हेवलेट-पैकार्ड विकास भएको थियो. हिमाचल प्रदेश मा खुला स्रोत गरे 2005, र गुगल अब स्रोत कोड राख्छ.

तपाईं पनि अनलाइन गर्न PDF फाइलहरू अपलोड गरेर FreeOCR प्रयोग गर्न सक्नुहुन्छ free-ocr.com. Google कागजात र अन्य विभिन्न सेवाहरू पनि एउटै TesseracT OCR इन्जिन प्रयोग.

विकिपीडिया यस्तो चेतावनी दिन्छ इनपुट तस्बिरहरू यो अनुरूप पूर्वप्रक्रियागरिएको छैन भने "भनेर TesseracT गरेको उत्पादन धेरै गरिब गुणस्तर हुनेछ: तस्बिरहरू (विशेष गरी स्क्रिनशट) माथि यस्तो आरोहण हुनुपर्छ पाठ एक्स-उचाइ कम्तिमा छ कि 20 पिक्सेल, कुनै पनि परिक्रमा वा बाङ्गो सही हुनुपर्छ वा कुनै पाठ पहिचान गरिनेछ, चमक मा कम आवृत्ति परिवर्तन फिल्टर उच्च-पास हुनुपर्छ, वा TesseracT गरेको binarization चरण पृष्ठ को धेरै नष्ट हुनेछ, र गाढा सीमाना स्वयं हटाउन पर्छ, वा तिनीहरूले वर्ण रूपमा गलत व्याख्या गरिनेछ। "

PDF हरू र स्क्यानरहरू

तपाईं तिनीहरूलाई संग कुरा धेरै गर्न सक्थे किनभने तपाईंको हस्तलिखित टिप्पणीहरू माइक्रोसफ्ट वर्ड ढाँचामा बढी उपयोगी हुनेछ. उदाहरणका लागि, तपाईं टाइपफेस परिवर्तन गर्न सकेन, आकार र दूरी, ठीक र आफ्नो टिप्पणीहरू संशोधन, दृष्टान्तहरू थप्न, र यति मा. तर तपाईं एकदमै चिटिक्क जबसम्म, स्पष्ट र धेरै लगातार हस्तलेखन, कि शायद सम्भव छैन. सट्टा, उच्च गुणस्तरीय तिनीहरूलाई रूपान्तरण बारेमा विचार, तपाईं एक हार्ड ड्राइभमा वा क्लाउडमा भण्डारण गर्न सक्ने स्क्यान गरिएको PDF फाइलहरू.

तपाईं OCR सफ्टवेयर यी PDF फाइलहरू खुवाउन र आफ्नो टिप्पणीहरू खोज गर्न पर्याप्त शब्द पहिचान हुनेछ भन्ने आशा गर्न सक्नुहुन्छ. भने, तपाईं शायद स्वयं उनलाई ट्याग गर्न हुनेछ. या त बाटो, यदि कसैले एउटा OCR कार्यक्रम तपाईंको हस्तलेखन पढ्न सक्नुहुन्छ साथ आउँछन् - असम्भव छैन, म पहिले नै पर्खेको छु हुनत 30 एक लागि वर्ष - तपाईं तेज PDF फाइलहरू साथ तयार हुनेछ, बरु कर्लिंग मूलहरू जहाँ कागज बर्ष छ र मसी फिक्का छ भन्दा.

पक्कै, तपाईं आफ्नो टिप्पणीहरू स्क्यान गर्न जाँदै हुनुहुन्छ भने त तपाईं पहिले नै एउटा स्क्यानर हुनुपर्छ, वा एक किन्न तयार. एक सस्तो Epson वा Canon समतल-ओछ्यानमा स्क्यानर राम्रो परिणाम दिनुपर्छ, यो छ हुनत पृष्ठ को धेरै स्क्यान गर्न समय-खपत. तपाईं स्क्यानिङ धेरै गर्न अभिप्राय यदि, जस्तै एउटा पाना-खुवाउनुभयो मोडेल विचार भाइ विज्ञापन-2100 (£ 222 देखि). तपाईं पनि OCR समावेश स्क्यानरहरू प्राप्त गर्न सक्छन्, जस्तै Fujitsu ScanSnap iX500 द्वैध (£ 352 देखि), जो एकैचोटि कागज दुवै पक्षलाई स्कैन. (यो स्क्यानर गरेको OCR सफ्टवेयर सामान्यतया आफ्नो पीसी मा चल्छ।)

सेवाहरू स्क्यान

तपाईं एक-बन्द परियोजनाको लागि एक सभ्य स्क्यानर र सायद राम्रो गुणस्तर OCR सफ्टवेयर किन्न छ भने, लागत नपुगेको र प्रति पृष्ठ लागत पत्ता लगाउन टिप्पणीहरू पृष्ठ संख्या गरेर विभाजित. यो एक नीरस अय्यूबको, त्यसैले सायद तपाईं आफ्नो समय को लागत थप्न गर्नुपर्छ. परिणाम तपाईं सारा विचार त्याग्न गर्न संकेत हुन सक्छ, वा कम्पनी लागि यो गर्न को लागि देख सुरु.

कि स्क्यानिङ सेवाहरू प्रदान कम्पनीहरु को सबै भन्दा कागज रेकर्ड टाढा ठूलो मात्रा खाली गर्न आवश्यक छ कि व्यवसायीहरूको लागि खानपानको प्रबन्ध गर्नु. तथापि, केही कम मात्रा र घर प्रयोगकर्ताहरूको लागि खानपानको प्रबन्ध गर्नु. एउटा उदाहरण अक्सफोर्ड-आधारित छ स्क्यान Geeks, जो प्रति पृष्ठ 25p कागजातहरू लागि आकार मा A3 सम्म शुल्क. (एक पृष्ठ अर्थ पृष्ठको एक छेउमा।) तिनीहरूले OCR गर्न सक्नुहुन्छ ("पाठ डाटा क्याप्चर") साथै. आदर्श, जहाँ तपाईं सुरक्षित बन्द तपाईंको टिप्पणीहरू ड्रप गर्न सक्नुहुन्छ राम्रो स्थानीय कम्पनी फेला पार्न र तिनीहरूलाई पछि सङ्कलन.

तपाईं कागज धेरै छ भने यो एक महंगा मार्ग हो: यो चार-दराज फाइल कैबिनेट सामग्रीहरू स्क्यान गर्न खर्च सक्छ £ 3,000. तर तपाईं मात्र छ भने 100 गर्न 500 स्क्यान गर्न टिप्पणीहरू पृष्ठ, यो सबै भन्दा राम्रो विकल्प हुन सक्छ.

guardian.co.uk © संरक्षक समाचार & मीडिया लिमिटेड 2010

यस मार्फत प्रकाशित संरक्षक News Feed प्लगइन WordPress लागि.

29027 0