Guardian.co.uk에 의해 구동라는 제목의이 문서 “어떻게 Word 문서로 내 필기 노트를 변환 할 수 있습니다?” 잭 스 코 필드에 의해 작성 되었습니다., 대한 theguardian.com 목요일 18 12 월 2014 16.19 UTC

나는 필기 노트의 많은 A4 패드가, 이는 내가 Microsoft Word 문서로 변환하고 싶습니다. 를 입력하기 위해 모두 매우 오랜 시간이 걸릴 것. 나는 사진에서 텍스트를 읽을 수있는 구글의 능력은 크게 최근 몇 달 동안 개선 된 것으로 나타났습니다. 당신이 좋은 일을 할 수있는 Google 또는 다른 사람에서 도구의 인식, 부디? 남자 이름

디지털 텍스트에 텍스트를 기입하거나 인쇄 변환 아이디어는 일반적으로 광학 문자 인식 OCR이라고, 그리고 음성 인식과 유사한 문제를 가지고. 즉 말하자면, 입력은 완벽에 가까운 경우, 출력은 또한 완벽에 가까운 수.

그러나 실제로는, 제한된 입력 및 / 또는 제한된 도메인을 처리 할 때 가장 잘 작동. 예를 들면, 그것은 숫자의 영어 이름과 영국의 주요 도시의 이름을 인식 할 수있어, 당신이 얻을 수있는 특히 사람들은 자신의 작은 상자에 각 문자를 작성하는. 같은 소프트웨어는 자신의 손으로 부검에서 산스크리트어 견적을 포함 좋아 러시아어를 구사하는 검시관에 대처하는 도메인 전문 지식이없는 것.

필기 문제

OCR은 필기와 모든 최악의 고품질 인쇄물에서 가장 잘 작동하고, 그래서 당신은 최고의 위치에서 시작하지 않는. 내 경험에, 당신은 실시간으로 수행하여 충분히 일 필기 인식을 얻을 수 있습니다. 즉, 입력을 인식 할 수있는 소프트웨어를 훈련 할 수 있습니다, 소프트웨어는 또한 당신을 훈련하면서 이해할 수있는 방법으로 문자를 작성하는. 나는이 방법에 약간의 성공을 했어, 마이크로 소프트 원 노트와 이상 10 년 전 시작 (또한 동기화 음성을 녹음 할 수있는) 윈도우 XP 태블릿 에디션에서 실행, 더 최근에 LIVESCRIBE 에코 디지털 펜과 MyScript를 소프트웨어. 그러나, 이 모든 OCR보다 키보드 교체 전략과 더있다.

일반적으로 가장 OCR 프로그램이 합의있어 ABBYY FineReader의 (£ 99) 과 뉘앙스의 OmniPage 방법 18 (£ 79.99) 및 Ultimate (£ 169.99), 둘 필기체 필기 인식에 적합하지 않지만. 당신이 밖으로 튀 전에 당신이 그들을 테스트 할 수 있도록 두 회사는 무료 평가판 버전을 제공. 도 있습니다 CharacTell의 SoftWriting ($49.95), 회의에 메모를 수업 시간에 노트를 학생 및 전문가를위한 어떤 회사가 말한다이다. 그러나 또한이 "비 접속 필기 및 기계 - 인쇄 된 텍스트를 인식하기위한"설계 말한다 (그들의 강조) 그래서 나는 당신의 필기 노트를 읽어 내기 않을 것.

이 분야에서 가장하지 않을 경우 모든 프로그램처럼, SoftWriting은 필기를 인식하도록 훈련되어야한다. 그 문서를 처리 할 때, 그것을 인식 할 수없는 단어를 발표 할 예정이다, 당신은 그들이 무엇을 말할 수 있도록. 당신이 가지고 있다면 250 페이지에서 단어와 프로그램은 기적적으로 도착 90% 그들의 권리, 당신은 여전히 ​​해결해야합니다 25 단어.

당신은 실험으로 몇 페이지를 시도 할 경우, 당신은 다운로드 할 수 있습니다 FreeOCR Windows 용, 하지만 포함될 수있는 crapware를 설치하지 않도록주의. FreeOCR는 널리 사용 정팔 포체 OCR 엔진에 근거, 이는 원래 1980 년대에 영국에서 휴렛 팩커드에 의해 개발되었다. HP가에 오픈 소스를 만든 2005, 과 구글 이제 소스 코드를 유지.

당신은 또한 온라인으로 PDF 파일을 업로드하여 FreeOCR을 사용할 수 있습니다 free-ocr.com. Google 문서 도구 등 다양한 서비스도 같은 정팔 포체 OCR 엔진을 사용.

위키 백과 경고 입력 이미지가 적합하도록 전처리되지 않은 경우 "라는 정팔 포체의 출력은 매우 불량 할 것이다: 이미지 (특히 스크린 샷) 텍스트 x 높이가 최소가되도록까지 확장 할 수 있어야합니다 20 픽셀, 어떤 회전 또는 왜곡은 수정해야하거나 텍스트가 인식되지 않습니다, 밝기의 낮은 주파수 변화는 필터링 하이 패스해야합니다, 또는 정팔 포체의 진화 단계는 페이지별로 파괴, 어두운 테두리 수동으로 제거해야합니다, 또는 그들은 문자로 잘못 해석 될 것입니다. "

PDF 및 스캐너

Your handwritten notes would be more useful in Microsoft Word format because you could do lots of things with them. 예를 들면, you could change the typeface, size and spacing, correct and amend your notes, add illustrations, 등등. But unless you have extremely neat, clear and very consistent handwriting, that probably won’t be possible. 대신, think about converting them to high-quality, scanned PDF files that you can store on a hard drive or in the cloud.

You can feed these PDF files to OCR software and hope that it will recognize enough words to make your notes searchable. 그렇지 않은 경우, you will probably have to tag them manually. 어느 쪽이든, if someone does come up with an OCR program that can read your handwriting – not impossible, though I’ve already waited 30 years for one – you will be ready with sharp PDF files, rather than curling originals where the paper has aged and the ink has faded.

물론, if you are going to scan your notes then you must already have a scanner, or be prepared to buy one. A cheap Epson 또는 Canon flat-bed scanner should give good results, though it is time-consuming to scan a lot of pages. If you intend to do a lot of scanning, consider a sheet-fed model like the Brother ADS-2100 (from £222). You can also get scanners that include OCR, 와 같은 Fujitsu ScanSnap iX500 Duplex (from £352), which scans both sides of the paper at once. (The scanner’s OCR software usually runs on your PC.)

Scanning services

If you have to buy a decent scanner and perhaps good quality OCR software for a one-off project, add up the cost and divide it by the number of pages of notes to find the cost per page. It’s a boring job, so perhaps you should add the cost of your time. The result might prompt you to abandon the whole idea, or start looking for a company to do it for you.

Most of the companies that provide scanning services cater for businesses that need to clear away large volumes of paper records. 그러나, some cater for low-volume and home users. One example is Oxford-based Scanning Geeks, which charges 25p per page for documents up to A3 in size. (One page means one side of a page.) They can do OCR (“Textual Data Capture”) 게다가. 이상적으로, find a good local company where you can drop off your notes securely and collect them afterwards.

It’s an expensive route if you have lots of paper: it could cost £3,000 to scan the contents of a four-drawer filing cabinet. But if you only have 100 에 500 pages of notes to scan, it could be the best option.

guardian.co.uk © 보호자 뉴스 & 미디어 제한 2010

를 통해 게시 가디언 뉴스 피드 플러그인 워드 프레스에 대한.

29049 0