OCR에서 인식 할 이미지가있는 일부 문서를 가져올 수 없습니다. 일부는 왜곡되어 있지만 특히 저해상도는 아니지만 Omnipage로도 OCR을 통해 얻을 수 없습니다. 예를 들어 하나를 업로드 했지만 (Omnipage를 위해 DOC에서 PDF로 변환) 더 많이 있습니다. OCR이 성공하려면 어떻게해야합니까?
화면에 보이는 방식에도 불구하고 텍스트 이미지의 해상도는 그리 높지 않습니다. PDF 뷰어에서보기를 확대하여 볼 수 있습니다. 이미지는 픽셀 화되고 모두 흑백이 아닙니다.
나는 pdfimages로 이미지를 추출했습니다. Gocr은 결과 .ppm 이미지에 대해 작업했지만 많은 오류가 발생했습니다. 단색 tiff로 변환 했음에도 불구하고 tesseract가 이미지 작업을 할 수 없었습니다.
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다