我正在尝试使用Computer Vision 2.0从PDF文件解析文本。我正在跟踪示例,并将MediaTypeHeaderValue更改为“ application / pdf”。我收到一个错误,指出不支持内容类型。我将其更改为“ multipart / form-data”,并在处理中出现错误。如何使用Computer-Vision处理PDF文件?
凯文(Kevin),您使用的是不支持PDF输入的旧版“ OCR” API。请使用作为“读取” API可用的新OCR技术-请参阅概述以处理PDF文档。自5月份起,GA中便已发布3.0版。Read支持大图像以及长达2000页的多页和混合语言文档。请参阅C#中的Read REST API快速入门。
请注意,如果您不仅要提取文本,还希望从表单提取布局见解(例如表格,复选框和键值对),使用预先构建的模型并构建自定义模型来处理文档,则Form Recognizer非常有用。现在在GA中。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句