我目前正在尝试从一些图像中读取文本,并且看来Google API跳过了一些0。
这是代码:
Google.Cloud.Vision.V1.Image image = Google.Cloud.Vision.V1.Image.FromFile(imagepath);
ImageAnnotatorClient client = ImageAnnotatorClient.Create();
IReadOnlyList<EntityAnnotation> response = client.DetectText(image);
string test = string.Empty;
foreach (EntityAnnotation annotation in response)
{
if (annotation.Description != null)
{
Console.WriteLine(annotation.Description);
test += Environment.NewLine + annotation.Description;
}
}
是否需要更改使其接受0的设置?
这也是
尝试1的输出:https : //pastebin.com/dNxRt7QK
results above
尝试2:https : //pastebin.com/XVZzmtTg
results above
尝试3:https : //pastebin.com/2kQMiC8h
results above
它确实擅长阅读所有内容,但实际上不喜欢读取0。死亡特别是尝试2/3。
为了获得更好的结果,建议不要使用有损格式(有损格式的示例:JPEG)。对于此类有损格式使用或减小文件大小可能会导致图像质量下降,从而导致Vision API准确性下降。
对于TEXT_DETECTION和DOCUMENT_TEXT_DETECTION功能,建议的图像尺寸为1024 x 768。作为附加说明:
视觉API要求图像必须足够大,以便可以轻松区分请求中的重要功能。小于或大于这些建议尺寸的尺寸可能会起作用。但是,较小的尺寸可能会导致较低的精度,而较大的尺寸可能会增加处理时间和带宽使用率,而不会在准确性方面带来可比的好处。用于OCR分析的图像尺寸不得超过75M像素(长x宽)。
上面讨论的项目可以在本文中找到。
使用您正在使用的代码,您可以交替使用DOCUMENT_TEXT_DETECTION功能,然后选择可以带来更好结果的功能。我看到您正在使用此链接中的TEXT_DETECTION代码。尝试将此链接中的代码用于DOCUMENT_TEXT_DETECTION。
如果采取建议的措施后问题仍然存在,建议您联系Google Cloud Platform支持或通过此链接创建公开问题。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句