使用矩形在iText中选择文本

用户名

这是使用Rectangle选择文档的一部分以从pdf文件中提取文本的“ iText in action”示例:

PdfReader reader = new PdfReader(pdf);
PrintWriter out = new PrintWriter(new FileOutputStream(txt));
Rectangle rect = new Rectangle(70, 80, 420, 500);
RenderFilter filter = new RegionTextRenderFilter(rect);
TextExtractionStrategy strategy;
for (int i = 1; i <= reader.getNumberOfPages(); i++) {
    strategy = new FilteredTextRenderListener(
     new LocationTextExtractionStrategy(), filter);
     out.println(PdfTextExtractor.getTextFromPage(reader, i, strategy));
}
out.flush();
out.close();

我不明白这些数字的含义(70、80、420、500)。通常,(70,80)是坐标,420是矩形的宽度,500是矩形的高度,但是我不确定比例尺,如何测量以及起点的确切位置。谁能为我解释一下或显示一些示例图片?

布鲁诺·洛瓦吉

在这种情况下,您有两个坐标:x = 70,y = 80是左下坐标;x = 420,y = 500是右上角坐标。PDF中使用的单位是“用户单位”。默认情况下,1个用户单位等于1点,但是一个用户可以使用该/UserUnit键更改默认值。正如mkl在其评论中指出的那样,MediaBox定义了页面大小。但是,您还可以使用一个CropBox来定义页面的可见区域(如果存在,CropBox应该始终小于MediaBox)。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

在命令提示符中选择矩形文本

来自分类Dev

使用iText在矩形中绘制可选文本

来自分类Dev

使用VIM在终端输出中选择文本

来自分类Dev

使用Vuetify在textField中选择文本

来自分类Dev

使用键盘在iTerm中选择文本

来自分类Dev

使用sed在Unix中选择文本

来自分类Dev

使用itext插入“链接的矩形”

来自分类Dev

使用jQuery(或javascript)从CSS选择器中选择文本

来自分类Dev

从文本中选择数字

来自分类Dev

如何在图像中选择合适的矩形?

来自分类Dev

如何在VIM中选择矩形范围?

来自分类Dev

如何在图像中选择合适的矩形?

来自分类Dev

在C ++中使用wxwidget使用可拖动矩形从图像中选择区域

来自分类Dev

在Google字体调用中选择性使用“文本”变量

来自分类Dev

使用FParsec从大量自由格式的文本中选择块

来自分类Dev

如何使用pyspark从python列表中选择随机文本值?

来自分类Dev

在Google字体调用中选择性使用“文本”变量

来自分类Dev

使用R从xml文件中选择特定文本

来自分类Dev

使用html5从图像中选择文本

来自分类Dev

在文件中选择文本,然后使用C#替换它

来自分类Dev

如何使用 jQuery 从 HTML 节点中选择文本内容?

来自分类Dev

仅从div中选择文本

来自分类Dev

从(网页)表中选择文本

来自分类Dev

在Tkinter中选择多个文本

来自分类Dev

在<span> onClick中选择文本

来自分类Dev

在editorState中选择特定的文本

来自分类Dev

在QTabBar中选择标签文本

来自分类Dev

在Tkinter中选择多个文本

来自分类Dev

在jQuery中选择特定的文本