使用Apache Tika解析iWorksDocument时出现问题

萨钦

我试图Apache Tika解析iWorksDoc但是我没有得到解析的内容,而是从内容处理程序中获取了一些其他输出。我已使用的代码段以及得到的输出添加在下面。

    private void parseFile(File file) {
    try{
        File file = new File("/home/user/tika/samples/budget.numbers");
        FileInputStream inputStream = new FileInputStream(file);
        ParseContext context = new ParseContext();
        BodyContentHandler bodyHandler = new BodyContentHandler(-1);
        Parser parser=new AutoDetectParser();
        parser.parse(inputStream, bodyHandler, new Metadata(), context);
        System.out.println("Contents of the file :"+bodyHandler.toString());
        }
        catch(IOException | SAXException | TikaException e){
            e.printStackTrace();
        }
}

输出 :-

Contents of the file :
Index/Document.iwa
Index/ViewState.iwa
Index/CalculationEngine.iwa
Index/Tables/HeaderStorageBucket-2.iwa
Index/Tables/Tile.iwa
Index/Metadata.iwa
Metadata/Properties.plist

我能够使用Detector api正确检测文件类型。但是没有从文档中获取有用的内容。请帮忙!

蒂姆·艾里森(Tim Allison)

Tika应该能够解析Numbers文档。如果您可以共享文档,请将其发布到我们的Jira当我看解析器时,我们可以更强大地处理名称空间,这可能是问题所在,但是没有文档我无法分辨。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

使用Apache Tika解析iWorksDocument时出现问题

来自分类Dev

使用GSON库解析JSON时出现问题

来自分类Dev

使用XMLStreamReader在Java中解析XML时出现问题

来自分类Dev

使用BeautifulSoup解析NBA Boxscore数据时出现问题

来自分类Dev

使用Curl下载HTML进行解析时出现问题

来自分类Dev

使用xPathAPI解析xml时出现问题

来自分类Dev

使用NodeJS解析JSON时出现问题

来自分类Dev

使用jsoup解析HTML表时出现问题

来自分类Dev

使用 Swift 从 API 解析 JSON 数据时出现问题

来自分类Dev

使用Apache Tika时出现NoSuchMethodError

来自分类Dev

安装 Apache (LAMP) 时出现问题

来自分类Dev

在Java中使用Apache Tika解析时,PDF项目符号会作为问号出现

来自分类Dev

使用Moment模块时出现问题

来自分类Dev

使用ArrayWritables时出现问题

来自分类Dev

使用ejs语法时出现问题

来自分类Dev

使用多个列表时出现问题

来自分类Dev

使用GLM时出现问题

来自分类Dev

使用JQuery Toggle时出现问题

来自分类Dev

使用SAP网站时出现问题

来自分类Dev

使用“清除”命令时出现问题

来自分类Dev

使用viewDidLayoutSubviews时出现问题

来自分类Dev

尝试使用cProfile时出现问题

来自分类Dev

使用 UISearchResults 过滤时出现问题

来自分类Dev

使用Text :: CSV在perl中解析CSV文件时出现问题

来自分类Dev

使用caffe解析器支持构建armNN时出现问题

来自分类Dev

使用俄罗斯字符解析字符串时出现问题

来自分类Dev

使用PHP解析文本文件时出现问题

来自分类Dev

使用Apache POI Scala编写值后,使用日期打开excel单元时出现问题

来自分类Dev

使用Apache POI在Java中读取/写入Excel文件时出现问题

Related 相关文章

热门标签

归档