wikixmljを使用してwikipediaxmlダンプを解析していますが、次のエラーが発生します。
org.xml.sax.SAXParseException; lineNumber: 64243259; columnNumber: 371; JAXP00010004: The accumulated size of entities is "50,000,001" that exceeded the "50,000,000" limit set by "FEATURE_SECURE_PROCESSING".
at com.sun.org.apache.xerces.internal.parsers.AbstractSAXParser.parse(AbstractSAXParser.java:1239)
at edu.jhu.nlp.wikipedia.WikiXMLSAXParser.parse(WikiXMLSAXParser.java:58)
at edu.virginia.cs.wikirarchy.ParseWikiPage.run(ParseWikiPage.java:36)
at java.lang.Thread.run(Thread.java:745)
したがって、エラーのこの部分が主です。
エンティティの累積サイズは「50,000,001」であり、「FEATURE_SECURE_PROCESSING」で設定された「50,000,000」の制限を超えています。
私はこの問題の解決策を見つけることができません。
javaコマンドの実行中にさらに3つの引数を追加すると、問題が解決しました。
-DentityExpansionLimit = 2147480000 -DtotalEntitySizeLimit = 2147480000 -Djdk.xml.totalEntitySizeLimit = 2147480000
したがって、現在、次のコマンドを使用してコードを実行しています。
nohup java -DentityExpansionLimit = 2147480000 -DtotalEntitySizeLimit = 2147480000 -Djdk.xml.totalEntitySizeLimit = 2147480000 -Xmx16g -cp "lib/*。jar"-jardist / WikiRarchy.jar 32&
この問題は、デフォルトで安全な処理によってエンティティの数が50,000,000に制限され、この拡張制限がエンティティの拡張を制御するために発生していました。
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加