Freebaseのデータベースダンプをダウンロードしました。ファイルのフォーマットはrdfturtleです。すべてのデータをneo4jデータベースに取り込む必要があります。
私はすでにtinkerpop.blueprintsの助けを借りてインポーターを書きました。最初は機能しているように見えましたが、インポートの30分後に、rdfファイルに許可されていない位置に文字が含まれていたために例外が発生しました。少し後(調査の結果)、使用したイエナパーサー(RDFReader)は非推奨であり、使用すべきではないことがわかりました。
私が今知る必要があること:
そのrdfファイルをneo4jにインポートする方法はありますか?Jenaは、データを.ttl、.rdf、.ne、.jsonld、.owl、.trig、.nqの7つの異なるファイル形式に変換できます。
これらのファイル形式の1つ(または複数)のインポーターはありますか?
インポーターとは、ファイルをRDF
パラメーターとして渡すことができる実行可能ファイルを意味する場合、私が知る限り、いいえ。コードを書く必要がありますが、おそらくそれほど多くはありません。
最善の策は、Neo4j Linked Dataページ、特にNeo4jでのOWLに関するTurtleOntologiesとStefanieWiegandのインポートに関するMichaelBachによるブログ投稿を読むことです。
ブループリントについて言及しているので、SesameとSailの使用を検討することをお勧めします。Neo4jをトリプルストアとして扱い、Freebaseトリプルストアとの便利なインターフェイスの均一性を実現できるはずです。これがDBPediaダンプのインポートにどのように使用されるかの例については、dbpedia4neoを参照してください。状況は類似しているはずです。
ただし、Freebaseデータの解析に問題があることを示しています。データが破損している場合は、Neo4jとの対話方法に関係なく、それを処理する必要があります。私はModel
さまざまなプロジェクトで、デフォルトとオントロジーの両方のイエナを使って良い経験をしましたが、なぜそれらを使用すべきではないと思うのかわかりません。必要なのは、まったく新しいアプローチではなく、すでに作成したインポーターを微調整することである可能性はありますか?
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加