Neo4j、Cypherコマンドによるバルクロード

debugcn 投稿 Dev

zakmck：

私はNeo4jを初めて使用するので、基本について理解していないことがあります。

Javaには多くのオブジェクトがあり、それらを使用して、JavaドライバーとCypherを使用し、Neo4jグラフにデータを取り込みます。私のコードは次のように機能します：

// nodes
for ( Person person: persons )
  session.run ( String.format ( 
    "CREATE ( :Person { id: '%s', name: \"%s\", surname: \"%s\" })",
    person.getId(), person.getName(), person.getSurname ()
  ));

// relations
session.run ( "CREATE INDEX ON :Person(id)" );

for ( Friendship friendship: friendships )
  session.run ( String.format ( 
    "MATCH ( from:Person { id: '%s' } ), ( to:Person { id: '%s' } )\n" +
    "CREATE (from)-:KNOWS->(to)\n",
    friendship.getFrom().getId(), 
    friendship.getTo().getId() 
  ));

（確かに、少し複雑です。ノードタイプが12個あり、リレーションタイプの数はほぼ同じです）。

現在、これは非常に遅く、300kのノードと1Mの関係をロードするのに1時間以上かかる（Neo4jが12 / 16GBのRAMを使用するかなり高速のMacBookProで）。

私はそれを間違った方法でやっていますか？代わりにバッチインサーターを使用する必要がありますか？（ネットワーク経由でgraphDBにアクセスできるようにしたいと思います）。より多くの挿入を1つのトランザクションにグループ化することで何かを得られますか？（ドキュメントから、トランザクションはロールバックと分離のニーズにのみ役立つようです）。

SJC：

私はPythonでNeo4jから来ていますが、ここでの問題はCypherコマンドにあると思います。2つの提案があります。

エッジを個別に一致させる方が高速な場合があります。私のプリミティブベンチマークでは、24ミリ秒と15ミリ秒の違いがこれでわかります（編集：このベンチマークは疑わしいです）。

MATCH ( from:Person { id: '%s' } )
MATCH ( to:Person { id: '%s' } )
CREATE (from)-:KNOWS->(to)

別のオプションは、巻き戻しを使用することです。これをBOLTインターフェースと一緒に使用して、より少ないトランザクションを送信しますが、Batch Inserterを使用しません。私がここにコピーしているPythonの実装は許してください。うまくいけば、これをJavascript Neo4j Driverのドキュメントと一緒に見て変換できます。

payload = {"list":[{"a":"Name1","b":"Name2"},{"a":"Name3","b":"Name4"}]}

statement = "UNWIND {list} AS d "
statement += "MATCH (A:Person {name: d.a}) "
statement += "MATCH (B:Person {name: d.b}) " 
statement += "MERGE (A)-[:KNOWS]-(B) "

tx = session.begin_transaction()
tx.run(statement,payload)
tx.commit()

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-04-6

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

Neo4j、Cypherコマンドによるバルクロード

Neo4j、Cypherコマンドによるバルクロード

トラバーサルブランチの最初のnノードに一致するNeo4j / Cypher

cypher-shell neo4jコマンドを使用してターミナルから暗号スクリプトファイルを実行するにはどうすればよいですか？

Neo4j Cypher は、関連するノード (ID) の正確なコレクションによってエンティティを見つけます

neo4j goドライバーを使用したneo4jコードのコンパイルに関する問題

neo4j cypher、ノードを検索し、IDによる関係です

Neo4jのコレクションメンバーによる注文

Neo4j /パスの中心にあるCypherノード

Neo4j / Cypher-指定された親にのみリンクするノードを検索します

同じコミュニティのノードをNeo4jのCypherとマージする方法は？

Neo4j Cypher：重複ノードをマージ

cypher neo4j - ノードのグループを集める

Cypherを使用してneo4jの2つのクローンノードのノードを削除する方法

neo4j cypherのノードラベルで結果をフィルタリングする方法は？

neo4j：「CREATEDATABASE」のようなneo4jのようなコマンドはありますか

Neo4j：バッチでメモリにロード

大きなデータセットに対するNeo4jのMERGEコマンド

Neo4jアンマネージド拡張機能-カスタムリクエストフィルターをWebサーバーに追加

Neo4j Cypherクエリ（Javaによる）埋め込みモードの実行中にエラーが発生しました

Neo4j Cypher：ノードをブール値に「キャスト」するにはどうすればよいですか？

cypher（neo4j）のJavaストアドプロシージャからのyield値を無視するにはどうすればよいですか？

正しいノードおよびそれに関連するその他の情報を取得するためのCypher / Neo4jクエリ

カスタムログバック設定をneo4jアンマネージド拡張機能に追加します

Cypher Neo4jの他の小道具によってノードの小道具から値をグループ化する方法は？

CassandraデータをTitan / Neo4Jにロードする

大きなcsvファイルをNeo4jにロードする方法

Neo4J Cypher：各ノードの属性/プロパティがクエリに一致した数をカウントします

Neo4j / CYPHER：ノード、その関係、およびターゲットノードからいくつかのプロパティを効率的にクエリするにはどうすればよいですか？

Neo4J Cypherクエリのパスからノードのみを取得するにはどうすればよいですか？

ロードに時間がかかる Neo4j