解释ElasticSearch内存不足错误

cpplearner 发表于 Dev

Cpp学习者

首先，这是一个两个节点的群集，每个群集都带有“ -Xms256m -Xmx1g -Xss256k”（考虑到计算机的8G容量，这确实很糟糕）。

[2015-04-07 16:19:58,235][INFO ][monitor.jvm              ] [NODE1] [gc][ParNew][3246454][64605] duration [822ms], collections [1]/[4.3s], total [822ms]/[21m], memory [966.1mb]->[766.9mb]/[990.7mb], all_pools {[Code Cache] [13.1mb]->[13.1mb]/[48mb]}{[Par Eden Space] [266.2mb]->[75.6mb]/[266.2mb]}{[Par Survivor Space] [8.9mb]->[0b]/[33.2mb]}{[CMS Old Gen] [690.8mb]->[691.2mb]/[691.2mb]}{[CMS Perm Gen] [33.6mb]->[33.6mb]/[82mb]}
[2015-04-07 16:28:02,550][WARN ][transport.netty          ] [NODE1] exception caught on netty layer [[id: 0x03d14f1c, /10.0.6.100:36055 => /10.0.6.105:9300]]
java.lang.OutOfMemoryError: Java heap space
        at org.apache.lucene.util.PriorityQueue.initialize(PriorityQueue.java:108)
        at org.elasticsearch.search.controller.ScoreDocQueue.<init>(ScoreDocQueue.java:32)
....
[2015-04-07 21:55:54,743][WARN ][transport.netty          ] [NODE1] exception caught on netty layer [[id: 0xeea0018c, /10.0.6.100:36059 => /10.0.6.105:9300]]
java.lang.OutOfMemoryError: Java heap space
[2015-04-07 21:59:26,774][WARN ][transport.netty          ] [NODE1] exception caught on netty layer [[id: 0x576557fa, /10.0.6.100:36054 => /10.0.6.105:9300]]
...
[2015-04-07 22:51:05,890][WARN ][transport.netty          ] [NODE1] exception caught on netty layer [[id: 0x67f11ffe, /10.0.6.100:36052 => /10.0.
6.105:9300]]
org.elasticsearch.common.netty.handler.codec.frame.TooLongFrameException: transport content length received [1.5gb] exceeded [891.6mb]
[2015-04-07 22:51:05,973][WARN ][cluster.action.shard     ] [NODE1] sending failed shard for [test_index][15], nod
e[xvpLmlJkRSmZNj-pa_xUNA], [P], s[STARTED], reason [engine failure, message [OutOfMemoryError[Java heap space]]]

然后重新加入后（我重新启动了节点105）

[2015-04-07 22:59:11,095][INFO ][cluster.service          ] [NODE1] removed {[NODE2][GMBDo5K7RMGSgiIwZE7H8w][inet[/10.0.6.105:9300]],}, reason: zen-disco-node_failed([NODE7][GMBDo5K7RMGSgiIwZE7H8w][inet[/10.0.6.105:9300]]), reason transport disconnected (with verified connect)
[2015-04-07 22:59:30,954][INFO ][cluster.service          ] [NODE1] added {[NODE2][mMWcFGhVQY-aBR2r9DO3_A][inet[/10.0.6.105:9300]],}, reason: zen-disco-receive(join from node[[NODE7][mMWcFGhVQY-aBR2r9DO3_A][inet[/10.0.6.105:9300]]])
[2015-04-07 23:11:39,717][WARN ][transport.netty          ] [NODE1] exception caught on netty layer [[id: 0x14a605ce, /10.0.6.100:36201 => /10.0.6.105:9300]]
java.lang.OutOfMemoryError: Java heap space
[2015-04-07 23:16:04,963][WARN ][transport.netty          ] [NODE1] exception caught on netty layer [[id: 0x5a6d934d, /10.0.6.100:36196 => /10.0.6.105:9300]]
java.lang.OutOfMemoryError: Java heap space

因此，我不知道如何解释“>”部分。谁真的出了内存？NODE 1（10.0.6.100）？为什么要使用9300端口？我的API最初与NODE1进行通信，因此在这种情况下，这是否意味着NODE1向NODE2发送了批量数据请求？这是第二天发生的事情

从NODE1日志：

[2015-04-08 09:02:46,410][INFO ][cluster.service          ] [NODE1] removed {[NODE2][mMWcFGhVQY-aBR2r9DO3_A][inet[/10.0.6.105:9300]],}, reason: zen-disco-node_failed([NODE2][mMWcFGhVQY-aBR2r9DO3_A][inet[/10.0.6.105:9300]]), reason failed to ping, tried [3] times, each with maximum [30s] timeout
[2015-04-08 09:03:27,554][WARN ][search.action            ] [NODE1] Failed to send release search context
org.elasticsearch.transport.NodeDisconnectedException: [NODE2][inet[/10.0.6.105:9300]][search/freeContext] disconnected
....
Caused by: org.elasticsearch.transport.NodeNotConnectedException: [NODE2][inet[/10.0.6.105:9300]] Node not connected

但是在NODE2日志上，从04-08开始只有几行，但是像这样：

[2015-04-08 09:09:13,797][INFO ][discovery.zen            ] [NODE2] master_left [[NDOE1][xvpLmlJkRSmZNj-pa_xUNA][inet[/10.0.6.100:9300]]], reason [do not exists on master, act as master failure]

那么到底谁失败了？我在这里很困惑：| 对不起。任何帮助表示赞赏。我知道NODE1的GC非常长（MarkSweep超过3小时，直到昨晚我的两节点集群完全重新启动）。

以利亚

日志的第一部分涉及Elasticsearch Garbage Collection日志记录格式

[2015-04-07 16:19:58,235][INFO][monitor.jvm][NODE1]

垃圾收集运行
```
[gc] 
```
新的并行垃圾收集器
```
[ParNew]
```
GC用了822ms
```
duration [822ms], 
```
一次收集运行，总共需要4.3秒
```
collections [1]/[4.3s]
```
池“内存”的使用数量，以前是966.1mb，现在是766.9mb，总池大小为990.7mb
```
memory [966.1mb]->[766.9mb]/[990.7mb], 
```
池“代码缓存”的使用次数
```
[Code Cache] [13.1mb]->[13.1mb]/[48mb]
```

游泳池“ Par Eden Space”的使用次数

[Par Eden Space] [266.2mb]->[75.6mb]/[266.2mb]

池“ Par Survivor Space”的使用次数

[Par Survivor Space] [8.9mb]->[0b]/[33.2mb]

“ CMS Old Gen”池的使用次数

[CMS Old Gen] [690.8mb]->[691.2mb]/[691.2mb]

“ CMS Perm Gen”池的使用次数

[CMS Perm Gen] [33.6mb]->[33.6mb]/[82mb]

如果您已经注意到您的内存池将近1G。我希望这会给您提示！

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-20

我来说两句

0条评论

登录后参与评论

上一篇：我如何更改我的waitDriver以克服`StaleElementReferenceException：stale element reference：元素未附加到页面文档`

来自分类Dev

getDrawable（）的内存不足错误

来自分类Dev

Fontconfig错误-“内存不足”

来自分类Dev

mysql内存不足错误

来自分类Dev

NetBeans内存不足错误

来自分类Dev

Fontconfig错误-“内存不足”

来自分类Dev

ConnectionQueueStatsProvider的内存不足错误

来自分类Dev

ShowCaseView内存不足错误

来自分类Dev

内存不足错误 imageview

来自分类Dev

Android Studio内存不足错误ViewFlipper

来自分类Dev

SQLite游标错误：内存不足

来自分类Dev

Android：内存不足错误StringBuilder

来自分类Dev

Closure Compiler（ccjs）内存不足错误

来自分类Dev

BitmapFactory中的内存不足错误

来自分类Dev

内存不足错误VBA-Excel

来自分类Dev

内存不足错误| 在WAS 8上部署

来自分类Dev

内存不足错误，Java堆空间

来自分类Dev

android位图中的内存不足错误

来自分类Dev

hadoop fs -ls内存不足错误

来自分类Dev

内存不足错误，Android ImageViews

来自分类Dev

symfony中的内存不足错误

来自分类Dev

Android：位图导致内存不足错误

来自分类Dev

Matlab中的mvregress的“内存不足”错误

来自分类Dev

使用Android位图的内存不足错误

来自分类Dev

Java集合内存不足错误

来自分类Dev

内存不足错误，Java堆空间

来自分类Dev

使用ImageView的内存不足错误

来自分类Dev

相机预览内存不足错误

来自分类Dev

纠正内存不足错误的正确位置

来自分类Dev

Imageview中的Android内存不足错误

Related 相关文章

文章