18 Star 41 Fork 68

openEuler / A-Ops

 / 详情

【21.09-RC5】智能运维Aops,异常检测规则较多的情况下,内存不足,造成ES数据库OOM退出

已取消
缺陷
创建于  
2021-09-26 17:39

【环境信息】
OS:21.09-RC5
repo源:everything,OS,EPOL
[root@localhost ~]# cat /etc/openEuler-latest
openeulerversion=openEuler-21.09
compiletime=2021-09-21-19-33-30
gccversion=10.3.1-20210914.5.oe1
kernelversion=5.10.0-5.10.0.24.oe1
openjdkversion=1.8.0.302.b07-2.oe1

【问题复现步骤】
0、修改/etc/aops/system.ini文件中的日志级别由INFO改为DEBUG;
1、导入多个异常检测规则

【预期结果】
1、像这种情况,es数据库不该崩溃(跟因:日志数据量太大)

【实际结果】
1、通常1-2天就会造成es数据库崩溃,无法直接重启es;停掉fluentd,重启es数据库可以成功

【附件信息】

【补充】
增加内存到8G,但是es还是经常挂,内存占用高达3.8G,用下面的命令优化后,内存还会占用2.7G
curl -XPOST http://172.168.239.30:9200/172.168.239.30/_forcemerge?max_num_segments=1
输入图片说明
输入图片说明

评论 (2)

zjl_long 创建了缺陷
zjl_long 关联仓库设置为openEuler/A-Ops
展开全部操作日志

Hi zjl_long, welcome to the openEuler Community.
I'm the Bot here serving you. You can find the instructions on how to interact with me at
https://gitee.com/openeuler/community/blob/master/en/sig-infrastructure/command.md.
If you have any questions, please contact the SIG: sig-ops, and any of the maintainers: @栾建海, @solarhu, @陈亚强, @cmss_dx, @gameoverboss, @snoweay, @luzhihao, @陈功.

openeuler-ci-bot 添加了
 
sig/sig-ops
标签
zjl_long 负责人设置为Lostway
zjl_long 里程碑设置为openEuler-21.09-round-5
zjl_long 计划截止日期设置为2021-09-27
zjl_long 计划开始日期设置为2021-09-26
zjl_long 优先级设置为主要
Lostway 任务状态待办的 修改为已挂起

与测试沟通后,后续进行优化

Charlie_Li 修改了标题
zjl_long 修改了描述
Lostway 任务状态已挂起 修改为已取消

登录 后才可以发表评论

状态
负责人
项目
里程碑
Pull Requests
关联的 Pull Requests 被合并后可能会关闭此 issue
分支
开始日期   -   截止日期
-
置顶选项
优先级
预计工期 (小时)
参与者(3)
5329419 openeuler ci bot 1632792936
1
https://gitee.com/openeuler/A-Ops.git
git@gitee.com:openeuler/A-Ops.git
openeuler
A-Ops
A-Ops

搜索帮助

14c37bed 8189591 565d56ea 8189591