name | about | labels |
---|---|---|
Bug Report | Use this template for reporting a bug | kind/bug |
ModelParallelRunner并行推理接口运行在ascend后端,推理时,服务器内存短时间涨满,进程内存不足退出
Ascend
/GPU
/CPU
) / 硬件环境:Please delete the backend not involved / 请删除不涉及的后端:
/device ascend/GPU/CPU/kirin/等其他芯片
ASCEND
Software Environment / 软件环境 (Mandatory / 必填):
-- MindSpore version (e.g., 1.7.0.Bxxx) :
-- Python version (e.g., Python 3.7.5) :
-- OS platform and distribution (e.g., Linux Ubuntu 16.04):
-- GCC/Compiler version (if compiled from source):
v2.2
Excute Mode / 执行模式 (Mandatory / 必填)(PyNative
/Graph
):
Please delete the mode not involved / 请删除不涉及的模式:
/mode pynative
/mode graph
mep-java长稳用例
1.并行推理接口正常init
2.并行推理接口多线程重复predict
3.观测服务器内存
内存正常
推理正常,进程内存正常,服务器内存暴涨
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。
感谢您的反馈,您可以评论//mindspore-assistant更快获取帮助,更多标签可以查看标签列表:
精定位,由提交 9547013429f54187bf1d23c1b978d63cb398ee39 引入 @youshu
根因分析:因替换aclMallocHost接口对tensor进行内存申请,重复resize会更新data指针地址,未在更新前对原有已存在指针进行释放。
自验证:
host内存无明显增长
#Appearance & Root Cause
#Fix Solution
Self-test Report & DT Review
是否需要补充ST/UT: 是
原因:门禁需要补充java推理用例
回归通过
登录 后才可以发表评论