name | about | labels |
---|---|---|
Bug Report | Use this template for reporting a bug | kind/bug |
bert模型地址:https://gitee.com/mindspore/models/tree/master/official/nlp/Bert
yolov5网络在Ascend910环境8p训练,训练告警日志过多
Ascend
/GPU
/CPU
) / 硬件环境:Please delete the backend not involved / 请删除不涉及的后端:
/device Ascend
Software Environment / 软件环境 (Mandatory / 必填):
-- MindSpore version (e.g., 1.7.0.Bxxx) :
-- Python version (e.g., Python 3.7.5) :
-- OS platform and distribution (e.g., Linux Ubuntu 16.04):
-- GCC/Compiler version (if compiled from source):
run包:HiAI/HISI_C29/20230315
MindSpore 版本:r2.0_20230324161913_76213848
Excute Mode / 执行模式 (Mandatory / 必填)(PyNative
/Graph
):
Please delete the mode not involved / 请删除不涉及的模式:
/mode graph
测试仓库地址:solution_test/cases/02network/00cv/yolov5/train
用例:
test_ms_yolov5_coco2017_ascend_train_infer_8p_0006.py
网络训练成功,训练日志正常
21 mindspore/train/serialization.py:1080] For 'load_param_into_net', remove parameter prefix name: network.yolo_network., continue to load.
走给常哲睿
Please assign maintainer to check this issue.
请为此issue分配处理人。
@zhongjicheng
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。
Please add labels (comp or sig), also you can visit https://gitee.com/mindspore/community/blob/master/sigs/dx/docs/labels.md to find more.
为了让代码尽快被审核,请您为Pull Request打上 组件(comp)或兴趣组(sig) 标签,打上标签的PR可直接推送给责任人进行审核。
更多的标签可以查看https://gitee.com/mindspore/community/blob/master/sigs/dx/docs/labels.md
以组件相关代码提交为例,如果你提交的是data组件代码,你可以这样评论:
//comp/data
当然你也可以邀请data SIG组来审核代码,可以这样写:
//sig/data
另外你还可以给这个PR标记类型,例如是bugfix或者是特性需求:
//kind/bug or //kind/feature
恭喜你,你已经学会了使用命令来打标签,接下来就在下面的评论里打上标签吧!
这个告警的产生的原因是保存ckpt和加载ckpt时网络结构不一致,框架自动做了模糊匹配加载。
给出warning告诉用户做了模糊加载这个事情。
解决方案是让保存和加载是同一个网络结构。
属于网络脚本定义问题,需网络FO具体定位
这条日志不是连续的出现超过10次,而是边训练边推理的场景,推理了21次,调用了21次load_param_into_net接口,打印了21次这个日志,不构成重复日志过多的问题
当前代码的逻辑,yolov5训练300个epoch,从100个epoch开始,每10个epoch推理一次,共21次加载ckpt推理
登录 后才可以发表评论