测试结果比训练结果差很多
测试结果比训练结果差很多
在深度学习中,我们训练完一个模型,利用起测试的时候,发现效果下降了好多。这里面有一部分原因可能是模型本身设计不好导致的过拟合。但是当你用的网络没问题,那还有可能是哪里的问题了。
我也是经过了一段时间排查,发现忘记写net.eval()
了,这个非常重要。我们可以看一下其源码里面如何描述的:
This has any effect only on certain modules. See documentations of
particular modules for details of their behaviors in training/evaluation
mode, if they are affected, e.g. :class:`Dropout`, :class:`BatchNorm`,
etc.
当你的网络里面有dropout或者批归一化,一定要记着加入.eval()
,这样才会使得测试的结果是正确的。
测试结果比训练结果差很多相关推荐
- 在测试集上训练,还能中CVPR?这篇IEEE批判论文是否合理?
机器之心报道 机器之心编辑部 今日,一篇论文帖子在 Reddit 的机器学习版块引起了大家的关注.该论文表示 Concetto Spampinato 等人 2017 年的 CVPR 论文存在错误.但从 ...
- 你的“差不多”,其实差很多
中午在楼下咖啡厅买三明治,看见顾姐正拿着几张纸愁眉不展地坐在床边,脸色阴沉得吓人.我听说,顾姐一大早被老板叫到办公室深谈了一个小时,心想她可能遇上了麻烦,正想走过去问问她怎么回事,还没张口,她就看见我 ...
- R语言构建xgboost模型并评估模型(测试集、训练集每一轮):误分类率指标(misclassification rate)、logloss
R语言构建xgboost模型并评估模型(测试集.训练集每一轮):误分类率指标(misclassification rate).logloss 目录
- 绘制测试集、训练集的每一个病人或者样本的raidomics signiture图(绘制raidomics signature图),以及ROC曲线图
绘制测试集.训练集的每一个病人或者样本的raidomics signiture图(绘制raidomics signature图),以及ROC曲线图 受试者工作特征曲线 (receiver operat ...
- Python编程语言学习:for循环实现对多个不同的DataFrame数据执行相同操作(可用于对分开的测试集、训练集实现执行相同逻辑任务)
Python编程语言学习:for循环实现对多个不同的DataFrame数据执行相同操作(可用于对分开的测试集.训练集实现执行相同逻辑任务) 目录
- 阿里P6和P7待遇差别有多大网友干的活差不多,工资差很多
阿里P6和P7待遇差别有多大?网友:干的活差不多,工资差很多 又到一年春招季,最近各大高校都迎来了校园招聘,一般的工科学院特别是IT专业的学生目标很多都是奔着国内互联网巨头去的,其中阿里.腾讯.百度. ...
- 如果你喜欢的女孩有了男朋友,但她男朋友比你差很多,怎么办?
文/飞天含雪 qq 543415188 如果你喜欢的女孩有了男朋友,但她男朋友比你差很多,怎么办?提供以下几个思路: 1.挖墙角非君子所为,换成你是她男朋友,也不希望被挖墙角,将心比心.而且成功还好, ...
- YOLO-Fastest从Darknet源码编译、测试再到训练完整图文教程!
点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 最轻的YOLO算法出来了!这是个模型非常小.号称目前最快的YOLO算法--大小只有1.3MB,单核每秒 ...
- label y 训练集测试集x_训练集、测试集 train_test_split
训练集 & 测试集 如果拿所有原始数据来训练,存在的问题: 模型很差无法调整: 真实环境难以拿到真实 label: 所以将数据区分为 训练数据 和 测试数据(train test split) ...
最新文章
- 小希的迷宫 HDU - 1272 (并查集)
- 【Linux系统编程学习】 Makefile简单入门
- mysql测试数据图表_mysql测试数据表
- 【shell编程基础0】bash shell编程的基本配置
- java抛出异常thorw和throws的用法
- C/C++ 进阶 —— static
- 如何在Android模拟器中模拟GPS位置?
- C++宠物商店管理系统
- 十大最好用的企业资产管理软件EAM比较
- 关于职业发展:一篇不错的文章分享
- R语言报错:Error in data[[rowvar]] : attempt to select less than one element in get1index
- 详解3DTouch集成篇
- Java中十进制数转二进制数的方法
- 我要写王者荣耀类游戏的网页代码
- 脚本小子--------python脚本循环导出H3C华三核心防火墙context虚拟防火墙配置(你凝视bug,bug也在凝视你)
- C语言中access函数的使用
- java实现随机数生成算法_Java 语言实现的随机数生成算法
- 东辉创投放心用姓名存钱的利害,存款一切权归吗?
- 表单验证字母数字中文常用正则
- VSCode下载慢的问题解决