• Baseline

释义:基线,起点

个人理解,baseline应该称为baseline model。你的工作中提出的模型new_model是基于先前工作模型A修改优化出来的,那么模型A称为你的工作的baseline model。

不同于先前工作的新模型,比如BERT(new)与LSTM在NLP任务中的比较,比如ViT作为backbone和CNN作为backbone在CV任务中的比较,也可以将先前工作的模型作为baseline。

The baseline is the measurement at a point when comparing facts in time.

baseline model还可以认为是一种底线模型,如果你的模型性能不如baseline model那么你的工作就没有任何意义。

  • Benchmark:

释义:基准,衡量指标

个人理解,benchmark是一个标准过程或者是一整套标准流程。上面的baseline着重强调baseline model,这个model只是benchmark这个过程的一部分。benchmark包含benchmark data,benchmark metrics等。在工作中,你的new_model想要论证是更好的,标准过程大致是,首先找好baseline,然后学习baseline model中的实验方法,数据集,评价指标等。比如数据集肯定要跟baseline model用一样的,评价指标F1,PPL(etc.)这些值也要跟baseline model保持一致,只有这样你的工作有提升时下结论才具有说服力。

The benchmark is the measurement of competition or standard results.(与baseline同为measurement但范围却有很大不同)

不管是数据集,评价方法等,都能体现benchmark的“标准”一词的含义。也就是说,你的实验条件,过程以及指标大家都要认可。

  • SOTA:

个人理解SOTA是结果导向。也就是说,SOTA指benchmark中的某个评价指标或者某些评价指标的数值结果达到了最好。

关于深度学习中Baseline, Benchmark, SOTA的理解相关推荐

  1. 深度学习中的Benchmark,Baseline,Backbone和SOTA的比较说明举例分析

    1 Benchmark 1.1 中英文直译 基准:水准点:衡量尺度 A benchmark is something whose quality or quantity is known and wh ...

  2. 深度学习中端到端的理解

    非端到端 相对于深度学习,传统机器学习的流程往往由多个独立的模块组成,比如在一个典型的自然语言处理(Natural Language Processing)问题中,包括分词.词性标注.句法分析.语义分 ...

  3. 深度学习中benchmark什么意思,例子

    在深度学习中,"benchmark"通常指对不同的模型.算法或硬件进行性能测试和比较的过程.具体来说,benchmark可以帮助研究人员确定一个模型或算法的优劣,或者在不同的硬件平 ...

  4. 深度学习中的知识蒸馏技术(下)

    本文概览: 写在前面: 这是一篇介绍知识蒸馏在推荐系统中应用的文章,关于知识蒸馏理论基础的详细介绍,请看我的这篇文章: 深度学习中的知识蒸馏技术(上) 1. 背景介绍 1.1 简述推荐系统架构 如果从 ...

  5. 天大本科生论文入选CVPR 2022,实现深度学习长尾分类新SOTA

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 丰色 发自 凹非寺 量子位 | 公众号 QbitAI 本科生搞科研到 ...

  6. CVPR 2022 | 天大本科生论文入选!深度学习长尾分类新SOTA

    文 | 丰色 发自 凹非寺 源 | 量子位(QbitAI) 本科生搞科研到底能做出什么成绩? 最新被CVPR 2022收录的一篇论文中,提供了一种新思路来解决深度学习中长尾分布数据的分类问题,最终实现 ...

  7. 深度学习中 Batch Size 对训练过程的影响

    作者 | 陈志远 编辑丨极市平台 之前面试过程中被问到过两个问题: (1)深度学习中batch size的大小对训练过程的影响是什么样的? (2)有些时候不可避免地要用超大batch,比如人脸识别,可 ...

  8. 深度学习这么调参训练_聊一聊深度学习中的调参技巧?

    本期问题能否聊一聊深度学习中的调参技巧? 我们主要从以下几个方面来讲.1. 深度学习中有哪些参数需要调? 2. 深度学习在什么时候需要动用调参技巧?又如何调参? 3. 训练网络的一般过程是什么? 1. ...

  9. 全民 Transformer (一): Attention 在深度学习中是如何发挥作用的

    <Attention 在深度学习中是如何发挥作用的:理解序列模型中的 Attention>    Transformer 的出现让 Deep Learning 出现了大一统的局面.Tran ...

最新文章

  1. [Core Java® for the Impatient]重载Java2
  2. [Windows编程] 通过GetModuleHandleEx 得到函数调用者所在的DLL/EXE
  3. Hadoop源码阅读-HDFS-day2
  4. Ubuntu安装程序出现“Sub-process usrbindpkg returned an error code (1)”的问题
  5. QWT6.14的编译、配置、使用(Qt Creator5.14.2)
  6. 厦大的计算机博士好考吗,2018双非学姐的厦大考博逆袭之路——本硕求学生涯历程...
  7. selenium | TypeError:object of type ‘WebElement’ has no len()
  8. ORACLE GoldenGate 配置
  9. openSUSE 11 上的配置可以Xmanager远程桌面
  10. c语言输出字符串长度 空格,C++指针变量:输入一个字符串,删除字符串中所有空格,输出删除空格后字符串的长度,需编写以下功能函数...
  11. php键名相加,php二维数组相同键名相加实例
  12. php如何打印png文件,我的php生成的png文件有什么问题?
  13. 不让editText自动获取焦点
  14. 主数据——共享数据的核心,数据资产的灵魂
  15. 【干货分享】大话团队的GIT分支策略进化史
  16. 2019美赛M(一等/优异)奖,给想参加美赛的同学们的干货建议
  17. 最新电销语音机器人完整版源码+含安装教程
  18. 【offer谈判】如何做一朵盛世白莲花,让企业愿意为你花大价钱!
  19. JAVA学习:基础入门(下)
  20. Python数据分析 找出数组中每行(或每列)中指定的百分位数 numpy.percentile()

热门文章

  1. leetcode 1049 最后一块石头的重量
  2. python插值(scipy.interpolate模块的griddata和Rbf)
  3. C - 数据结构实验:哈希表
  4. No timezone mapping entry for ‘Asia/Shanghai‘
  5. Eftp - Mac 系统下免费开源的 FTP/SFTP 远程文件上传工具
  6. 应用于车辆诊断的CAN转以太网/wifi设备LCWLAN新版配置软件介绍
  7. Golang 空指针nil的方法和数据成员
  8. oppofindx6pro参数配置 oppo findx6pro 评测
  9. 宽带和流量是分开的吗_流量和宽带有什么区别-流量和宽带有什么区别?哪个划算?-综投网...
  10. Oracle学习整理