西瓜书+南瓜书--打卡(第一次)
由于高中数学,以及大学数学已经还给老师了,所以写的有点基础。
均方误差
期望=估计值=均值 期望一般的表示为E(X), 这里面的X表示的是事件。
为了能让这个生动一点
现在应该回忆起了高中数学的期望值的算法,也就是某一个事件X.
现在要求平均正点率,如果平常来想的话,就直接把三种情况的正点率相加,然后除以3就可以了,但是在这里给出了每一种情况出现的概率,也就是给每一种情况赋予了权重,使得权重不再是1/n了。因此我们就可以0.97x 10/(10+20+10)+0.98x20/40+0.99x10/40
这个是一个生活种的例子。
对于不同的变量:离散型随机变量和连续型随机变量,它们求解期望的公式不同,但是它们内在是相同的。具体怎么从离散推导到连续,可以看这个视频
https://www.bilibili.com/video/BV1pz411B7ZU?spm_id_from=333.337.search-card.all.click&vd_source=407f1c674163347577a4d2596de4e13d
上面那个离散型的比较好理解,就是这件事发生的某一种情况x它对应的概率。连续型的话,其实f(x)dx就是概率,f(x)是概率密度函数,dx可以想成是每一个频率直方图的每一格。
在这里,我们要求均方差,也就是方差的平均值,那也就是期望,所以用E来表示。
2.2 是离散型随机变量的写法 拆开 来写的话,就是(f(x)-y)21/m + (f(x)-y)^21/m ……
在这里面(f(x)-y)^2 相当于是我们要求的目标,所以就很容易推到到下面那一步,也就是f(x)dx 就相当于是概率。积分相当于求和
错误率和精确率
这里面有一个指示函数,如果它是真的话,那就是1,如果是假的话,就是0.知道这个之后就很容易理解。下面对于概率密度函数和上面的均方差的理解是一样的。
查准率,查全率和混淆矩阵
对于这个的话,首先得自己写出混淆矩阵,然后根据混淆矩阵得到precision (P) 和召回率 (R)recall
在这里面查全率就是召回率。precision和recall通常是一对矛盾的指标,两个并不能同时都很高。
P-R曲线
P-R图的横坐标是recall,纵坐标是precision。
老师的brie2的文章种就有一个P-R曲线的图
从上面这张图发现,BRIE2的P-R曲线完全包住了另外两个软件,说明它的performance比较好。
对于这种图,有两种可以看的指标,一种是曲线下面积,另外一个是BEP,也就是平衡点,在这个平衡点的时候precision等于recall.,实际来说也就是画一条斜率为1,过原点的直线。然后查看它与P-E曲线的相交情况。如下面这张图所示。
F1 Fβ
F1 是和precision以及recall,还有P-R曲线紧密相连的。它的定义为
这个式子的来历为
为了能够满足一些特殊情况的需要,让查全率或者查准率更重要一些,引入了Fβ
当β=1时就是F1,当β>1时,recall有更大的影响,当β<1时,precision有更大的影响。
宏查全率,宏查准率,宏F1;微查全率,微查准率,微F1
这两组概念的区别就是宏是得到每一个二分类的混淆矩阵,基于这些混淆矩阵分别得到P,R和F1.然后对这些分别得到的P,R,F1求平均值。
微就是先对多个混淆矩阵种相应位置上的值求一个平均值,最终得到一个总的混淆矩阵,然后再根据这个总的混淆矩阵求平均值。
ROC curve 和AUC
首先一定要知道ROC curve的横纵坐标分别是什么,它的横坐标是假正例率,纵坐标是真正例率。
可以注意到的是,这里面的真正例率就是我们的precision。
这个ROC曲线也是我们经常使用的,对角线的部分是相当于瞎猜。
感觉这个AUC的计算过程自己还没有完全理解。
但是可以调用函数直接算出来。。。
这个是老师的BRIE2的ROC curve。
代价矩阵;代价敏感错误率;代价曲线图
这其实的意思就是给错误的情况设置一些权重。
代价敏感错误率的公式为
代价曲线图种的横轴和纵轴的定义
感觉这个代价曲线我们平时很少用到?
西瓜书+南瓜书--打卡(第一次)相关推荐
- 【组队学习】【35期】吃瓜教程——西瓜书+南瓜书
吃瓜教程--西瓜书+南瓜书 航路开辟者:谢文睿.秦州 领航员:凌亮 航海士:谢文睿.秦州 基本信息 开源内容:https://github.com/datawhalechina/pumpkin-boo ...
- 【组队学习】【33期】吃瓜教程——西瓜书+南瓜书
吃瓜教程--西瓜书+南瓜书 航路开辟者:谢文睿.秦州 领航员:潘磊 航海士:谢文睿.秦州 基本信息 开源内容:https://github.com/datawhalechina/pumpkin-boo ...
- 【组队学习】【32期】吃瓜教程——西瓜书+南瓜书
吃瓜教程--西瓜书+南瓜书 航路开辟者:谢文睿.秦州 领航员:陈伟峰 航海士:谢文睿.秦州 基本信息 开源内容:https://github.com/datawhalechina/pumpkin-bo ...
- 秦州:西瓜书 + 南瓜书 吃瓜系列 14. 降维与度量学习(下)
吃瓜教程--西瓜书+南瓜书 Datawhale南瓜书是经典机器学习教材<机器学习>(西瓜书)的公式推导解析指南,旨在让在学习西瓜书的过程中,再也没有难推的公式,学好机器学习. 内容属性:机 ...
- 秦州:西瓜书 + 南瓜书 吃瓜系列 13. 降维与度量学习(上)
吃瓜教程--西瓜书+南瓜书 Datawhale南瓜书是经典机器学习教材<机器学习>(西瓜书)的公式推导解析指南,旨在让在学习西瓜书的过程中,再也没有难推的公式,学好机器学习. 内容属性:机 ...
- 【组队学习】【31期】 吃瓜教程——西瓜书+南瓜书
吃瓜教程--西瓜书+南瓜书 航路开辟者:谢文睿.秦州 领航员:张海腾 航海士:谢文睿.秦州 基本信息 开源内容:https://github.com/datawhalechina/pumpkin-bo ...
- 谢文睿:西瓜书 + 南瓜书 吃瓜系列 11. 贝叶斯分类器
吃瓜教程--西瓜书+南瓜书 Datawhale南瓜书是经典机器学习教材<机器学习>(西瓜书)的公式推导解析指南,旨在让在学习西瓜书的过程中,再也没有难推的公式,学好机器学习. 内容属性:机 ...
- 【组队学习】【30期】吃瓜教程——西瓜书+南瓜书
吃瓜教程--西瓜书+南瓜书 航路开辟者:谢文睿.秦州 领航员:邱振波 航海士:谢文睿.秦州 基本信息 开源内容:https://github.com/datawhalechina/pumpkin-bo ...
- 【组队学习】【29期】4. 吃瓜教程——西瓜书+南瓜书
4. 吃瓜教程--西瓜书+南瓜书 航路开辟者:谢文睿.秦州 领航员:刘琳 航海士:谢文睿.秦州 基本信息 开源内容:https://github.com/datawhalechina/pumpkin- ...
- 机器学习-吃瓜教程(西瓜书+南瓜书)-神经网络
datawhale-吃瓜教程-神经网络 Task01:概览西瓜书+南瓜书第1.2章 Task02:详读西瓜书+南瓜书第3章 Task03:详读西瓜书+南瓜书第4章 Task04:详读西瓜书+南瓜书第5 ...
最新文章
- Python抓取新浪新闻数据(三)
- 微信小程序商城demo
- Lightoj 1123 - Trail Maintenance(最小增量生成树)
- friend之友元函数和友元类
- androidstudio 日历视图怎么显示农历_中秋国庆旅游攻略怎么做?用这个便签软件很简单...
- 大佬应该都懂的python语法,看看哪些是你不知道的?
- Thrift实现C#调用Java开发步骤详解
- 计算机网络工程用排线架,什么是网络配线架接法 简单学习网络配线架接法图解【详解】...
- 傅里叶变换F(f)与F(w)的探究——以余弦函数为例
- 飞腾PC机器与奔腾G645的PC机器以及E5-2630V4虚拟机内存性能简单对比
- python 收银系统_实现全栈收银系统(Node+Vue)(一)
- cmd 新增dns_win10在cmd中修改dns方法教程
- 离散数学常用符号TeX输入
- iOS:简易的音视屏播放框架XYQPlayer
- 使用Socket实现类似微信群聊的功能
- NFT价值及白皮书获取
- 红旗linux桌面版反应慢,亲自感受红旗Linux系统优化大全
- 常用计算机外部设备有哪些,常用的计算机外设有哪些?
- axure读取服务器文件,Axure教程|云盘案例原型:文件管理
- 云手机虚拟服务器地址和端口,手机服务器地址端口号