决定系数R2能否为负数?
决定系数R2能否为负数?
R2 —— 评估回归的方法
回归是将函数拟合到数据的方法。例如,我们能够通过卫星统计沃尔玛门口停车场的汽车数量,也可以通过其收益报告了解沃尔玛在对应时段的销售额。于是,你想建立一个汽车数量与沃尔玛季度收益的函数关系,以便于您炒股。但是,在建立了汽车数量与季度收益的函数关系以后,我们应该如何评判你和出来的函数关系的优劣呢?常用的度量拟合效果的参数是决定系数R2。本文将详细介绍R2的计算原理及负值产生的原因分析:
什么是R2?
R2用于比较回归模型的预测误差与简单的Y=样本点平均值的误差。
R2的公式如下:
SS_Regression表示的是函数拟合得到的回归模型的预测值与真实值的误差的平方和
可以看下面这张图片,这里的黑色曲线就是通过数据拟合出来的一条回归曲线,上面计算的SS_Regression就是蓝色线(真实值)与黑色线(回归预测值)之间的误差。
SS_Total是表示Y=所有样本点平均值这么一条水平线与真实值之间误差的平方和。
我们计算出来了回归曲线的误差以后,跟谁去比较呢?这里选择了Y=所有样本点平均值这么一条水平线。计算真实值(蓝色线)和Y=所有样本点平均值这条直线的误差平方和。
通过上面的分析,我们可以得到以下结论:
- 决定系数R2是回归函数与Y=平均值这条水平线误差的比较;
- 只要样本点固定,SSTotal是固定不变的,回归函数或模型误差越小则SS_Regression这一项越小,R2就越趋近于1。
回归到最开始的问题,什么时候R2为负数?
R2为负数就是你得到的拟合函数预测误差大于Y=平均值这条函数的预测误差。
但是,这不是在侮辱人吗?
辛辛苦苦设置参数调整模型得到的拟合结果误差还比盲猜一个平均值大,这样的腊鸡模型咱也不敢放到台面上来。所以在市面上咱们很少见到R2小于零的模型。
所以一般认为有用的模型的R2的取值范围在0-1之间。
结论 回归函数拟合效果差于取平均值时R2会为负数
英文原文链接:https://link.zhihu.com/?target=http%3A//www.fairlynerdy.com/what-is-r-squared/
原译文:https://zhuanlan.zhihu.com/p/142162339
决定系数R2能否为负数?相关推荐
- MATLAB 线性拟合 决定系数R2求解
线性拟合之后总是需要求解决定系数R2,网上找了一下发现没啥靠谱的中文回答.还是老外的方法比较靠谱. 线性拟合求解决定系数
- 利用sklearn计算决定系数R2
决定系数R2 sklearn.metrics中r2_score 格式 sklearn.metrics.r2_score(y_true, y_pred, sample_weight=None, mult ...
- 决定系数R2真的可靠吗?
目录 1. R2 2. 是否可以通过比较R方大小,来证明"加入某个变量有利于提高模型的拟合程度"? 3. 调整后的R2 4. R方不能支持模型的哪些假设? 5. R2和调整后的R2 ...
- R2: 相关系数、复相关系数及半偏相关系数之间的联系
开贴举例说明相关系数.复相关系数及半偏相关系数之间的联系. 比如,我们要预测学生在高中的表现(学生成绩),一种方法是测量学习速度和难易程度的能力测验来衡量学生的学习能力.那么,假设一个学生已经做了这样 ...
- 回归模型评价指标:MSE、RMSE、MAE、R2 score
回归模型评价指标:MSE.RMSE.MAE. R 2 R^2 R2 score 回归模型评价指标:MSE.RMSE.MAE.R2 score 前言 平均绝对误差(MAE) 均方误差(MSE) 均方根误 ...
- 统计咨询:决定系数(R方)是否越大越好?
统计咨询:决定系数(R方)是否越大越好? 原作者@一起学统计工具, 转自搜狐, 侵删. 问题:尊敬的老师您好,想问一下决定系数R2越大越好,但是有没有说具体的范围?大于多少就是有意义的?谢谢老师. 回 ...
- 【机器学习技巧】回归模型的几个常用评估指标(R2、Adjusted-R2、MSE、RMSE、MAE、MAPE)及其在sklearn中的调用方式
目录 回归模型评估的两个方面 1. 预测值的拟合程度 2. 预测值的准确度 以糖尿病数据集的回归模型为计算示例-计算各指标 1. 决定系数R2 1.1 R2求解方式一----从metrics调用r2_ ...
- MSE, R2, R等误差指标
文章目录 前言 1 均方误差 MSE ( Mean Squared Error) 2 均方根误差 RMSE ( Root Mean Squared Error) 3 平均绝对误差 MAE ( Mean ...
- Nat. Commun. | 识别药物靶点的贝叶斯机器学习方法
今天给大家介绍的是2019年11月发表在Nature Communications的一篇文章,"A Bayesian machine learning approach for drug t ...
最新文章
- 数据库名、数据库实例、全局数据库名、服务名、SID等的区别
- java多线程11.非阻塞同步机制
- 信息安全技术 网络安全事件应急演练指南_省局举办网络安全培训讲座
- Kubernetes 入门必备云原生发展简史
- Python学习:推导式
- publiccms实现首页菜单栏下拉的方法
- Linux内核构建与开发
- SQL查询结果根据汉字拼音排序
- QScrollArea样式设置
- html5 预览图片原理,html5实现图片预览和查看原图
- scuctf赛后自闭
- AD入门学习—元件库(原理图库)的创建
- UVA - 11604 General Sultan 题解
- 制作Mac Lion系统U盘启动
- 部门新来了个阿里25K出来的,让我见识到了什么是天花板
- meter元素的使用
- C++的lib文件到底是什么
- honor荣耀怎么样?
- 文件IO实现图片的加密操作
- 功能安全标准ISO26262-2翻译
热门文章
- 几维安全CEO范俊伟:对代码进行加密或能更有效应对网络攻击
- Ts extends 泛型约束
- python七彩蟒蛇代码_Python实现七彩蟒蛇绘制实例代码
- MGB-mybatis逆向工程(maven方式)
- CiteSeer统计的计算机领域的期刊和会议的影响因子(2005)
- Oracle清空数据库中数据表数据的方法
- 同时介绍两个对象怎么办_“相亲对象好着急,认识第一天就干出这事?”哈哈哈哈哈我该怎么办|哈哈哈哈哈|相亲|情侣|借钱|电子厂...
- 7-6 图着色问题 (25 分)
- 在html 中怎么将超链接分别设置样式,html中局部超链接样式设置怎么弄?
- 浅谈通过网络和数据来“定位”一个人