sklearn 中 Logistics Regression 的 coef_ 和 intercept_ 的具体意义

​ 使用sklearn库可以很方便的实现各种基本的机器学习算法,例如今天说的逻辑斯谛回归(Logistic Regression),我在实现完之后,可能陷入代码太久,忘记基本的算法原理了,突然想不到coef_和intercept_具体是代表什么意思了,就是具体到公式中的哪个字母,虽然总体知道代表的是模型参数。

正文

我们使用 sklearn 官方的一个例子来作为说明,源码可以从这里下载,下面我截取其中一小段并做了一些修改:

import numpy as np

import matplotlib.pyplot as plt

from sklearn.datasets import make_blobs

from sklearn.linear_model import LogisticRegression

# 构造一些数据点

centers = [[-5, 0], [0, 1.5], [5, -1]]

X, y = make_blobs(n_samples=1000, centers=centers, random_state=40)

transformation = [[0.4, 0.2], [-0.4, 1.2]]

X = np.dot(X, transformation)

clf = LogisticRegression(solver='sag', max_iter=100, random_state=42, multi_class=multi_class).fit(X, y)

print clf.coef_

print clf.intercept_

输出如图:

可以看到clf.coef_是一个3×2(n_class, n_features)的矩阵,clf.intercept_是一个1×3的矩阵(向量),那么这些到底是什么意思呢?

我们来回顾一下 Logistic 回归的模型:

\[ h_\theta(x) = \frac{1}{1 + e^{(-\theta^Tx)} } \]

其中 \(\theta\)是模型参数,其实 \(\theta^Tx\)就是一个线性表达式,将这个表达式的结果再一次利用 Logistic 函数映射到 0~1 之间。

知道了这个,也就可以搞清楚那个clf.coef_和clf.intercept_了: clf.coef_和clf.intercept_就是 $ \theta $,下面我们来验证一下:

i = 100

print 1 / (1 + np.exp(-(np.dot(X[i].reshape(1, -1), cc.T) + clf.intercept_)))

# 正确的类别

print y[i]

print clf.predict_proba(X[i].reshape(1, -1))

print clf.predict_log_proba(X[i].reshape(1, -1))

输出结果:

python logistics regression_Python——sklearn 中 Logistics Regression 的 coef_ 和 intercept_ 的具体意义...相关推荐

  1. sklearn 中 Logistics Regression 的 coef_ 和 intercept_ 的具体意义

    使用sklearn库可以很方便的实现各种基本的机器学习算法,例如今天说的逻辑斯谛回归(Logistic Regression),我在实现完之后,可能陷入代码太久,忘记基本的算法原理了,突然想不到coe ...

  2. sklearn中Logistics Regression的coef_和intercept_的具体意义

    使用sklearn库可以很方便的实现各种基本的机器学习算法,例如今天说的逻辑斯谛回归(Logistic Regression),我在实现完之后,可能陷入代码太久,忘记基本的算法原理了,突然想不到 co ...

  3. python使用sklearn中的make_blobs函数生成聚类(clustering)分析需要的仿真数据、matplotlib可视化生成的仿真数据

    python使用sklearn中的make_blobs函数生成聚类(clustering)分析需要的仿真数据.matplotlib可视化生成的仿真数据 目录

  4. python使用sklearn中的make_classification函数生成分类模型(classification)需要的仿真数据、使用pandas查看生成数据的特征数据、目标数据

    python使用sklearn中的make_classification函数生成分类模型(classification)需要的仿真数据.使用pandas查看生成数据的特征数据(features).目标 ...

  5. Python中sklearn中HistGradientBoostingRegressor回归器配置单调约束参数monotonic_cst提高回归模型的抗噪声以及局部扰动的能力

    Python中sklearn中HistGradientBoostingRegressor回归器配置单调约束参数monotonic_cst提高回归模型的抗噪声以及局部扰动的能力 目录

  6. Python之 sklearn:sklearn中的train_test_split函数的简介及使用方法之详细攻略

    Python之 sklearn:sklearn中的train_test_split函数的简介及使用方法之详细攻略 目录 sklearn中的train_test_split函数的简介 train_tes ...

  7. Python之 sklearn:sklearn中的RobustScaler 函数的简介及使用方法之详细攻略

    Python之 sklearn:sklearn中的RobustScaler 函数的简介及使用方法之详细攻略 目录 sklearn中的RobustScaler 函数的简介及使用方法 sklearn中的R ...

  8. python pca降维_机器学习之sklearn中的降维算法

    1. PCA与SVD sklearn中降维算法都被包括在模块decomposition中,这个模块本质是一个矩阵分解模块.在过去的十年中,如果要讨论算法进步的先锋,矩阵分解可以说是独树一帜.矩阵分解可 ...

  9. python中fit_Python sklearn中的.fit与.predict的用法说明

    我就废话不多说了,大家还是直接看代码吧~ clf=KMeans(n_clusters=5) #创建分类器对象 fit_clf=clf.fit(X) #用训练器数据拟合分类器模型 clf.predict ...

最新文章

  1. 腾讯云携手SENSORO,为城市安全保驾护航
  2. 找到表中某一列值相同的记录,而且只要其中一条记录的sql
  3. 北京Uber优步司机奖励政策(3月11日)
  4. JAVA深复制(深克隆)与浅复制(浅克隆)
  5. 6个面的骰子 标上1 2 3 4 5 6 投掷8次 求出现和的概率最大的数 ,就是这8次的和最有可能是多少...
  6. 学会python爬虫能发财么_python如何赚钱? python爬虫如何进阶? python就业? 如何快速入门python?...
  7. php如何生成伪静态url,Thinkphp里关于U函数生成URL伪静态
  8. 卡诺模型案例分析_设计师必修课:KANO 模型的讲解与案例分析
  9. yate怎样调出彩色的log日志实时调试信息
  10. 计算机存储器分级结构,存储器
  11. 报错:Error in get(“GO2ONT“, envir = GO_DATA) : object ‘GO2ONT‘ not found
  12. vcf格式(vCard)转成excel的操作方法
  13. Real-Time Rendering——9.9.4 Rough-Surface Subsurface Models粗糙表面地下模型
  14. 消息称聊天宝团队解散 罗永浩已经退出股东行列
  15. 高晓松脱口秀--晓说(第一季第二季)mp3下载
  16. dell服务器设置bios设置u盘启动不了系统,戴尔台式机bios设置图解教程|dell bios设置u盘启动...
  17. 近距离无线通信(NFC)技术介绍
  18. IBMV7000存储电源模块PSU报错“Power Supply Fault type 2“
  19. 关于png的交错Interlace
  20. 十步法原则解决数据质量问题

热门文章

  1. 二分法查找平方和_面试手撕系列:二分法
  2. 如何设置定时器每天执行一次_游戏活动的自动循环——定时器管理
  3. 来来来,送开发板了。
  4. 基于FPGA的ADC数据采集蓝牙传输系统
  5. python如何控制程序_Python 控制程式执行流程
  6. 01初识鸿蒙_移动通讯技术的发展
  7. sql重复数据取日期小的_excel快速查询重复数据的3个小技巧
  8. 农艺师需要职称计算机,2015年农艺师职称计算机考试宝典.doc
  9. 使用nginx实现一个主机部署多域名指向不同docker项目
  10. Linux实战教学笔记02:计算机系统硬件核心知识