目录

1、概述

1.1 有监督学习

1.2 多项式回归

2 概念

3 案例实现——方法1

3.1 案例分析

3.2 代码实现

3.3 结果

3.4 可视化

4 案例实现——方法2

4.1 代码

4.2 结果

4.3 可视化

5 致谢


1、概述

1.1 有监督学习

1.2 多项式回归

上一次我们讲解了线性回归,这次我们重点分析多项式回归。

多项式回归(Polynomial Regression)是研究一个因变量与一 个或多个自变量间多项式的回归分析方法。如果自变量只有一个 时,称为一元多项式回归;如果自变量有多个时,称为多元多项 式回归。 

(1)在一元回归分析中,如果依变量y与自变量x的关系为非线性的,但 是又找不到适当的函数曲线来拟合,则可以采用一元多项式回归。
(2)多项式回归的最大优点就是可以通过增加x的高次项对实测点进行逼 近,直至满意为止。
(3)事实上,多项式回归可以处理相当一类非线性问题,它在回归分析 中占有重要的地位,因为任一函数都可以分段用多项式来逼近。

2 概念

之前提到的线性回归实例中,是运用直线来拟合数据输入与输出之间的线性关系。不同于线性回归,多项式回归是使用曲线拟合数据的输入与输出的映射关系。

3 案例实现——方法1

3.1 案例分析

应用背景:我们在前面已经根据已知的房屋成交价和房屋的尺寸进行了线性回归,继而可以对已知房屋尺寸,而未知房屋成交价格的实例进行了成交价格的预测,但是在实际的应用中这样的拟合往往不够好,因此我们在此对该数据集进行多项式回归。
目标:对房屋成交信息建立多项式回归方程,并依据回归方程对房屋价格进行预测。
成交信息包括房屋的面积以及对应的成交价格:
(1)房屋面积单位为平方英尺(ft2)
(2)房屋成交价格单位为万

3.2 代码实现

import matplotlib.pyplot as plt
import numpy as np
from sklearn import linear_model
from sklearn.preprocessing import PolynomialFeatures# 读取数据集
datasets_X = []
datasets_Y = []
fr = open('多项式线性回归.csv','r')
lines = fr.readlines()
for line in lines:items = line.strip().split(',')datasets_X.append(int(items[0]))datasets_Y.append(int(items[1]))length = len(datasets_X)
datasets_X = np.array(datasets_X).reshape([length,1])
datasets_Y = np.array(datasets_Y)minX = min(datasets_X)
maxX = max(datasets_X)
X = np.arange(minX,maxX).reshape([-1,1])poly_reg = PolynomialFeatures(degree = 2)      #degree=2表示建立datasets_X的二次多项式特征X_poly。
X_poly = poly_reg.fit_transform(datasets_X)    #使用PolynomialFeatures构造x的二次多项式X_poly
lin_reg_2 = linear_model.LinearRegression()
lin_reg_2.fit(X_poly, datasets_Y)           #然后创建线性回归,使用线性模型(linear_model)学习X_poly和y之间的映射关系print(X_poly)
print(lin_reg_2.predict(poly_reg.fit_transform(X)))
print('Coefficients:', lin_reg_2.coef_)      #查看回归方程系数(k)
print('intercept:', lin_reg_2.intercept_)    ##查看回归方程截距(b)
print('the model is y={0}+({1}*x)+({2}*x^2)'.format(lin_reg_2.intercept_,lin_reg_2.coef_[0],lin_reg_2.coef_[1]))
# 图像中显示
plt.scatter(datasets_X, datasets_Y, color = 'red')  #scatter函数用于绘制数据点,这里表示用红色绘制数据点;
#plot函数用来绘制回归线,同样这里需要先将X处理成多项式特征;
plt.plot(X, lin_reg_2.predict(poly_reg.fit_transform(X)), color = 'blue')
plt.xlabel('Area')
plt.ylabel('Price')
plt.show()

3.3 结果

[[1.0000000e+00 1.0000000e+03 1.0000000e+06][1.0000000e+00 7.9200000e+02 6.2726400e+05][1.0000000e+00 1.2600000e+03 1.5876000e+06][1.0000000e+00 1.2620000e+03 1.5926440e+06][1.0000000e+00 1.2400000e+03 1.5376000e+06][1.0000000e+00 1.1700000e+03 1.3689000e+06][1.0000000e+00 1.2300000e+03 1.5129000e+06][1.0000000e+00 1.2550000e+03 1.5750250e+06][1.0000000e+00 1.1940000e+03 1.4256360e+06][1.0000000e+00 1.4500000e+03 2.1025000e+06][1.0000000e+00 1.4810000e+03 2.1933610e+06][1.0000000e+00 1.4750000e+03 2.1756250e+06][1.0000000e+00 1.4820000e+03 2.1963240e+06][1.0000000e+00 1.4840000e+03 2.2022560e+06][1.0000000e+00 1.5120000e+03 2.2861440e+06][1.0000000e+00 1.6800000e+03 2.8224000e+06][1.0000000e+00 1.6200000e+03 2.6244000e+06][1.0000000e+00 1.7200000e+03 2.9584000e+06][1.0000000e+00 1.8000000e+03 3.2400000e+06][1.0000000e+00 4.4000000e+03 1.9360000e+07][1.0000000e+00 4.2120000e+03 1.7740944e+07][1.0000000e+00 3.9200000e+03 1.5366400e+07][1.0000000e+00 3.2120000e+03 1.0316944e+07][1.0000000e+00 3.1510000e+03 9.9288010e+06][1.0000000e+00 3.1000000e+03 9.6100000e+06][1.0000000e+00 2.7000000e+03 7.2900000e+06][1.0000000e+00 2.6120000e+03 6.8225440e+06][1.0000000e+00 2.7050000e+03 7.3170250e+06][1.0000000e+00 2.5700000e+03 6.6049000e+06][1.0000000e+00 2.4420000e+03 5.9633640e+06][1.0000000e+00 2.3870000e+03 5.6977690e+06][1.0000000e+00 2.2920000e+03 5.2532640e+06][1.0000000e+00 2.3080000e+03 5.3268640e+06][1.0000000e+00 2.2520000e+03 5.0715040e+06][1.0000000e+00 2.2020000e+03 4.8488040e+06][1.0000000e+00 2.1570000e+03 4.6526490e+06][1.0000000e+00 2.1400000e+03 4.5796000e+06][1.0000000e+00 4.0000000e+03 1.6000000e+07][1.0000000e+00 4.2000000e+03 1.7640000e+07][1.0000000e+00 3.9000000e+03 1.5210000e+07][1.0000000e+00 3.5440000e+03 1.2559936e+07][1.0000000e+00 2.9800000e+03 8.8804000e+06][1.0000000e+00 4.3550000e+03 1.8966025e+07][1.0000000e+00 3.1500000e+03 9.9225000e+06][1.0000000e+00 3.0250000e+03 9.1506250e+06][1.0000000e+00 3.4500000e+03 1.1902500e+07][1.0000000e+00 4.4020000e+03 1.9377604e+07][1.0000000e+00 3.4540000e+03 1.1930116e+07][1.0000000e+00 8.9000000e+02 7.9210000e+05]]
[231.16788093 231.19868474 231.22954958 ... 739.2018995  739.45285011739.70386176]
Coefficients: [ 0.00000000e+00 -1.75650177e-02  3.05166076e-05]
intercept: 225.93740561055927
the model is y=225.93740561055927+(0.0*x)+(-0.017565017675036532*x^2)

3.4 可视化

4 案例实现——方法2

4.1 代码

numpy中np.array()与np.asarray的区别以及.tolist

import matplotlib.pyplot as plt
from sklearn.preprocessing import PolynomialFeatures
from sklearn.pipeline import Pipeline
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
import numpy as np
import pandas as pd
import warningswarnings.filterwarnings(action="ignore", module="sklearn")dataset = pd.read_csv('多项式线性回归.csv')
X = np.asarray(dataset.get('x'))
y = np.asarray(dataset.get('y'))# 划分训练集和测试集
X_train = X[:-2]
X_test = X[-2:]
y_train = y[:-2]
y_test = y[-2:]# fit_intercept 为 True
model1 = Pipeline([('poly', PolynomialFeatures(degree=2)), ('linear', LinearRegression(fit_intercept=True))])
model1 = model1.fit(X_train[:, np.newaxis], y_train)
y_test_pred1 = model1.named_steps['linear'].intercept_ + model1.named_steps['linear'].coef_[1] * X_test
print('while fit_intercept is True:................')
print('Coefficients: ', model1.named_steps['linear'].coef_)
print('Intercept:', model1.named_steps['linear'].intercept_)
print('the model is: y = ', model1.named_steps['linear'].intercept_, ' + ', model1.named_steps['linear'].coef_[1],'* X')
# 均方误差
print("Mean squared error: %.2f" % mean_squared_error(y_test, y_test_pred1))
# r2 score,0,1之间,越接近1说明模型越好,越接近0说明模型越差
print('Variance score: %.2f' % r2_score(y_test, y_test_pred1), '\n')# fit_intercept 为 False
model2 = Pipeline([('poly', PolynomialFeatures(degree=2)), ('linear', LinearRegression(fit_intercept=False))])
model2 = model2.fit(X_train[:, np.newaxis], y_train)
y_test_pred2 = model2.named_steps['linear'].coef_[0] + model2.named_steps['linear'].coef_[1] * X_test + \model2.named_steps['linear'].coef_[2] * X_test * X_test
print('while fit_intercept is False:..........................................')
print('Coefficients: ', model2.named_steps['linear'].coef_)
print('Intercept:', model2.named_steps['linear'].intercept_)
print('the model is: y = ', model2.named_steps['linear'].coef_[0], '+', model2.named_steps['linear'].coef_[1], '* X + ',model2.named_steps['linear'].coef_[2], '* X^2')
# 均方误差
print("Mean squared error: %.2f" % mean_squared_error(y_test, y_test_pred2))
# r2 score,0,1之间,越接近1说明模型越好,越接近0说明模型越差
print('Variance score: %.2f' % r2_score(y_test, y_test_pred2), '\n')plt.xlabel('x')
plt.ylabel('y')
# 画训练集的散点图
plt.scatter(X_train, y_train, alpha=0.8, color='black')
# 画模型
plt.plot(X_train, model2.named_steps['linear'].coef_[0] + model2.named_steps['linear'].coef_[1] * X_train +model2.named_steps['linear'].coef_[2] * X_train * X_train, color='red',linewidth=1)
plt.show()

4.2 结果

如果不用框架,需要自己手动对数据添加高阶项,有了框架就方便多了。sklearn 使用 Pipeline 函数简化这部分预处理过程。

当 PolynomialFeatures 中的degree=1时,效果和使用 LinearRegression 相同,得到的是一个线性模型,degree=2时,是二次方程,如果是单变量的就是抛物线,双变量的就是抛物面。以此类推。

这里有一个 fit_intercept 参数,下面通过一个例子看一下它的作用。

当 fit_intercept 为 True 时,coef_ 中的第一个值为 0,intercept_ 中的值为实际的截距。

当 fit_intercept 为 False 时,coef_ 中的第一个值为截距,intercept_ 中的值为 0。

如图,第一部分是 fit_intercept 为 True 时的结果,第二部分是 fit_intercept 为 False 时的结果。

while fit_intercept is True:................
Coefficients:  [ 0.00000000e+00 -3.70858180e-04  2.78609637e-05]
Intercept: 204.25470490804574
the model is: y =  204.25470490804574  +  -0.00037085818009180454 * X
Mean squared error: 26964.95
Variance score: -3.61 while fit_intercept is False:..........................................
Coefficients:  [ 2.04254705e+02 -3.70858180e-04  2.78609637e-05]
Intercept: 0.0
the model is: y =  204.2547049080572 + -0.0003708581801012066 * X +  2.7860963722809286e-05 * X^2
Mean squared error: 7147.78
Variance score: -0.22 

4.3 可视化

5 致谢

参考:https://blog.csdn.net/qq_24671941/article/details/88372116

人工智能——多项式回归(Python)相关推荐

  1. python与人工智能编程-python学习(一)——python与人工智能

    最近在朋友圈转起了一张图.抱着试一试的心态,我肝了些课程.都是与python相关的. 课程一:你不知道的python 讲师:王玉杰(混沌巡洋舰联合创始人 & web开发工程师 & 数据 ...

  2. python与人工智能编程-人工智能与Python关系浅谈

    随着科技的发展,嵌入式.物联网.5G.人工智能等技术不断出现,它们正一点一点从实验室走进大众的日常生活,让人们的生活变得更加便利.更加智能,今天我们就来简单谈谈这其中的人工智能技术. 说到 人工智能究 ...

  3. 从零开始学python人工智能课程_从零开始学人工智能(12)--Python · 决策树(零)· 简介...

    原标题:从零开始学人工智能(12)--Python · 决策树(零)· 简介 感谢关注天善智能,走好数据之路↑↑↑ 欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大数据分析与挖掘领域的垂直 ...

  4. 人工智能选go还是python_深圳人工智能学Python还是go,真实经历分享

    深圳人工智能学Python还是go,进行选择深圳Python培训 的时候,第一要思考的就是该机构的口碑如何.如果该家机构没有一定的口碑信誉,就等于搬起石头砸了自己的招牌.为什么突然就那么火了,Pyth ...

  5. 人工智能只能用python吗_为什么人工智能用Python?

    主要原因: 1.人工智能适应Python的编程语言. 2.人工智能需要利用Python的高层语言,实现可移植性.面向对象.可扩展性.可嵌入型等功能,来实现人机交流. Python:是一种面向对象的解释 ...

  6. 人工智能语言python实验报告_【报名】人工智能语言Python启蒙课程(五六年级)...

    原标题:[报名]人工智能语言Python启蒙课程(五六年级) 7月,图书馆为中低年级的小朋友准备了两期8节课的少儿编程启蒙课程.8月,我们将为小学高年级的学生朋友献上一期人工智能语言Python启蒙公 ...

  7. 人工智能用python还是java_人工智能选择python还是java语言

    最近几年伴随着大数据的发展,人工智能也迎来了前所未有的发展契机,大量的专业人才涌向了人工智能领域,相信未来人工智能领域会进一步赢得市场的追捧. 不少打算学计算机的学生,想从事人工智能行业,但是对于人工 ...

  8. python与人工智能的关系_广东江门的北大青鸟学校了解到人工智能与Python关系

    随着科技的发展,嵌入式.物联网.5G.人工智能等技术不断出现,它们正一点一点从实验室走进大众的日常生活,让人们的生活变得更加便利.更加智能,今天我们就来简单谈谈这其中的人工智能技术. 广东江门的北大青 ...

  9. python对人工智能的看法_为什么人工智能用python

    相对于其他语言,python对人工智能最大的优势是他的可扩展性.可嵌入性.这也是他被程序员称为"胶水语言"的原因. python对人工智能应用的优点:(推荐学习:Python视频教 ...

  10. python智能机器人原理_人工智能和Python是什么关系?详细分析!

    提及到人工智能很多人都会想到Python语言,对于很多人来说Python和人工智能几乎为等号模式,那么Python和人工智能属于什么关系呢?为大家简单的介绍一下. Python是一种计算机程序设计语言 ...

最新文章

  1. iis web.config 配置 经典模式_部署IIS+PHP+Oracle环境
  2. s3c2410下利用TL16C554扩展4个全功能串口
  3. python3精要(19)-全局变量global和工厂函数,lambda,变量作用范围,nonlocal
  4. 全国计算机等级考试题库二级C操作题100套(第95套)
  5. JavaScript 第四课 案例研究:JavaScript图片库
  6. 怎样在PropertySheet中添加按钮
  7. 手把手教你用Matplotlib进行数据可视化
  8. javascript挑战编程技能-第九题:数据结构
  9. Android5.0和6.0之后新增的控件说明
  10. Kotlin Android Studio 环境搭建
  11. 深度学习导论 - 读李宏毅《1天搞懂深度学习》
  12. java IO流学习总结
  13. 服务器操作系统套什么定额,数据库服务器套什么定额
  14. python大括号_python大括号 Python中小括号中括号大括号怎么用?
  15. 基于C++的即时通信软件设计
  16. vmware softice
  17. android 资源文件类型,命名规则(配置限定符名称),及其加载规则
  18. app模式会被第三方平台模式取代吗_第三方APP逐渐被替代?网友:手机自带的足够用了...
  19. dango shell 操作crud
  20. iOS8高清壁纸 - 专为iOS8量身定做,每日更新

热门文章

  1. 端口聚合 / 链路聚合
  2. 【前端开发之旅】简单实用HTML制作表格
  3. 网络安全入行?来了解下网络安全从业人员类别及其工作任务
  4. 【华为OD机试真题 python】数轴上两个点集距离
  5. 苹果手机计算机的使用技巧,IPHONE玩机技巧介绍 让你的操作更高效
  6. c语言二维vector大小,vector作为二维数组
  7. 计算机硬盘是内存储器还是外存储器,计算机的内存储器比外存储器很多朋友觉得自己攒机是一件麻烦的事...
  8. js调用java线程_100%原生的JavaScript多线程和并行执行库:Hamsters.js
  9. 蝠鲼觅食优化(MRFO)-Matlab代码
  10. java jaxb_JavaEE学习之JAXB