写在前面

细节展示

本节重难点

关于学习方法的思考

01、写在前面

本项目来自于阿里天池实验室,数据挖掘训练营。地址:AI训练营-阿里云天池 (aliyun.com)

02、细节展示

03、本节重难点

项目实现完整流程:

  • 赛题理解
  • 数据分析
  • 特征工程
  • 建模调参
  • 模型融合
  • 二手车交易价格预测

赛题理解(重难知识点)

  1. 评估标准:对模型效果好坏的量化打分。
  2. 本赛题的评价指标MAN(mean absolute error)即平均绝对误差。需手写计算公式
  3. 一般回归问题的评价指标:平均绝对误差(Mean Absolute Error,MAE),均方误差(Mean Squared Error,MSE),平均绝对百分误差(Mean Absolute Percentage Error,MAPE),均方根误差(Root Mean Squared Error), R2(R-Square)
  4. 分类算法常见的评估指标如下:

对于二类分类器/分类算法,评价指标主要有accuracy, [Precision,Recall,F-score,Pr曲线],ROC-AUC曲线。

对于多类分类器/分类算法,评价指标主要有accuracy, [宏平均和微平均,F-score]。

5、下载并读取数据:手录代码

6、sklearn.metrics模块含有需要的评估指标。例如:accuracy,recall,ROC,MAN,MSN等。

04、关于学习方法的思考

在做中学是比较高效的方法。具体呢,就是找一个项目来做。啃得过程中遇到看不懂的地方需要查阅资料。不需要深究,只需要知道它是干什么的,大约怎么用。(前提是python基础,一些第三方库基础操作要能看懂,但不要求特别深入、熟练)。

最后一句话结束本章:前路漫长,诸君共勉!

二手车市场价格预测----项目第一天相关推荐

  1. 阿里云天池竞赛——二手车价格预测项目(个人练习+源代码)

    # 导入需要的库 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sn ...

  2. 数据挖掘二手车价格预测 Task05:模型融合

    模型融合是kaggle等比赛中经常使用到的一个利器,它通常可以在各种不同的机器学习任务中使结果获得提升.顾名思义,模型融合就是综合考虑不同模型的情况,并将它们的结果融合到一起.模型融合主要通过几部分来 ...

  3. 基于二手车价格预测——特征工程

    特征工程 特征工程 分析: 第一步:异常值处理 箱型图法: 第二步:特征构造 第三步:数据分桶 数据分桶详解 删除不需要的数据 特征归一化 总结--特征 1.特征构造: 2.异常类型处理 3.构造新特 ...

  4. 【组队学习】【24期】河北邀请赛(二手车价格预测)

    河北邀请赛(二手车价格预测) 开源内容: https://github.com/datawhalechina/team-learning-data-mining/tree/master/SecondH ...

  5. 基于机器学习的二手车价格预测及应用实现(预测系统实现)

    1.摘要 随着中国汽车工业的迅速发展,国内的汽车数量也在迅速增长.新车销售市场已经逐渐饱和,而二手车交易市场正在兴起.但是,由于中国的二手车市场尚未成熟,与发达国家相比仍存在较大差距.其中一个重要原因 ...

  6. 从零开始的时间序列预测项目

    文章目录 Monthly Armed Robberies in Boston 概述 问题描述 测试工具 验证集 模型评估 性能度量 测试策略 基线模型 数据分析 概括性统计量 折线图 密度图 箱线图 ...

  7. Python二手车价格预测(一)—— 数据处理

    文章目录 前言 一.数据 二.处理过程 1.引入库 2.读入数据 3.删除无效列与填充空值 4.数值型数据处理 5.日期型数据处理 6.二值型数据处理 7.One-Hot型数据处理 结语 前言 一年半 ...

  8. 二手车价格预测预测-特征工程

    特征工程是比赛中最至关重要的的一块,特别的传统的比赛,大家的模型可能都差不多,调参带来的效果增幅是非常有限的,但特征工程的好坏往往会决定了最终的排名和成绩. 特征工程的主要目的还是在于将数据转换为能更 ...

  9. Datawhale task3打卡——二手车价格预测

    Datawhale task3打卡--二手车价格预测 1. 异常处理(*易忽略) 1.1 通过箱线图(或 3-Sigma)分析删除异常值 1.2 BOX-COX 转换(处理有偏分布) 1.3 长尾截断 ...

最新文章

  1. CodeSmith实用技巧(二):使用FileNameEditor
  2. 后端系统开发之异常情况处理
  3. Kettle使用_29 转换里使用参数
  4. 【数据结构与算法】之深入解析“单词接龙”的求解思路与算法示例
  5. HDFS的API操作-访问权限问题
  6. ASP.NET“.NET研究”下用URLRewriter重写二级域名
  7. QOMO Linux 4.0 正式版发布
  8. 基于(Python下的OpenCV)图像处理的喷墨墨滴形状规范检测
  9. C++自定义迭代器模板,实现ArrayList基本操作,自定义迭代器遍历
  10. FatFs(通用FAT文件系统模块)下载与介绍
  11. 【微软雅黑字体的简单介绍】
  12. 项目实训第一周第三篇
  13. Python+OpenCV人脸识别签到考勤系统
  14. java英语介绍_java自我介绍英语口语
  15. 看了这篇文章,再也不用找人设计名片卡证啦!
  16. 联想拯救者R720加装固态硬盘过程中遇到的小问题
  17. UEA数据集和UCR数据集的处理
  18. Activity到底是什么(新手学Android)
  19. hdu 5514 容斥
  20. Matlab——filter函数和butter函数

热门文章

  1. 基于骨骼的动作识别:PoseConv3D
  2. 手势识别(二) - 静态手势动作识别
  3. iTunes发生未知错误5000解决
  4. 论人工智能机器人应具备的社会价值
  5. 专题总纲目录 Linux总纲
  6. 【整理】【精华】【实用】常用代码片段
  7. 微信小程序: 数组删除操作splice()的坑
  8. vue项目中实现用户登录以及token验证
  9. oracle驱动jdbc接口,ORACLE中三种类型的JDBC驱动
  10. 这可能是全网最好的字符串匹配算法讲解