二手车市场价格预测----项目第一天
写在前面
细节展示
本节重难点
关于学习方法的思考
01、写在前面
本项目来自于阿里天池实验室,数据挖掘训练营。地址:AI训练营-阿里云天池 (aliyun.com)
02、细节展示
03、本节重难点
项目实现完整流程:
- 赛题理解
- 数据分析
- 特征工程
- 建模调参
- 模型融合
- 二手车交易价格预测
赛题理解(重难知识点)
- 评估标准:对模型效果好坏的量化打分。
- 本赛题的评价指标MAN(mean absolute error)即平均绝对误差。需手写计算公式
- 一般回归问题的评价指标:平均绝对误差(Mean Absolute Error,MAE),均方误差(Mean Squared Error,MSE),平均绝对百分误差(Mean Absolute Percentage Error,MAPE),均方根误差(Root Mean Squared Error), R2(R-Square)
- 分类算法常见的评估指标如下:
对于二类分类器/分类算法,评价指标主要有accuracy, [Precision,Recall,F-score,Pr曲线],ROC-AUC曲线。
对于多类分类器/分类算法,评价指标主要有accuracy, [宏平均和微平均,F-score]。
5、下载并读取数据:手录代码
6、sklearn.metrics模块含有需要的评估指标。例如:accuracy,recall,ROC,MAN,MSN等。
04、关于学习方法的思考
在做中学是比较高效的方法。具体呢,就是找一个项目来做。啃得过程中遇到看不懂的地方需要查阅资料。不需要深究,只需要知道它是干什么的,大约怎么用。(前提是python基础,一些第三方库基础操作要能看懂,但不要求特别深入、熟练)。
最后一句话结束本章:前路漫长,诸君共勉!
二手车市场价格预测----项目第一天相关推荐
- 阿里云天池竞赛——二手车价格预测项目(个人练习+源代码)
# 导入需要的库 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sn ...
- 数据挖掘二手车价格预测 Task05:模型融合
模型融合是kaggle等比赛中经常使用到的一个利器,它通常可以在各种不同的机器学习任务中使结果获得提升.顾名思义,模型融合就是综合考虑不同模型的情况,并将它们的结果融合到一起.模型融合主要通过几部分来 ...
- 基于二手车价格预测——特征工程
特征工程 特征工程 分析: 第一步:异常值处理 箱型图法: 第二步:特征构造 第三步:数据分桶 数据分桶详解 删除不需要的数据 特征归一化 总结--特征 1.特征构造: 2.异常类型处理 3.构造新特 ...
- 【组队学习】【24期】河北邀请赛(二手车价格预测)
河北邀请赛(二手车价格预测) 开源内容: https://github.com/datawhalechina/team-learning-data-mining/tree/master/SecondH ...
- 基于机器学习的二手车价格预测及应用实现(预测系统实现)
1.摘要 随着中国汽车工业的迅速发展,国内的汽车数量也在迅速增长.新车销售市场已经逐渐饱和,而二手车交易市场正在兴起.但是,由于中国的二手车市场尚未成熟,与发达国家相比仍存在较大差距.其中一个重要原因 ...
- 从零开始的时间序列预测项目
文章目录 Monthly Armed Robberies in Boston 概述 问题描述 测试工具 验证集 模型评估 性能度量 测试策略 基线模型 数据分析 概括性统计量 折线图 密度图 箱线图 ...
- Python二手车价格预测(一)—— 数据处理
文章目录 前言 一.数据 二.处理过程 1.引入库 2.读入数据 3.删除无效列与填充空值 4.数值型数据处理 5.日期型数据处理 6.二值型数据处理 7.One-Hot型数据处理 结语 前言 一年半 ...
- 二手车价格预测预测-特征工程
特征工程是比赛中最至关重要的的一块,特别的传统的比赛,大家的模型可能都差不多,调参带来的效果增幅是非常有限的,但特征工程的好坏往往会决定了最终的排名和成绩. 特征工程的主要目的还是在于将数据转换为能更 ...
- Datawhale task3打卡——二手车价格预测
Datawhale task3打卡--二手车价格预测 1. 异常处理(*易忽略) 1.1 通过箱线图(或 3-Sigma)分析删除异常值 1.2 BOX-COX 转换(处理有偏分布) 1.3 长尾截断 ...
最新文章
- CodeSmith实用技巧(二):使用FileNameEditor
- 后端系统开发之异常情况处理
- Kettle使用_29 转换里使用参数
- 【数据结构与算法】之深入解析“单词接龙”的求解思路与算法示例
- HDFS的API操作-访问权限问题
- ASP.NET“.NET研究”下用URLRewriter重写二级域名
- QOMO Linux 4.0 正式版发布
- 基于(Python下的OpenCV)图像处理的喷墨墨滴形状规范检测
- C++自定义迭代器模板,实现ArrayList基本操作,自定义迭代器遍历
- FatFs(通用FAT文件系统模块)下载与介绍
- 【微软雅黑字体的简单介绍】
- 项目实训第一周第三篇
- Python+OpenCV人脸识别签到考勤系统
- java英语介绍_java自我介绍英语口语
- 看了这篇文章,再也不用找人设计名片卡证啦!
- 联想拯救者R720加装固态硬盘过程中遇到的小问题
- UEA数据集和UCR数据集的处理
- Activity到底是什么(新手学Android)
- hdu 5514 容斥
- Matlab——filter函数和butter函数