当我准备用LSTM神经网络模型去预测商品的价格的时候,其中考虑到了与商品有关的如销量,价格,人均可支配收入,cpi等维度。问题是这些维度有一些是以天为单位的,有些是以月为单位的,只有统一了单位才可以进行模型训练。我看到有很多类似价格预测的文献里,作者有提到用插值法将月度数据转换为日度数据,但是没有提到具体怎么操作。我在百度上搜,大多数是将日度数据转换成月度数据,很少看见有用的方法。今天这里就想教大家怎么将月度数据合理的转换成日度数据。 假如我们有以下月度数据:

该如何将他们转成日度数据呢?
方法一: 
当月的每一天都按照月度数据填补,如:

这样操作起来最简单,但是失去了一些数据的规律性和连贯性。

方法二:
插值法(interpolation),如:

这样是不是就看起来合理了许多,但是可能离真实情况可能还是有很大差别,但是比方法一更容易接受和理解。
俗话说,巧妇难为无米之炊。当我们缺少需要的日度数据的时候,用插值法就是一个很好的办法。

下面是具体的例子:

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
df=pd.read_excel('cpi 月.xlsx')
y1=df['fruit_cpi']
x1=df['Date']
plt.plot(x1,y1)
df.shape

df1=df.set_index('Date').resample('D').interpolate()
date = pd.date_range(start='04/01/2018', periods=len(df1.index))
df1.insert(0,'Date',date,True)
y_afterIp=df1['fruit_cpi']
x_afterIp=df1['Date']plt.plot(x_afterIp,y_afterIp)
df1.shape

数据的行数就从36变到了1066,意味着我们把三年的月度数据转换成了三年的日度数据。而plot出来的图与之前并没有什么大的改变,意味着我们保留了数据的规律性。

如果有不足之处,欢迎评论区里指出来,十分感谢

如何将月度数据转换成日度数据相关推荐

  1. [多图]全球范围内Linux用户普及度数据

    Pingdom通过Google的搜索趋势统计出了全球范围内Linux的用户普及度数据,结果显示,印度,古巴和俄罗斯是全球Linux应用最广泛,而捷克和印度尼西亚紧随其后. 在西方国家中,Linux在德 ...

  2. 将COleDateTime类型数据转换成char *数据

    用OpenCV做多摄像头校准时间,在图像上显示时间信息,需求要将COleDateTime类型数据转换成char *数据 具体代码如下: 1: COleDateTime m_checkDate; 2: ...

  3. 证券市场低频日度数据

    证券市场低频日度数据 TAGS: 低频数据.日度数据.股票.期货.期权.行情数据 [免费分享,会经常更新,欢迎点赞关注~也欢迎大家提更多低频数据需求] 详情请见: 链接:https://pan.bai ...

  4. QIIME2导入数据-fq数据转换成qza数据-使用方法心得

    启动QIIME2运行环境 conda activate qiime2-2019.4 ###新建并定位设置到存在fq数据的文件夹 mkdir qiime2-importing-tutorial ##建立 ...

  5. 2013-2021年核心城市空气质量日度数据

    2013-2021年核心城市空气质量日度数据 1.时间:2013年12月-2021年4月13日 2.城市包括:北京 上海 广州 深圳 杭州 天津 成都 南京 西安 武汉 3.指标:日期.AQI.范围. ...

  6. 知识图谱构建3——使用D2RQ将mysql数据转换成RDF数据

    知识图谱构建3--使用D2RQ将mysql数据转换成RDF数据 D2RQ的安装可以参考:https://blog.csdn.net/weixin_41104835/article/details/88 ...

  7. 中国核心城市空气质量日度数据(2013-2021年)

    数据集名称:中国核心城市空气质量日度数据 时间范围:2013年12月-2021年4月 数据来源:CCAD 相关说明: 城市包括:北京 上海 广州 深圳 杭州 天津 成都 南京 西安 武汉数据 包含字段 ...

  8. Python将经纬度数据转换成浮点数据

    文章目录 前言 一.数据格式 二.代码 总结 前言 最近遇到一个事情,领导让我将一个excel中的经纬度格式的文件转成浮点数的格式,例如:将 东经130°22′33″纬度30°22′33″ 这种数据转 ...

  9. 新能源汽车数据库-分类型/地区/级别月度销量2015-2021进出口数据

    (1)新能源汽车进出口数据 1.数据来源:自主整理 2.时间跨度:2018-2020年 3.区域范围:全国 4.指标说明: 包含如下指标的进出口数据:混合动力客车(10座及以上).纯电动客车(10座及 ...

最新文章

  1. 骑摩托的蒙娜丽莎 - 曼妙风骚的花式慢跑算法
  2. Servlet的初始化参数
  3. asic面试题目 英伟达_英伟达一面总结
  4. 【iOS】【项目全局动态埋点】Runtime+Aspects(hook)
  5. wpf 修改label值_WPF 获取动态添加控件的值
  6. 利用python爬虫(part17)--初识selenium
  7. java广度优先爬虫示例,【爬虫】广度优先遍历抓取数据概述
  8. Android(组件大全)
  9. Google首席决策师告诉你,AI和数据科学团队需要哪10种角色
  10. 【Elasticsearch】改进布尔查询的搜索相关性
  11. c( )函数--R语言
  12. NMEA0183协议中的GGA语句解析
  13. win7下maven安装
  14. 《Netty权威指南》(五)ByteBuf源码分析
  15. java找不到符号 符号:类xxx位置xxxx
  16. Golang——Go语言发展史(一)
  17. 学习Photoshop的一些网站以及找素材的网站
  18. mysql根据班级排序语文成绩_mysql 成绩排序
  19. 分形吧matlab,使用matlab画分形图.pdf
  20. 前端攻城狮的自我修养1

热门文章

  1. JS toFixed(2) 返回 -0.00
  2. Kali Linux速查手记(长期更新)
  3. 使用rust和actix实现一个视频流服务器
  4. Android中Uri和Path之间的转换
  5. Unix/Linux下的Curses库开发指南——第三章curses库窗口
  6. java获取图片相对路径_相对路径和绝对路径的区别,java获取项目访问路径的方法...
  7. implicit declaration of function 警告解决方法 (函数的隐式说明)
  8. 知意配音和讯飞配音哪个好用点?这是一篇对比文
  9. Base64 编码原理及代码实现
  10. 优先级倒挂(priority inversion)