一、项目背景

前两年,支付宝推出的“余额宝”赚尽无数人的眼球,同时也吸引的大量的小额资金进入。“余额宝”把用户的散钱利息提高到了年化收益率4.0%左右,比起银行活期存储存款0.3%左右高出太多了,也正在撼动着银行躺着赚钱的地位。

在金融市场,如果想获得年化收益率4%-5%左右也并非难事,通过“逆回购”一样可以。一旦遇到货币紧张时(银行缺钱),更可达到50%一天隔夜回够利率。我们就可以美美地在家里数钱了!!

所谓逆回购:通俗来讲,就是你(A)把钱借给别人(B),到期时,B按照约定利息,还给你(A)本资+利息。逆回购本身是无风险的。(操作银行储蓄存款类似)。现在火热吵起来的,阿里金融的“余额宝”利息与逆回购持平。我们可以猜测“余额 宝”的资金也在操作“逆回购”,不仅保持良好的流通性,同时也提供稳定的利息。

二、项目需求分析

通过历史数据分析,找出走势规律,发现当日高点,进行逆回购,赚取最高利息。

三、项目数据集

stock.csv

四、项目思路分析

基于项目的需求,我们可以使用Hive工具完成数据的分析。

1、首先将数据集stock.csv导入Hive中,用日期做为分区表的分区ID。

2、选取自己的股票编号stockid,分别统计该股票产品每日的最高价和最低价。

3、以分钟做为最小单位,统计出所选股票每天每分钟均价。

五、参考步骤

第一步:将数据导入Hive中

在hive中,创建 stock 表结构。

hive>  create table if not exists stock (tradedate STRING,tradetime STRING,stockid STRING,buyprice DOUBLE,buysize INT,sellprice DOUBLE,sellsize INT) >row format delimited fields terminated by ','  STORED AS TEXTFILE;

将HDFS中的股票历史数据导入hive中。

LOAD DATA INPATH '/user/hive/stock.csv' INTO TABLE stock;

创建分区表 stock_partition,用日期做为分区表的分区ID。

hive>  create table if not exists stock_partition (tradetime STRING,stockid STRING,buyprice DOUBLE,buysize INT,sellprice DOUBLE,sellsize INT)>partitioned by (tradedate STRING) row format delimited fields terminated by ',';

如果设置动态分区首先执行。

hive>set hive.exec.dynamic.partition.mode=nonstrict;

创建动态分区,将stock表中的数据导入stock_partition表。

hive>  insert overwrite table stock_partition partition(tradedate)> select tradetime,stockid,buyprice,buysize,sellprice,sellsize, tradedate from stock distribute by tradedate;

第二步:hive自定义UDF,统计204001该只股票每日的最高价和最低价

Hive 自定义Max统计最大值。

public class Max extends UDF{public Double evaluate(Double a, Double b) {if(a==null)a=0.0;if(b==null)b=0.0;if(a>=b){return a;}else{return b;}}}

Hive 自定义Min统计最小值。

public class Min  extends UDF{public Double evaluate(Double a, Double b) {                   if(a==null)a=0.0;if(b==null)b=0.0;if(a>=b){return b;}else{return a;}}}

将自定义的Max和Min分别打包成maxUDF.jar和minUDF.jar, 然后上传至/home/hadoop/hive目录下,添加Hive自定义的UDF函数

hive> add jar /home/hadoop/hive/maxUDF.jar;
hive> add jar /home/hadoop/hive/minUDF.jar;

创建Hive自定义的临时方法maxprice和minprice。

hive>  create temporary function maxprice  as 'com.hadoop.hive.Max';
hive>  create temporary function minprice  as 'com.hadoop.hive.Min';

统计204001股票,每日的最高价格和最低价格。

hive> select stockid,tradedate, max(maxprice(buyprice,sellprice)),min(minprice(buyprice,sellprice))  from stock_partition where stockid='204001' group by tradedate;

第三步:统计每分钟均价

统计204001这只股票,每天每分钟的均价

hive> select stockid,tradedate,substring(tradetime,0,4), sum(buyprice+sellprice)/(count(*)*2)  from stock_partition where stockid='204001' group by stockid, tradedate,substring(tradetime,0,4); 

用Hive分析“余额宝”躺着赚大钱背后的逻辑相关推荐

  1. Hive项目实战:用Hive分析“余额宝”躺着赚大钱背后的逻辑

    一.项目背景 前两年,支付宝推出的"余额宝"赚尽无数人的眼球,同时也吸引的大量的小额资金进入."余额宝"把用户的散钱利息提高到了年化收益率4.0%左右,比起银行 ...

  2. 聊个赚大钱的小逻辑丨20年前,当他选择了马云…

    放弃500万年薪,跟着马云拿500块月薪.不知道你有没有听过蔡崇信加入阿里的那段故事. 1999年,美国耶鲁大学毕业的蔡崇信,在知名的投资机构工作,年薪超过500万.但只见了马云第二面,他就主动提出要 ...

  3. 用“python”告别白日梦,躺着赚大钱

    你知道吗?刷脸付款.进站,已经不是纸上谈兵,以前老觉得二维码支付几乎是万能的,没想到自己的这张脸,也成为了通关密码. 据了解,广东省教育考试院消息引入"人脸识别智慧监考系统",要求 ...

  4. 三个躺着也能赚大钱的生意模式,无数老板解决生意困难的绝招!

    人们只愿意相信自己曾经看到过的.经历过的,对于自己从来没有接触过的东西,一律认为是骗人.这种想法非常错误,尤其是做老板想赚钱的,更不能有这种思想. 如果你卖服装,生意好的时候一年赚个10来万,生意不好 ...

  5. HDU 2255 奔小康赚大钱 带权二分图匹配 KM算法

    奔小康赚大钱 Time Limit: 1000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others) Total Sub ...

  6. 【HDU 2255】奔小康赚大钱 (最佳二分匹配KM算法)

    奔小康赚大钱 Time Limit: 1000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others) Total Sub ...

  7. 普通人赚大钱,做好这一点,才是真正的捷径

    在这个世上,大多数人都一直活在假象里. 他们根本看不到真实的世界,即使偶尔有人想给他分享下,但由于跟之前接受的观念不同,马上就怼回去了. 自然,从此以后,也就没人会告知他们真相. 只能一辈子,都活在别 ...

  8. 秒赚大钱_容易记住,赚大钱

    秒赚大钱 The human mind is a busy place. 人的头脑是一个繁忙的地方. Getting the attention of another person is always ...

  9. 物联网价值链中只有软件或者平台/服务才会赚大钱?

    前阵子看到一些讨论物联网时代中的价值链(IoT Value Chain)文章,也看过一些先进提到在物联网时代中,最重要的能力将会是"软硬件整合".或者是价值链中最大的将会是&quo ...

最新文章

  1. 利用select实现年月日三级联动的日期选择效果
  2. 解决url请求参数带中文时后台获取出现乱码问题
  3. DevOps笔记-10:金融行业分支策略的建议
  4. ios请求php接口失败,laravel,php_iOS调用Laravel接口返回错误信息,laravel,php,ios - phpStudy...
  5. 启用vsftpd服务
  6. 李飞飞:新技术变革时代的数据库产业
  7. JSON解析的几种方式
  8. ubuntu16.04安装virtualbox5.2
  9. [代码] DataGrid GridView 使用区别
  10. NYOJ259 - 茵茵的第一课
  11. 如何把IDEA项目与上传到Git中
  12. 忘记root密码,使用救援模式,grup设置密码
  13. android系统的图标大小,android开发中手机图标大小的问题
  14. 用什么软件录屏最好?录制高清视频无水印,简单几步就学会!
  15. 操作系统进程调度算法(c语言实现)
  16. 【情人节表白神器:送她一个HTML动态表白网站 带源码】
  17. 对于信息传播的一点理解
  18. jquery 弹出对话框
  19. neo4j 图数据库初步调研 三元组、属性图、图模型、超图、RDF-f
  20. 用Python爬取知乎上关于程序员的神回复

热门文章

  1. qq 第三方登录 前后端实现
  2. 读《断舍离》部分摘录
  3. Web3领域首个三消小游戏,近30交易量高
  4. Linux which命令
  5. 百度地图导航功能 希望对大家有用吧
  6. 动态加载页面分析、POST请求参数和内容爬取
  7. Python量化交易实战-40easytrader开发环境安装
  8. Arch Linux 安装简明流程
  9. vtk教程第一章介绍
  10. 华茅酒的酿制,不能缺少这位“空中酿酒师”!