引言

最近行情适合量价因子,故选择东吴证券技术分析拥抱选股系列文章来复现。目前完成内容:高频量价、上下影线、换手率分布均匀度、cpv因子

数据获取

因为东吴证券量价因子需要高频数据,也就是分钟级别,故选用akshare来提取。

ak.stock_zh_a_minute(symbol=ts_code.split('.')[1].lower()+ts_code.split('.')[0], period='1')
# 获取最近的2w条数据。实时

因为akshare的接口设计问题比较多,自行查阅akshare文档

日线数据选择tushare,但因为积分原因,使用xcec_tushare

df2 = pro.daily_basic_ts(ts_code=ts_code, start_date=start_date, end_date=end_date)
df1 = pro.daily(ts_code=ts_code, start_date=start_date, end_date=end_date)
# 获取 当日涨跌幅、流通市值、总市值、换手率、波动率

整体代码:

for ts_code in tqdm(zz500):#tqdm(zz500):# zz500.set_description("Processing %s" % ts_code)df2 = pro.daily_basic_ts(ts_code=ts_code, start_date=start_date, end_date=end_date)df1 = pro.daily(ts_code=ts_code, start_date=start_date, end_date=end_date)df_ = pd.DataFrame(pd.merge(df1,df2,on='trade_date',how='inner'))df_ = df_.sort_values(by='trade_date')stock_zh_a_minute_df = ak.stock_zh_a_minute(symbol=ts_code.split('.')[1].lower()+ts_code.split('.')[0], period='1')stock_zh_a_minute_df.index = pd.to_datetime(stock_zh_a_minute_df.day)df_=mpd.DataFrame(df_)def lamb(df):time = df return stock_zh_a_minute_df.loc[time[:4]+'-'+time[4:-2]+'-'+time[-2:],'volume'].astype('float').corr(stock_zh_a_minute_df.loc[time[:4]+'-'+time[4:-2]+'-'+time[-2:],'close'].astype('float'))df_['pv'] = df_['trade_date'].apply(lamb)

东吴证券-cpv因子复现系列1——数据集获取相关推荐

  1. 研报复现系列(一):【方正证券】跟踪聪明钱:从分钟行情数据到选股因子

    1.研报概述 本文是研报复现系列的第一篇,文本复现了[方正证券]的研报[跟踪聪明钱:从分钟行情数据到选股因子]. 该研报尝试从分钟行情数据中挖掘出那些聪明人(即机构)所做的交易,称为"聪明钱 ...

  2. Scikit-learn学习系列 | 1. sklearn的简要使用介绍与数据集获取

    如有错误,恳请指出. 以下内容整理自专栏:博主"文火冰糖的硅基工坊"的专栏--机器学习与scikit-learn,对部分的文章的简化与整理. 文章目录 1. scikit-lear ...

  3. 研报复现系列(五)【光大证券】放量恰是入市时:成交量择时初探

    前言 我们是国内普通高校的在校学生,同时也是量化投资的初学者.我们的学校不是清北复交,也没有金融工程实验室,同时地处三线小城,因此我们在校期间较难获得量化实习机会,但我们期待与业界进行沟通.交流. 蔡 ...

  4. 研报复现系列(三):【东莞证券】股吧里说了什么?——基于文本舆情构建股市情绪指标

    1.研报概述 本文是研报复现系列的第三篇,本文复现了[东莞证券]的研报[股吧里说了什么?--基于文本舆情构建股市情绪指标] 该研报试图利用文本情感分析,通过统计情绪词,将股民的评论进行情感分析,联系情 ...

  5. 【FPN车辆目标检测】数据集获取以及Windows7+TensorFlow+Faster-RCNN+FPN代码环境配置和运行过程实测

    PS 最近在学目标检测想用最新的FPN网络,刚好看到这篇博客https://blog.csdn.net/Angela_qin/article/details/80944604尝试把它复现,说的小白一点 ...

  6. 『论文复现系列』3.Glove

    ★★★ 本文源自AlStudio社区精品项目,[点击此处]查看更多精品内容 >>> 『论文复现系列』3.Glove Glove 论文 | Global Vectors for Wor ...

  7. 目标检测系列(preface) 数据集DataSets

    目标检测系列(Preface) - 数据集 公开数据集(PASCAL VOC // COCO)介绍 一.PASCAL VOC格式数据集 官网 标注工具 1.数据集一般格式 VOC2007 Annota ...

  8. R语言使用dplyr包基于因子变量(factor)将原dataframe拆分为每一个因子对应的单独数据集dataframe实战

    R语言使用dplyr包基于因子变量(factor)将原dataframe拆分为每一个因子对应的单独数据集dataframe实战 目录

  9. 不得不赞!一个国内(可能)最好的海量CV数据集获取网站

    在CV等计算机领域中,好的数据,对模型训练至关重要.自己做数据,即昂贵又费时费力:但是,使用现成的数据集,即不好找又不好下载及使用.直到最近,CV君找到一个数据集获取神器 Graviti Open D ...

最新文章

  1. Podfile 常见语法
  2. UNIX再学习 -- 系统数据文件和信息
  3. HTML5 中的下载简化处理
  4. 无符号定点数加法运算的VHDL描述
  5. Android之内核学习笔记
  6. java正则表达式及api_Java API 之 正则表达式
  7. android textview密文,TextView 明密文处理
  8. Spring with Hibernate persistence and transactions
  9. html5 history api_window.history的跳转探索
  10. LINUX双击无法启动解决一例
  11. 深度学习赋能侧信道攻击
  12. 徐俊明《图论及其应用》教学大纲
  13. 实战一:输出“王者荣耀”的游戏角色
  14. 【正点原子Linux连载】第六十五章 Linux 音频驱动实验 -摘自【正点原子】I.MX6U嵌入式Linux驱动开发指南V1.0
  15. 我在华为度过的 “两辈子”(学习那些在大厂表现优秀的人)
  16. STM32L476应用开发之七:流量的PID控制
  17. 整合UWALOHA和VBF
  18. dor服务器阵列修复,服务器raid5阵列故障排查及数据恢复方法篇
  19. jupyter改字体主题美化
  20. 影响微信公众号排名的因素

热门文章

  1. PDF编辑技巧1:添加页码和编辑文字
  2. Py_FontMaker和GUI_Py_FontMaker制作嵌入式字库工具,支持内部和外部字库,支持LVGL和非LVGL,支持hash查表,支持RLE压缩,支持图标字体和emoji混合消息显示
  3. 定时任务-------摸鱼王的日常问题
  4. PP助手数据采集分析
  5. 绫致时装讲述O2O细节:野心在“私人定制” - 移动购物 - 亿邦动力网
  6. 人脸口罩识别_APP开发
  7. 股市学习稳扎稳打(十一)可转债的股东优先配售权益
  8. 蓝桥杯 历届试题 PREV-11 横向打印二叉树 排序二叉树
  9. 在德国找Werksudent(Hiwi,即学生工)攻略info(计算机专业)篇
  10. 报错 kernel:NMI watchdog: BUG: soft lockup - CPU#1 stuck for 22s! [insmod:55902]处理