为什么量化分析要从线性回归开始
线性回归可以用较低的计算和分析成本,给出一个基于现实数据推导的、“质量还过得去”的预测或解释,尽管这个预测或解释未必合理和能用。
线性回归分析(Linealregression analysis)是每一个学统计和量化知识的人一开始接触到的最基本的分析框架。这个框架最初可以追溯到高斯于1806年提出的“最小二乘法”,当时科学家用这个方法计算天体的运动轨迹。但是过了200多年,线性回归仍然活跃在各行各业,包括量化投资领域。它的核心思想和方法,对其他量化分析方法贡献巨大。究竟线性回归分析在量化领域有什么独特优势呢?
首先,线性回归分析假设独立变量(independent variable)和依赖变量(dependentvariable)之间存在着线性相关,这个假设非常有意义。尽管这个假设未必符合很多现实情况,但是没有问题,我们可以通过变量转换来让一些非线性关系变成线性关系。
例如在一个模型Y=a+bX2当中,X变量对Y变量可能是2次方的线性关系,那么我们就可以把X2变成一个新的变量X’,使得新的方程Y=a+bX’仍然满足线性关系,从而可以把线性回归分析的框架套用进去。另一方面,尽管现实中很多变量之间的关系是非线性的,但是只要我们能够截取一段比较短的时间,那么他们的关系总可以用一小段直线来近似模拟。只要我们不预测太长一段时间,那么预测的精度也是可以有一定保证的。
其次,线性回归分析假设变量之间的变化由其主要的线性关系决定,但是也受到其他随机的因素干扰,这些干扰导致了预测产生误差。进一步的,线性回归分析假设这些随机的因素干扰对整体影响是很小的。
那么如何识别主要关系和随机干扰呢?最小二乘法的思想就是,找出一条直线,让所有数据点和直线之间的合计距离(随机干扰误差)最短。那么这条直线就表示了一个最优的线性关系估计,这个线性关系估计受到的随机干扰是最小的。
最后也是最关键的,线性回归可以用较低的计算和分析成本,给出一个基于现实数据推导的、“质量还过得去”的预测或解释。只要给得出数据,线性回归总会给出一个确定的答案(除非是极个别的例子)。大部分的现成软件,从最流行的Excel到比较小众的R2或者MathLab 都支持线性回归,基本上都是一键搞定。
但是这里面也有几个要注意的地方
01、一是相关性不等于因果性,因为因果性除了相关,还要有排他性作为辅助。最简单的例子是公鸡打鸣出太阳,这是相关性不是因果性,因为没了公鸡打鸣,太阳照样升起。
02、二是线性预测的精确性相对于其他的方法如指数平滑法等相比一般不高,这是因为现实数据中的相关性可能会随着时间变化。最简单的莫过于一个赚钱的算法,过了一段时间可能就不赚钱了。这表明算法和赚钱之间的相关度有所下降。因此对于比较长期的数据和预测,线性回归就只能作为一个粗略的方向性参考。
不过作为一个基础性的工具,线性回归方法仍然为众多国内和国际的量化机构所采用。在一大堆元数据当中,通过线性回归先大致筛选出一批有可能相关的变量,然后再在里面看看是否存在逻辑相关性,以及有没有其他的算法可以更加精确地描述变量之间的关系。这里面线性回归充当了一个筛子的角色,可以节省量化分析师大量的前期工作。
拓展阅读:
1.一个量化策略师的自白(好文强烈推荐)
2.市面上经典的量化交易策略都在这里了!(源码)
3.期货/股票数据大全查询(历史/实时/Tick/财务等)
4.干货| 量化金融经典理论、重要模型、发展简史大全
5.从量化到高频交易,不可不读的五本书
6.高频交易四大派系大揭秘
为什么量化分析要从线性回归开始相关推荐
- 股票量化分析工具QTYX使用攻略代码说明——高速版本地行情源v2.5.1
搭建自己的量化系统 如果要长期在市场中立于不败之地!必须要形成一套自己的交易系统.否则,赚钱或者亏钱我们很难归纳总结,往往是凭借运气赚钱,而不是合理的系统模型,一时凭借运气赚的钱长期来看会因为实力还回 ...
- 股票量化分析工具QTYX使用攻略——高速版本地行情源(更新v2.5.4)
搭建自己的量化系统 如果要长期在市场中立于不败之地!必须要形成一套自己的交易系统.否则,赚钱或者亏钱我们很难归纳总结,往往是凭借运气赚钱,而不是合理的系统模型,一时凭借运气赚的钱长期来看会因为实力还回 ...
- 多线程爬虫获取A股历史行情数据!股票量化分析工具QTYX-V2.2.3
前言 股票数据的获取是从事股票分析的第一步. 数据获取的途径有很多,对大家来说除了数据的质量以外,获取的效率是第二敏感的点. 市面上有一些股票数据服务平台提供了Python接口来获取数据. 总的来说, ...
- TensorRT-8量化分析
TensorRT-8量化分析 本文讲非对称量化.量化方式等等一些细节,不过有一段时间在做基于TensorRT的量化,需要看下TensorRT的量化细节.这次文章是偏实践的一篇,主要过一下TensorR ...
- 决策树模型回归可视化分析_Excel进行线性回归模型分析的操作——「杏花开生物医药统计」...
通常我们在搜集和整理数据时候会用到Excel这个软件,而分析数据会用到一些专门的工具比如SPSS.R.SAS等. 但其实有时候我们的数据量并不是非常的大,对于一些分析可能只需要一些简单的定性或简单 ...
- garch预测 python_【2019年度合辑】手把手教你用Python做股票量化分析
引言 不知不觉,2019年已接近尾声,Python金融量化公众号也有一年零两个月.公众号自设立以来,专注于分享Python在金融量化领域的应用,发布了四十余篇原创文章,超过两万人关注.这一路走来,有过 ...
- 从直觉主义到量化分析 让大数据做主
文章讲的是从直觉主义到量化分析 让大数据做主,还记得去年8·15电商竞争价格大战吗?如果你是某电商CEO,你还会采用这样的竞争战略吗?变化是永恒的主题,企业管理不能一成不变.在大数据时代,电商采用价格 ...
- 【Python金融量化 2- 100 】股票量化分析基本知识
Author:Runsen 文章目录 什么是股票 什么是量化分析 股票代码 K线图 tushare的抓取数据 pandas_datareader 什么是股票 股票(stock)是股份公司发行的所有权凭 ...
- 阿里云Lindorm联合智臾科技发布,金融高频交易数据量化分析与处理方案
简介:面向银行.保险.券商和私募的高频数据高性能一站式解决方案. 金融市场L1/L2的报价和交易数据是量化交易研究非常重要的数据,随着数字业务快速演进,具有时序特征的交易数据激增,对底层数据库和量化分 ...
最新文章
- 数组拷贝问题的解决方法
- Layui / WEB UI
- 使用Math 类 和 Random类 两种方式生成 20 到30之间的随机整数---java基础
- ssl1692-魔板【HSAH,bfs】
- 【Microsoft Azure学习之旅】测试消息队列(Service Bus Queue)是否会丢消息
- 3D中的相机 - 投影矩阵和视图矩阵
- 什么是9.png,如何制作,如何使用。
- 10g CRS Clustware Installation安装图
- Redis Cluster 添加/删除 完整折腾步骤
- 苹果/mac提供解决方法:macOS Big Sur 更新导致旧款 MacBook Pro 黑屏变砖
- 基于SSM的猫头鹰在线影院订票网站
- 翻山越岭上uvaoj
- 直播录屏软件哪个好?什么软件可以录屏直播会议?
- matlab正弦信号采样,matlab模拟信号的欠采样及原理理解
- 弱水三千的由来(转)
- 手把手带你学python自动化测试(一)——自动化测试环境搭建
- Pytest-Python单元测试
- Java要抛弃祖宗的基业,Java程序员危险了!
- Cityscapes:适用于汽车自动驾驶的训练数据集
- 自学app难不难 有c语言,软件编程入门自学到底难不难 零基础自学软件编程的方法...