华泰人工智能系列之一人工智能选股框架及经典算法简介
1.人工智能含义:
本质是以数理模型为核心工具,结合控制论、认知心理学等其它学科的研究成果,最终由计算机系统模拟人类的感知、推理、学习、决策等功能。
2.机器学习的对象:
是某种客观存在的规律。规律有简单、复杂的。智能投顾学习的是资本市场中投资决策和收益之间的规律。
3.机器学习遵循基本的流程:
数据获取、特征提取、 数据转换、模型训练、模型选择和模型预测。
1)数据获取
数据获取途径:多样,一般通过数据库和网络爬虫获取。
机器学习模型过程中首先需要考虑的问题:获取大量的、高质量的数据(数据的数量不足,或者信噪比过低,会严重就影响算法效果。)
2)特征提取
为什么进行特征提取:原始数据由于格式和类型的限制,可能无法直接用于训练模型。而优质的特征能够起到事半功倍的效果。因此需要先从原始数据中提取富有信息量的、可以放入模型训练的特征,这一步称为特征提取。
方法有:人工经验和模型数据驱动提取,优质的特征能够起到事半功倍的效果。
3)数据转换
①数据转换的重要性:看似简单,但往往是机器学习成败的关键。
②数据转换类型包括缺失值填充,标准化和降维。
③数据转换的原因:数据通常不是完美的,会影响到机器学习模型的训练速率和准确率,在正式训练之前,需要对数据进行转换。
④不完美的数据类型及处理方法:存在缺失值、不同特征的取值范围不同、不同特征之间具有相关性。
缺失值的条目,可以直接删去或以总体均值填充。
标准化可以将所有特征限制在相同的范围内。
降维能够避免特征之间相关性的影响,也能避免维数灾难的发生。
机器学习模型可分为监督学习,非监督学习和强化学习。
模型选择通常借助交互验证和一系列评价指标。如果数据中包含特征和标签,希望学习特征和标签之间的对应关系,那么可以采用监督学习的方法;如果没有标签,希望探索特征自身的规律,那么可以采用非监督学习;如果学习任务由一系列行动和对应的奖赏组成,那么可以采用强化学习。如果需要预测的标签是分类变量,比如预测股票上涨还是下跌,那么可以采用分类方法;如果标签是连续的数值变量, 比如预测股票具体涨多少,那么可以采用回归方法。另外,样本和特征的个数,数据本身的特点,这些都决定了最终选择哪一种机器学习方法。
![image.png](https://upload-images.jianshu.io/upload_images/13726474-34afc064d098fb90.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
机器学习方法分类:监督学习、无监督学习、强化学习
4.机器学习方法的不同之处:
1⃣️监督学习由使用者给出特征和标签,由算法挖掘规律,学习一个模式,并且根据此模式预测新的特征所对应的标签。督学习应用更广泛,学习效果好。监督学习是教师(使用者)给出问题(特征)和正 确答案(标签),由学生(算法)挖掘规律,学习一个模式,并且根据此模式回答新的 问题(预测新的特征所对应的标签)。
2⃣️无监督学习不给出标签,由算法仅仅根据原始特征寻找模式,挖掘数据自身蕴含的规律。无监督学习不给出正确答案,由算法仅根据原始特征寻找模式。
3⃣️强化学习的目标是让模型学会使奖赏最大化的决策,是三大门类中最 年轻也是最困难的方法。
5.监督学习方法有:线性回归、岭回归、 Lasso 回归、逻辑回归、线性判别分析和二次判别分析、支持向量机、决 策树、随机森林、AdaBoost、神经网络、深度学习和 K 最近邻算法在内的 众多监督学习方法。
6.无监督学习方法有:聚类和降维是常用的无监督学习方法。聚类包括 K 均值聚类、分层聚类和谱聚类。降维包括以主成分分析为代表的线性降维,以及以流形学习为代表的非线性降维。
华泰人工智能系列之一人工智能选股框架及经典算法简介相关推荐
- 华泰人工智能系列_2020人工智能(25份)
2020人工智能(25份) ├1 阿里云-中国企业2020:人工智能应用实践-2019.8-50页.pdf ├2 人工智能2020:落地挑战与应对-爱分析-2020.3-56页.pdf ├3 ...
- 【从零开始人工智能01】人工智能运行开发环境搭建
从零开始人工智能系列: 人工智能运行开发环境搭建 第一个人工智能小程序:强化学习找金币 人工智能运行开发环境搭建 一.系统要求 操作系统为Win10.如果有条件的话,建议还是在Linux系统下搭建人工 ...
- 研报复现初探—华泰金工人工智能选股系列之boosting模型
上一篇文章对于华泰金工人工智能选股系列之随机森林模型进行了复现的初探.实际上随机森林模型本身是bagging这一集成学习算法在决策树中的应用,其本质是对训练集的样本进行bootstrap随机抽样n次, ...
- 《中国人工智能系列白皮书——智能驾驶》精编
[转] https://www.leiphone.com/news/201710/x7tHyZS8lsohsatP.html 10月12日,中国人工智能学会发布中国人工智能系列白皮书,雷锋网作为邀请媒 ...
- 百度联手清华大学出版社,打造国内首套产教融合人工智能系列教材
9月22日,百度与清华大学出版社签署战略合作协议,双方将携手打造国内首套产教融合人工智能系列教材,共享各类智库教材.题库.课程等资源:同时,双方将在师资培训及学生实践基地等领域展开深入合作,推进师资培 ...
- Interview:人工智能岗位面试—人工智能岗位求职之机器学习算法工程师必备知识框架结构图
Interview:人工智能岗位面试-人工智能岗位求职之机器学习算法工程师必备知识框架结构图 目录 机器学习算法工程师思维导图 机器学习算法工程师思维导图 后期继续更新-- 1.思维导图01
- 21天实战人工智能系列:人工智能产品经理最佳实践(1)
一.前言 打算面向想从事人工智能产品经理职位的人,写一个系列的专题,对人工智能产品经理做一个全面的介绍,初步计划写21个专题,每天一篇,算是对自己的一种鞭策,每天的任务定性,定量,希望自己能够坚持下来 ...
- 人工智能系列电子书分享
平常收集的人工智能系列电子书分享给有需要的人 此次分享的电子书,均为各大开源网站推出的分享书籍,不存在侵权,不收费,也请不要倒卖,被认为是收费或侵权. 更多开放书籍课自行查看菜鸟 教程,以及Linux ...
- 黑白美女照上色系列,人工智能一键给黑白照片上色
标题:黑白美女照上色系列,人工智能一键给黑白照片上色 每个人的回忆里,都会有不曾遗忘的旧时光,旧时光里的旧记忆,留给我们多少留恋,相信大家手里面都会有些许旧时光的黑白照片记录了我们的童年童趣,再度翻阅 ...
最新文章
- Tomcat:Connection reset by peer: socket write error
- 如何运维能让网站稳定高效--稳定篇
- Android Studio 第六十一期 - Android ToastUtil
- Python 办公自动化之一 Excel
- Xampp修改默认端口号
- mysql 手动配置服务器_Win7系统下手动配置Apache+PHP+MySQL环境WEB服务器 -电脑资料...
- 我的前端成长之路:中医药大学毕业的业务女前端修炼之路
- flutter PositionedTransition 实现缩放动画
- 《Spring Cloud》学习(一) 服务治理!
- hrm系统源码php,开源HRM源码系统下载
- 北大青鸟python教程_北大青鸟python课程六大优势
- nginx: [emerg] unknown directive “锘? in******
- windows挂起进程方法介绍
- 豆瓣TOP250资源搜索——油猴脚本Tampermonkey
- adb logcat 命令
- ORACLE 11.2.0.4 坏块处理 ORA-00600ORA-00607
- java语言开发手机游戏_手机上的JAVA游戏和JAVA软件,是电脑上的JAVA语言编写的吗?他们之间有什么联系...
- 商业智能架构全景图——谈谈商务智能
- Linux之有趣的命令行
- Latex基本语法总结