强化学习经典视频教程总结
一、莫凡python
通俗易懂,值得学习,视频网站:
强化学习 (Reinforcement Learning) | 莫烦Python
简介
- 1.1 什么是强化学习
- 1.2 强化学习方法汇总
- 1.3 为什么用强化学习 Why?
- 1.4 课程要求
Q-learning
- 2.1 什么是 Q Leaning
- 2.2 小例子
- 2.3 Q-learning 算法更新
- 2.4 Q-learning 思维决策
Sarsa
- 3.1 什么是 Sarsa
- 3.2 Sarsa 算法更新
- 3.3 Sarsa 思维决策
- 3.4 什么是 Sarsa(lambda)
- 3.5 Sarsa-lambda
Deep Q Network
- 4.1 什么是 DQN
- 4.2 DQN 算法更新
- 4.3 DQN 神经网络
- 4.4 DQN 思维决策
- 4.5 OpenAI gym 环境库
- 4.6 Double DQN
- 4.7 Prioritized Experience Replay (DQN)
- 4.8 Dueling DQN
Policy Gradient
- 5.1 什么是 Policy Gradients
- 5.2 Policy Gradients 算法更新
- 5.3 Policy Gradients 思维决策
Actor Critic
- 6.1 什么是 Actor Critic
- 6.2 Actor Critic
- 6.3 什么是 DDPG
- 6.4 Deep Deterministic Policy Gradient (DDPG)
- 6.5 什么是 Asynchronous Advantage Actor-Critic (A3C)
- 6.6 Asynchronous Advantage Actor-Critic (A3C)
- 6.7 Distributed Proximal Policy Optimization (DPPO)
二、Reinforcement Learning Course by David Silver
David Silver是Deepmid 大神
【强化学习】Reinforcement Learning Course by David Silver_哔哩哔哩_bilibili
PPT下载:
Teaching - David Silver
三 、李宏毅老师 深度强化学习
深度强化学习(完整版) 李宏毅 国语教程_哔哩哔哩_bilibili
强化学习经典视频教程总结相关推荐
- 强化学习经典model-free方法总结
强化学习经典model-free方法总结 1. 基于值函数(value-based)的方法 1.1 sarsa 1.2 Q-learning 1.3 DQN 1.4 Double DQN 1.5 Du ...
- 强化学习经典算法笔记(十九):无监督策略学习算法Diversity Is All You Need
强化学习经典算法笔记19:无监督策略学习算法Diversity Is All You Need DIAYN核心要点 模型定义 目标函数的构造 DIAYN算法细节 目标函数的优化 SAC的训练 判别器的 ...
- 强化学习经典算法笔记(十二):近端策略优化算法(PPO)实现,基于A2C(下)
强化学习经典算法笔记(十二):近端策略优化算法(PPO)实现,基于A2C 本篇实现一个基于A2C框架的PPO算法,应用于连续动作空间任务. import torch import torch.nn a ...
- 强化学习经典算法笔记(十四):双延迟深度确定性策略梯度算法TD3的PyTorch实现
强化学习经典算法笔记(十四):双延迟深度确定性策略梯度算法TD3的PyTorch实现 TD3算法简介 TD3是Twin Delayed Deep Deterministic policy gradie ...
- 【学霸笔记】AlphaGo之父David Silver的强化学习经典课程笔记
聚焦AI干货,关注:决策智能与机器学习 AlphaGo之父David Silver的强化学习经典课程前文已有介绍,本想自己整理一下课程的学习笔记,但发现已经有学霸整理的很完善,不做东施效颦之举,在此分 ...
- 综述向:强化学习经典方法梳理
最近组内需要做强化学习相关研究,因为面对的是新项目,同事们对强化学习的原理都不太了解,我们就计划轮流在组内做一些不定期分享,补充相关的基础知识.于是我对强化学习的一些经典算法进行了梳理,并在此进行记录 ...
- 经典的深度强化学习劝退文读后感
目录 阅读经典的深度强化学习劝退文 主要阅读文章 相关政策学习 个人一点点小心得分享 阅读经典的深度强化学习劝退文 今天是来实验室的第一天,我准备重新阅读一下深度强化学习劝退文,以此开始我的科研生活, ...
- 一周新书精选:深度学习、强化学习、Web开发最受程序员关注
3月,万物复苏,跟着春天的脚步,看看这一周有哪些程序员新书最受关注? 1.零基础入门学习Web开发(HTML5 & CSS3)] 本书的系列视频教程全网播放量超100万,得到广大学习者一致好评 ...
- 【原创】强化学习精选资料汇总:从入门到精通,看完这些干货就够啦!
点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要8分钟 Follow小博主,每天更新前沿干货 [导读]本文为大家整理了公众号之前发过的一系列强化学习资料和学习手册,包括:强化学习视频课程.经 ...
最新文章
- linux更改程序启动时间,分享|如何改善应用程序在 Linux 中的启动时间
- Android studio 下 JNI 开发实例
- 字节流写数据加异常处理
- 值得借鉴的30条好习惯
- java——Runtime
- JavaScript-面试 表单验证
- 用户注册加密操作,实现加密工具PasswordHelper
- web逻辑思维题目_逻辑思维训练500题以及答案
- HTML5期末大作业:仿天猫购物网站设计——仿天猫购物商城(7页) 网页设计作业,网页制作作业, 学生网页作业, 网页作业成品, 网页作业模板
- 安卓如何隐藏APP图标探讨
- 一篇文章看明白 Android 系统启动时都干了什么
- 计算机科学科普(一):什么是计算机
- 四级词汇——不择手段记单词new
- 我国电子商务发展的进化策略
- python爬虫中文不能正常显示问题的解决
- Moto Defy刷机卡M无法进入RSD状态解决方法
- 安装方式B--使用ClouderaManager的Parcels包进行安装
- MySql的存储过程的优点与缺点
- 将url网址转换成对象
- Spark:大数据的电花火石!
热门文章
- 步进电机驱动器使用方法
- js 银行卡每四位加空格正则表达式
- 唐寅——《桃花庵歌》
- appium示例代码python_(appium+python)UI自动化_07_UI自动化实例【拼多多搜索商品为例】...
- 考研数学笔记 21~25
- 得意商业管理系统 POS 原版程序支持升级
- proteus8如何画封装_如何proteus原理图生成pcb?步骤详解
- 精锐系列端口自动绑定mac命令
- 2021 WAIC 世界人工智能大会参会总结
- 如果你的车上的导航GPS新地图搜不到星,请看这