PTAN实战1 || 安装与使用
PTAN实战1 || 安装与使用
安装
ptan是强化学习的高级封装库,最高支持pytorch 1.7.0 ,先去pytorch官网查看 pytorch1.7.0的相关GPU或CPU的安装链接,按照对应的cuda版本进行安装
# CUDA 9.2
conda install pytorch==1.7.0 torchvision==0.8.0 torchaudio==0.7.0 cudatoolkit=9.2 -c pytorch# CUDA 10.1
conda install pytorch==1.7.0 torchvision==0.8.0 torchaudio==0.7.0 cudatoolkit=10.1 -c pytorch# CUDA 10.2
conda install pytorch==1.7.0 torchvision==0.8.0 torchaudio==0.7.0 cudatoolkit=10.2 -c pytorch# CUDA 11.0
conda install pytorch==1.7.0 torchvision==0.8.0 torchaudio==0.7.0 cudatoolkit=11.0 -c pytorch# CPU Only
conda install pytorch==1.7.0 torchvision==0.8.0 torchaudio==0.7.0 cpuonly -c pytorch
然后安装gym库,opencv-python库
pip install gympip install opencv-python
最后安装ptan库
pip install ptan
安装成功
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4NCWFlAJ-1648196508868)(https://gitee.com/chenhao_ANTHONY/mapdepot1/raw/master/img/202203241309242.png)]
使用
使用ptan时,传入的参数只能是np.array()格式,不能是torch.tensor()格式
import ptan
import numpy as npq_vals = np.array([[1, 2, 3], [1, -1, 0]])print("q_vals")
print(q_vals)# 返回第1个维度最大值的索引
selector = ptan.actions.ArgmaxActionSelector()
print("argmax:", selector(q_vals)) # [0,epsilon]的概率选择随机,[epsilon,1]的概率选择最大值
selector = ptan.actions.EpsilonGreedyActionSelector(epsilon=0.0)
print("epsilon=0.0:", selector(q_vals)) selector.epsilon = 1.0
print("epsilon=1.0:", selector(q_vals))selector.epsilon = 0.5
print("epsilon=0.5:", selector(q_vals))
selector.epsilon = 0.1
print("epsilon=0.1:", selector(q_vals))selector = ptan.actions.ProbabilityActionSelector()
print("Actions sampled from three prob distributions:")
for _ in range(10):# 定义三个分布,相当于神经网络输出的策略函数的动作概率,第一个分布索引为1的概率是80%# acts是按照这些概率分布抽样得到的动作索引,即返回下标acts = selector(np.array([[0.1, 0.8, 0.1],[0.0, 0.0, 1.0],[0.5, 0.5, 0.0]]))print(acts)
输出结果
q_vals
[[ 1 2 3][ 1 -1 0]]argmax: [2 0]epsilon=0.0: [2 0]
epsilon=1.0: [2 1]
epsilon=0.5: [0 1]
epsilon=0.1: [2 0]Actions sampled from three prob distributions:
[1 2 0]
[1 2 1]
[2 2 0]
[1 2 1]
[1 2 1]
[2 2 1]
[2 2 1]
[1 2 1]
[1 2 1]
[1 2 1]
PTAN实战1 || 安装与使用相关推荐
- 实战centos6安装zabbix-2.4版(终极版)
###centos6安装zabbix-2.4版## #官方zabbix2.4安装手册:https://www.zabbix.com/documentation/2.4/manual #官方zabbix ...
- 项目实战12.1—企业级监控工具应用实战-zabbix安装与基础操作
无监控,不运维.好了,废话不多说,下面都是干货. 警告:流量党勿入,图片太多!!! 项目实战系列,总架构图 http://www.cnblogs.com/along21/p/8000812.html ...
- 企业实战_21_MyCat_keepalived 安装配置验证
接上一篇:企业实战_20_MyCat使用HAPpoxy对Mycat负载均衡 https://gblfy.blog.csdn.net/article/details/100087884 主机名 IP地址 ...
- Atlas2.1.0实战:安装、配置、导入hive元数据、编译排坑
背景 随着公司数据仓库的建设,数仓hive表愈来愈多,如何管理这些表? 经调研,Atlas成为了我们的选择对象,本文是Atlas实战记录,感谢尚硅谷的学习视频 1.Atlas概述 1.1 Apache ...
- Docker 入门到实战 之 安装RocketMQ
--- Don`t be the same, be better!--- RocketMQ 是一个队列模型的消息中间件,具有高性能.高可靠.高实时.分布式特点. 具体的描述可参考官网文 ...
- Kuberntes云原生实战04 安装前置条件及Docker环境
大家好,我是飘渺. 今天咱们继续更新Kubernetes云原生实战系列,本节文章主要是给集群安装一些前置环境已经安装容器运行时环境Docker. Kubernetes 已经成为事实上容器编排的标准,D ...
- Docker(十):Docker实战 Docker 安装 Nginx
Docker 安装 Nginx Nginx 是一个高性能的 HTTP 和反向代理 web 服务器,同时也提供了 IMAP/POP3/SMTP 服务 . 1.查看可用的 Nginx 版本 访问 Ngin ...
- CMake实战之安装测试和添加环境生成安装包
1.安装测试 CMake 也可以指定安装规则,以及添加测试.这两个功能分别可以通过在产生 Makefile 后使用 make install 和 make test 来执行.在 GNU Makefil ...
- 开机秒全国99%电脑 实战UEFI安装Win8
作为平板中一大阵营的主力 产品, Surface Pro可以说是让大家梦寐以求的.我们喜欢它的外观.它的性能.以及它的快速开机--众所周知,Surface Pro可以说是 Windows 8展示各种新 ...
最新文章
- scrapy-redis的关键配置
- 微信小程序tabBar不显示的问题描述解决
- [Python从零到壹] 三十七.图像处理基础篇之图像融合处理和ROI区域绘制
- Apache Payara:让我们加密
- mybatis :Criteria 查询、条件过滤用法
- 部编版是什么版本_教材部编版和人教版的区别
- 买了套房28年后才想起来,房价从33万涨到600万!上门却发现住着人?
- echarts 设置各省份颜色
- 查找和杀掉postgresql堵塞的会话
- Python深度学习路线
- 将会彻底破坏你的树莓派的六件事(官网翻译)
- 线性子空间的交、并、和、维数与直和等各种关系总结
- 北京地铁月度消费总金额计算(Python版)
- HTTP:SSL证书简介!
- 【PAT算法之路】 -- 专栏总揽
- 手工测试1年经验面试,张口要13K,我真是服了····
- PAT练习 星际密码
- 调研分析:全球与中国汽车内室照明模组市场现状及未来发展趋势
- 24岁女孩与30岁男人的经典对白
- 深入理解数据结构之树