PTAN实战1 || 安装与使用

安装

ptan是强化学习的高级封装库,最高支持pytorch 1.7.0 ,先去pytorch官网查看 pytorch1.7.0的相关GPU或CPU的安装链接,按照对应的cuda版本进行安装

# CUDA 9.2
conda install pytorch==1.7.0 torchvision==0.8.0 torchaudio==0.7.0 cudatoolkit=9.2 -c pytorch# CUDA 10.1
conda install pytorch==1.7.0 torchvision==0.8.0 torchaudio==0.7.0 cudatoolkit=10.1 -c pytorch# CUDA 10.2
conda install pytorch==1.7.0 torchvision==0.8.0 torchaudio==0.7.0 cudatoolkit=10.2 -c pytorch# CUDA 11.0
conda install pytorch==1.7.0 torchvision==0.8.0 torchaudio==0.7.0 cudatoolkit=11.0 -c pytorch# CPU Only
conda install pytorch==1.7.0 torchvision==0.8.0 torchaudio==0.7.0 cpuonly -c pytorch

然后安装gym库,opencv-python库

pip install gympip install opencv-python

最后安装ptan库

pip install ptan

安装成功

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4NCWFlAJ-1648196508868)(https://gitee.com/chenhao_ANTHONY/mapdepot1/raw/master/img/202203241309242.png)]


使用

使用ptan时,传入的参数只能是np.array()格式,不能是torch.tensor()格式

import ptan
import numpy as npq_vals = np.array([[1, 2, 3], [1, -1, 0]])print("q_vals")
print(q_vals)# 返回第1个维度最大值的索引
selector = ptan.actions.ArgmaxActionSelector()
print("argmax:", selector(q_vals))  # [0,epsilon]的概率选择随机,[epsilon,1]的概率选择最大值
selector = ptan.actions.EpsilonGreedyActionSelector(epsilon=0.0)
print("epsilon=0.0:", selector(q_vals)) selector.epsilon = 1.0
print("epsilon=1.0:", selector(q_vals))selector.epsilon = 0.5
print("epsilon=0.5:", selector(q_vals))
selector.epsilon = 0.1
print("epsilon=0.1:", selector(q_vals))selector = ptan.actions.ProbabilityActionSelector()
print("Actions sampled from three prob distributions:")
for _ in range(10):# 定义三个分布,相当于神经网络输出的策略函数的动作概率,第一个分布索引为1的概率是80%# acts是按照这些概率分布抽样得到的动作索引,即返回下标acts = selector(np.array([[0.1, 0.8, 0.1],[0.0, 0.0, 1.0],[0.5, 0.5, 0.0]]))print(acts)

输出结果

q_vals
[[ 1  2  3][ 1 -1  0]]argmax: [2 0]epsilon=0.0: [2 0]
epsilon=1.0: [2 1]
epsilon=0.5: [0 1]
epsilon=0.1: [2 0]Actions sampled from three prob distributions:
[1 2 0]
[1 2 1]
[2 2 0]
[1 2 1]
[1 2 1]
[2 2 1]
[2 2 1]
[1 2 1]
[1 2 1]
[1 2 1]

PTAN实战1 || 安装与使用相关推荐

  1. 实战centos6安装zabbix-2.4版(终极版)

    ###centos6安装zabbix-2.4版## #官方zabbix2.4安装手册:https://www.zabbix.com/documentation/2.4/manual #官方zabbix ...

  2. 项目实战12.1—企业级监控工具应用实战-zabbix安装与基础操作

    无监控,不运维.好了,废话不多说,下面都是干货. 警告:流量党勿入,图片太多!!! 项目实战系列,总架构图 http://www.cnblogs.com/along21/p/8000812.html ...

  3. 企业实战_21_MyCat_keepalived 安装配置验证

    接上一篇:企业实战_20_MyCat使用HAPpoxy对Mycat负载均衡 https://gblfy.blog.csdn.net/article/details/100087884 主机名 IP地址 ...

  4. Atlas2.1.0实战:安装、配置、导入hive元数据、编译排坑

    背景 随着公司数据仓库的建设,数仓hive表愈来愈多,如何管理这些表? 经调研,Atlas成为了我们的选择对象,本文是Atlas实战记录,感谢尚硅谷的学习视频 1.Atlas概述 1.1 Apache ...

  5. Docker 入门到实战 之 安装RocketMQ

    --- Don`t be the same, be better!---         RocketMQ 是一个队列模型的消息中间件,具有高性能.高可靠.高实时.分布式特点. 具体的描述可参考官网文 ...

  6. Kuberntes云原生实战04 安装前置条件及Docker环境

    大家好,我是飘渺. 今天咱们继续更新Kubernetes云原生实战系列,本节文章主要是给集群安装一些前置环境已经安装容器运行时环境Docker. Kubernetes 已经成为事实上容器编排的标准,D ...

  7. Docker(十):Docker实战 Docker 安装 Nginx

    Docker 安装 Nginx Nginx 是一个高性能的 HTTP 和反向代理 web 服务器,同时也提供了 IMAP/POP3/SMTP 服务 . 1.查看可用的 Nginx 版本 访问 Ngin ...

  8. CMake实战之安装测试和添加环境生成安装包

    1.安装测试 CMake 也可以指定安装规则,以及添加测试.这两个功能分别可以通过在产生 Makefile 后使用 make install 和 make test 来执行.在 GNU Makefil ...

  9. 开机秒全国99%电脑 实战UEFI安装Win8

    作为平板中一大阵营的主力 产品, Surface Pro可以说是让大家梦寐以求的.我们喜欢它的外观.它的性能.以及它的快速开机--众所周知,Surface Pro可以说是 Windows 8展示各种新 ...

最新文章

  1. scrapy-redis的关键配置
  2. 微信小程序tabBar不显示的问题描述解决
  3. [Python从零到壹] 三十七.图像处理基础篇之图像融合处理和ROI区域绘制
  4. Apache Payara:让我们加密
  5. mybatis :Criteria 查询、条件过滤用法
  6. 部编版是什么版本_教材部编版和人教版的区别
  7. 买了套房28年后才想起来,房价从33万涨到600万!上门却发现住着人?
  8. echarts 设置各省份颜色
  9. 查找和杀掉postgresql堵塞的会话
  10. Python深度学习路线
  11. 将会彻底破坏你的树莓派的六件事(官网翻译)
  12. 线性子空间的交、并、和、维数与直和等各种关系总结
  13. 北京地铁月度消费总金额计算(Python版)
  14. HTTP:SSL证书简介!
  15. 【PAT算法之路】 -- 专栏总揽
  16. 手工测试1年经验面试,张口要13K,我真是服了····
  17. PAT练习 星际密码
  18. 调研分析:全球与中国汽车内室照明模组市场现状及未来发展趋势
  19. 24岁女孩与30岁男人的经典对白
  20. 深入理解数据结构之树

热门文章

  1. jmeter并发测试教程_Jmeter多用户并发压力测试过程图解
  2. LAMP兄弟连 51期 全体敬上
  3. JENKIN部署搭建学习整理
  4. webpack:自定义loader
  5. 2022 【阿里】面试真题
  6. 小木屋图书如何依靠用户增长,达到融资千万?
  7. 什么是 pickling 和 unpickling ?
  8. Postman报401错误,Unauthorized以及其他接口如何填上token
  9. bfsk的fpga实现
  10. puzzle(1521)纪念碑谷