人工智能 一种现代方法 第2章 智能化智能体
人工智能 一种现代方法 第2章 智能化智能体
2018.3.20
2.1智能体和环境
智能体:通过传感器感知所处环境并通过执行器对该环境产生作用。
感知信息:智能体的感知输入
感知序列:感知信息的集合
智能体函数:将感知序列映射到智能体行动
智能体程序:实现智能体函数
2.2好的行为表现:理性的概念
理性智能体:对于每个可能的感知序列,根据已知的序列提供的证据和智能体内建的先验知识,理性智能体应该选择期望能使其性能最大化的行动。
2.2.1性能度量
性能度量:智能体成功标准的具体化
根据希望智能体达到的结果设计度量,而不是人类认为智能体应该表现的行为设计度量。
2.2.2理性
性能度量、先验知识、可执行行动、感知序列
2.2.3全知者,学习和自主性
理性不等于全知
信息收集是理性的重要部分
自主性:智能体能够尽可能的学习,你不先验知识的不足
2.3环境的本质
2.3.1详细说明人物环境
PEAS(性能Performance,环境 Environment, 执行器Actuators, 传感器Sensors)
2.3.2任务环境的属性
- 完全可观测和部分可观测
- 确定的和随机的
- 片段式和延续式
- 静态和动态
- 离散的和连续的
- 但智能体和多智能体
2.4智能体的结构
智能体 = 体系结构 + 程序
体系结构为程序提供来自传感器的感知信息
2.4.1智能体程序
每接收到一个新的感知信息,就将其添加到感知序列中,并根据先验知识的对应表得到一个行动。
function TABLE-DRIVEN-AGENT(percept)returns an actionstatic:percepts, a sequence, initially emptytable: a table of action, indexed by percept sequences, initially fully specifiedappend percept to the end of perceptsaction <-- LOOKUP(percepts, table)return action
但是想要对每一个感知序列都列出对应的动作表需要巨大的存储空间,即便能存下也很难通过该表进行学习。
2.4.2简单反射型智能体
忽略感知序列,而只针对当前感知选择行动。
状态空间的指数部分变为1
function SIMPLE-REFLEX-AGENT(percept) returns an action static: rules, a set of condition-action rulesstate <-- INTERPRET-INPUT(percept) //将感知信息转化为状态rule <-- RULE-MATCH(state, rules) //将状态匹配规则列表中的规则action <-- RULE-ACTION(rule) //通过贵的得出对应的行动
2.4.3基于模型的智能体
function SIMPLE-REFLEX-AGENT(percept) returns an action static: state, a description of current world state rules, a set of condition-action rulesaction, the most recent action, initially nonestate <-- UPDATE-STATE(state, action, percept) //将感知信息结合当前状态和动作转化为状态rule <-- RULE-MATCH(state, rules) //将状态匹配规则列表中的规则action <-- RULE-ACTION(rule) //通过贵的得出对应的行动
2.4.4基于目标的智能体
为了达到目标
2.4.5基于效用的智能体
最大化期望
人工智能 一种现代方法 第2章 智能化智能体相关推荐
- 人工智能 一种现代方法 第10章 经典的规划问题(classical planning)
文章目录 规划问题定义(PDDL)为一个搜索问题 状态空间搜索规划算法 前向状态空间搜索 后向相关状态搜索 规划的启发式 资源分享 本文旨在讲明: 1)规划问题定义(PDDL)为一个搜索问题 2)前向 ...
- 人工智能 一种现代方法 第11章 现实世界的规划与行动
文章目录 时间.调度和资源 车间调度问题 忽略资源约束的时间调度问题:关键路径方法 有资源约束的时间调度问题 分层规划 搜索原语解 搜索抽象解 非确定性问题的规划 无传感器规划 应急规划 资源分享 本 ...
- 人工智能 一种现代方法 第14章 概论推理
文章目录 贝叶斯网络 贝叶斯网络是什么 一种构造贝叶斯网络的方法 条件分布的有效表示 贝叶斯网络的精确推理 推理任务 通过枚举进行推理 变量消元算法(避免重复计算) 贝叶斯网络的近似推理 直接采样 似 ...
- 人工智能 一种现代方法 第5章 对抗搜索
文章目录 博弈 博弈中的优化决策 Minmax算法(极小极大算法) 多人博弈时的最优决策 α-β剪枝(重点) 不完美的实时决策 评估函数 截断搜索 向前剪枝 资源分享 博弈 对抗搜索:竞争环境中每个A ...
- 《深度强化学习实战》 第9章 多智能体
第 9 章 多智能体强化学习 为什么普通的Q-learning在多智能体设置中变得不行 如何在多智能体中处理"维度诅咒" 如何实现多智能体Q-learning模型来感知其他智能体 ...
- 第1章-多智能体系统
无 回到目录 第2章-系统控制原理 -> 经典控制理论 文章目录 第1章 多智能体系统 1.1 多智能体系统简介 1.1.1 研究背景 1.1.2 研究内容 1.1.3 相关应用 1.2 系统一 ...
- 【控制】《多智能体系统一致性协同演化控制理论与技术》纪良浩老师-第5章-多智能体系统双阶脉冲一致性
第4章 回到目录 第6章 第5章-多智能体系统双阶脉冲一致性 5.1 引言 5.2 预备知识 5.3 问题描述与分析 5.4 例子与数值仿真 5.5 本章小结 5.1 引言 牵引机制 但是在大部分研究 ...
- 【控制】《多智能体系统一致性协同演化控制理论与技术》纪良浩老师-第1章-多智能体系统一致性问题概述
无 回到目录 第2章 第1章-多智能体系统一致性问题概述 1.1 引言 1.2 多智能体系统简介 1.3 多智能体系统一致性问题及其应用领域 1.4 一致性问题的研究进展与发展动态 1.4.1 多智能 ...
- 发布 PAIRED:一种生成对抗环境的全新多智能体方法
文 / Google Research 团队 Natasha Jaques 和加州大学伯克利分校 Michael Dennis 任何机器学习方法的有效性都主要取决于其训练数据.对于是强化学习 (RL) ...
- [转载] 人工智能:一种现代方法——第1章 绪论
转载于:https://www.cnblogs.com/6DAN_HUST/archive/2012/06/24/2560216.html
最新文章
- python 获取mp3时长(时间长度)
- winserver2008 Oracle 11g 安装
- Android之组件化开发
- ABAP实践学习--灰色的ALV显示
- @请注意查收:《史上最全的AI论文资料》.pdf
- 通过DataWorks数据集成归档日志服务数据至MaxCompute进行离线分析
- 2014年职称计算机word2003,2014年职称计算机考试Word2003模拟题及答案5
- Android自己的自动化测试Monkeyrunner和用法示例
- as_hash ruby_Hash.merge(other_hash)方法与Ruby中的示例
- 一文掌握 Linux 性能分析之 CPU 篇
- XP框架开启debug模式_推荐一个兼容性强完美支持XP框架的安卓模拟器,一直在用!...
- 异步电机matlab仿真 推荐 辅导书,异步电机模型Matlab仿真
- css实现边框阴影效果的方法(含兼容)
- li指令 汇编_汇编语言和汇编软件
- 制药工程专业计算机考试考哪样,制药工程考研可以考什么专业
- 微信连WiFi已OUT?
- linux抓包查对方的mac地址,1.根据MAC地址抓包
- AD软件画电路图笔记
- Android studio低版本让3.0编译通过,更好的用studio看代码(找不到原作者那个网址链接了,望见谅!)
- echarts绘制广东省地图
热门文章
- Unity编辑器控制粒子系统Playback Time
- 合肥工业大学数值分析(计算方法)满分实验代码(python实现)
- sap abap开发从入门到精通_Nginx 开发从入门到精通《实战书籍》学会这些就够了...
- matlab 生成格雷码,格雷码(Grey Code)生成规则
- Windows下Tomcat8的安装和闪退问题解决
- Web前端-html页面-网易注册表单,美化及时验证效果
- dataset lfw
- linux shell 判断ELF文件,linux file命令查看elf文件信息
- LaTeX安装及周报模板
- 简明python教程最新pdf_《简明Python教程》PDF高清 初学者的极佳教材 限时免费领取...