Skip to content

Lecture 1. Intro

引入课,大致讲解了一下 AI 的定义与思想,以及如何对 Agent 进行定义与设计


这门课的核心思想是智能体(intelligent agent),将人工智能定义为“对从环境中接收感知并执行动作的智能体的研究”

人工智能当下的核心问题是构建理性智能体rational agent,一种能够自行做出决策的主体)。理性智能体存在于一个具体的环境中,通过传感器感知环境,通过执行器采取行动

考虑两类智能体:

  • 反射智能体(reflex agent)只根据当前的环境状态来做出行动,不会考虑行为的后果;
    • (比如对于吃豆人,只面向最近的豆子前进)
  • 规划智能体(planning agent)对当前环境建模,模拟不同行动并预测后果,从而选出最优的方案,这就是对“智能”的模拟(在确认行动前“提前思考”,和人类一样)
    • (比如对于吃豆人,通过某种搜索算法前进)

两个例子的不同点

“只面向最近的豆子前进”本质上是一种硬编码反射,程序并不会知道这种走法会到达何处;“通过某种搜索算法前进”显式模拟了未来,并尝试找到最优解,得到收益最高的走法

设计智能体的第一步是定义它面对的问题,这里引入一种定义和分析 Agent 任务环境的经典框架 PEAS 框架

  • Performance Measure,对智能体的性能进行量化
  • Environment,对智能体所在环境的描述(具体见下)
  • Actuators,执行器(与环境交互的输出机制)
  • Sensors,传感器(与环境交互的输入机制)

Performance Measure 决定如何设计 Agent 的奖励函数等调参设计

Environment 决定状态空间的大小

Sensors 决定环境的可观测性

对智能体的设计极大取决于智能体所处的环境特征:

  • 是否完全可观测?如果不是,那么智能体必须在内部进行估计
  • 是否随机?如果是,那么智能体必须处理不确定性,而不是无预知下的规划
  • 是否是多智能体环境?如果是,那么智能体需要随机化自身的行为,避免行为被其他智能体预测
  • 是否为动态环境?如果是,那么智能体需要快速对变化的环境有快速响应
  • 是否已知当前环境的物理规律?如果不是,那么智能体需要有目的地采取行动,学习未知的动力规律(否则在已知状态转移模型的情况下,即使环境随机,也可以在路径规划时利用已知模型)