Lecture 1. Intro

引入课，大致讲解了一下 AI 的定义与思想，以及如何对 Agent 进行定义与设计

这门课的核心思想是智能体（intelligent agent），将人工智能定义为“对从环境中接收感知并执行动作的智能体的研究”

人工智能当下的核心问题是构建理性智能体（rational agent，一种能够自行做出决策的主体）。理性智能体存在于一个具体的环境中，通过传感器感知环境，通过执行器采取行动

考虑两类智能体：

反射智能体（reflex agent）只根据当前的环境状态来做出行动，不会考虑行为的后果；
- （比如对于吃豆人，只面向最近的豆子前进）
规划智能体（planning agent）对当前环境建模，模拟不同行动并预测后果，从而选出最优的方案，这就是对“智能”的模拟（在确认行动前“提前思考”，和人类一样）
- （比如对于吃豆人，通过某种搜索算法前进）

两个例子的不同点

“只面向最近的豆子前进”本质上是一种硬编码反射，程序并不会知道这种走法会到达何处；“通过某种搜索算法前进”显式模拟了未来，并尝试找到最优解，得到收益最高的走法

设计智能体的第一步是定义它面对的问题，这里引入一种定义和分析 Agent 任务环境的经典框架 PEAS 框架：

Performance Measure 决定如何设计 Agent 的奖励函数等调参设计

Environment 决定状态空间的大小

Sensors 决定环境的可观测性

对智能体的设计极大取决于智能体所处的环境特征：

是否完全可观测？如果不是，那么智能体必须在内部进行估计
是否随机？如果是，那么智能体必须处理不确定性，而不是无预知下的规划
是否是多智能体环境？如果是，那么智能体需要随机化自身的行为，避免行为被其他智能体预测
是否为动态环境？如果是，那么智能体需要快速对变化的环境有快速响应
是否已知当前环境的物理规律？如果不是，那么智能体需要有目的地采取行动，学习未知的动力规律（否则在已知状态转移模型的情况下，即使环境随机，也可以在路径规划时利用已知模型）

2026-02-122026-02-22