upd readme

This commit is contained in:
zsq259
2024-06-23 14:54:13 +08:00
parent 71975d5889
commit 11720da0d3

153
README.md
View File

@ -161,9 +161,13 @@ python autograder.py -q q3
#### Q4A* 搜索
[A* 介绍](https://oi-wiki.org/search/astar/)
简单介绍启发式搜索:有一个启发式函数 $h$,在搜索时优先搜索值最小的方向。
在 `search.py` 中的函数 `aStarSearch` 中实现 A\* 搜索。A\* 以启发式函数为参数。启发式函数有两个参数:搜索问题中的状态(主要参数)和问题本身(用于参考)。`search.py` 中的 `nullHeuristic` 启发式函数就是一个简单的例子。
你可以使用曼哈顿距离启发式算法(已在 `searchAgents.py` 中实现 `manhattanHeuristic`)测试你的 A* 实现该算法针对原来的问题即寻找穿过迷宫到达固定位置的路径。
你可以使用曼哈顿距离启发式算法(已在 `searchAgents.py` 中实现 `manhattanHeuristic`)测试你的 A* 实现该算法针对的是原来的问题即寻找穿过迷宫到达固定位置的路径
```
python pacman.py -l bigMaze -z .5 -p SearchAgent -a fn=astar,heuristic=manhattanHeuristic
@ -179,4 +183,149 @@ anhattanHeuristic
python autograder.py -q q4
```
####
#### Q5找到所有角落
注意:在回答问题 5 之前,请确保先完成问题 2因为问题 5 是以问题 2 的回答为基础的。
A* 的真正威力只有在更具挑战性的搜索问题中才会显现出来。
在角落迷宫中,有四个点,每个角落一个。我们的新搜索问题是找到穿过迷宫的最短路径,该路径接触所有四个角落(无论迷宫中是否有食物)。
在 `searchAgents.py` 中实现搜索问题 `CornersProblem`。你需要选择一个状态( `state`)的表示,用于编码 判断是否已到达所有四个角 所需的所有信息。现在,你的搜索 agent 应该解决:
```
python pacman.py -l tinyCorners -p SearchAgent -a fn=bfs,prob=CornersProblem
python pacman.py -l mediumCorners -p SearchAgent -a fn=bfs,prob=CornersProblem
```
要获得满分,你需要定义一个抽象的状态表示,该表示不会编码无关信息(例如鬼魂的位置、额外食物的位置等)。特别是,不要使用吃豆人 `GameState` 作为搜索状态。如果你这样做(并且出错),你的代码将非常非常慢。
类的一个实例 `CornersProblem` 代表整个搜索问题,而不是特定状态(`state`)。特定状态由你编写的函数返回你选择用于表示状态的数据结构(例如元组、集合等)。
提示 1你在实现中仅需要参考的游戏状态吃豆人的起始位置和四个角的位置。
提示 2编写 `getSuccessors` 代码时,请确保将子代添加到后继列表中,成本为 1。
在 `mediumCorners` 中,我们的 `breadthFirstSearch` 实现将搜索节点扩展到近 2000 个。但是,启发式方法(与 A* 搜索一起使用)可以减少所需的搜索量。
运行以下命令来查看你的实现是否通过了所有自动评分测试用例。
```
python autograder.py -q q5
```
#### Q6角落问题启发式
注意:在回答问题 6 之前,请确保先完成问题 4因为问题 6 是以问题 4 的回答为基础的。
在 `CornersProblem` 中的 `cornersHeuristic` 中实现一个非平凡的、一致的启发式方法
```
python pacman.py -l mediumCorners -p AStarCornersAgent -z 0.5
```
注意:`AStarCornersAgent` 是一个快捷方式:
```
-p SearchAgent -a fn=aStarSearch,prob=CornersProblem,heuristic=cornersHeuristic
```
**可接受性 vs 一致性**:请记住,启发式函数只是将搜索状态作为输入并返回估计到最近目标的代价的数值的函数。更有效的启发式函数将返回更接近实际目标代价的值。为了是可接受的,启发式函数的值必须是到最近目标的实际最短路径代价的下界(且为非负值)。为了是一致的,还必须满足这样一个条件:如果一个动作的代价是 c那么采取该动作只能导致启发式函数值下降最多 c。
在图搜索中,可接受性不足以保证正确性——你需要更强的一致性条件。然而,可接受的启发式函数通常也是一致的。因此,通常最简单的方法是先构思出可接受的启发式函数。一旦你有了一个效果良好的可接受启发式函数,你可以检查它是否也确实一致。唯一能保证一致性的方法是通过证明。然而,不一致性通常可以通过验证每个被扩展节点的后继节点的 f 值是否相等或更高来检测。此外,如果 UCS 和 A* 返回的路径长度不同,那么你的启发式函数就是不一致的。
```
python pacman.py -l mediumCorners -p SearchAgent -a fn=aStarSearch,prob=CornersProblem,heuristic=cornersHeuristic -z 0.5
python pacman.py -l mediumCorners -p SearchAgent -a fn=aStarSearch,prob=CornersProblem,heuristic=nullHeuristic -z 0.5
```
**非平凡启发式**平凡启发式是到处都返回零UCS的启发式和计算真实完成成本的启发式。前者不会为你节省任何搜索而后者会使程序超时。你需要一种可以减少总计算时间的启发式。
**评分**:你的启发式方法必须是非平凡的非负一致性启发式方法。确保你的启发式方法在每个目标状态都返回 0并且永远不会返回负值。根据你的启发式方法扩展的节点数你将获得以下评分
| **搜索的节点数** | 得分 |
| ---------------- | ---- |
| >2000 | 0/3 |
| <=2000 | 1/3 |
| <=1600 | 2/3 |
| <=1200 | 1/3 |
请记住:如果你的启发式方法不一致,你将不会获得任何分数,所以要小心!
运行以下命令来查看你的实现是否通过了所有自动评分测试用例。
```
python autograder.py -q q6
```
#### Q7吃掉所有点
注意:在回答问题 7 之前,请确保先完成问题 4因为问题 7 是以问题 4 的回答为基础的。
现在我们将解决一个困难的搜索问题:以尽可能少的步骤吃掉所有的吃豆人食物。为此,我们需要一个新的搜索问题定义,该定义将食物清除问题形式化:在 `searchAgents.py` 中的 `FoodSearchProblem`已经为你实现。一个解决方案被定义为在吃豆人世界中收集所有食物的路径。在当前的项目中解决方案不考虑任何幽灵或能量豆解决方案仅依赖于墙壁、普通食物和吃豆人的位置。当然幽灵可能会破坏解决方案的执行我们将在下一个项目中讨论这个问题。如果你正确编写了通用搜索方法使用一个空启发式函数的A*算法相当于统一代价搜索应该能够快速找到testSearch的最优解决方案而无需修改代码总成本为7
```
python pacman.py -l testSearch -p AStarFoodSearchAgent
```
注意:`AStarFoodSearchAgent` 是一个快捷方式:
```
-p SearchAgent -a fn=astar,prob=FoodSearchProblem,heuristic=foodHeuristic
```
你会发现,即使是看似简单的 `tinySearch`统一代价搜索UCS也会开始变慢。作为参考我们的实现花了2.5秒钟找到了长度为27的路径扩展了2372个搜索节点。
```
python pacman.py -l tinySearch -p AStarFoodSearchAgent
```
在 `searchAgents.py` 中完成 `foodHeuristic` 函数,为 FoodSearchProblem 提供一个一致的启发式函数。然后在 `trickySearch` 上测试:
```
python pacman.py -l trickySearch -p AStarFoodSearchAgent
```
我们的 UCS 代理在大约 13 秒内找到了最佳解决方案,探索了超过 16,000 个节点。
```
python pacman.py -l trickySearch -p SearchAgent -a fn=ucs,prob=FoodSearchProblem
```
确保你的启发式在每个目标状态都返回 0并且永远不会返回负值。
| **搜索的节点数** | 得分 |
| ---------------- | ---- |
| >15000 | 1/4 |
| <=15000 | 2/4 |
| <=12000 | 3/4 |
| <=9000 | 4/4 |
| <=7000 | 5/4 |
请记住:如果你的启发式方法不一致,你将不会获得任何分数,所以要小心!
运行以下命令来查看你的实现是否通过了所有自动评分测试用例。
```
python autograder.py -q q7
```
#### Q8次优搜索
有时,即使使用 A* 和一个好的启发式函数,找到所有点的最优路径也是困难的。在这种情况下,我们仍希望能够快速找到一条相对较好的路径。在这一部分,你将编写一个代理,它总是贪婪地吃掉最近的点。`ClosestDotSearchAgent` 已在 `searchAgents.py` 中实现,但缺少一个找到最近点路径的关键函数。
在 `searchAgents.py` 中实现函数 `findPathToClosestDot`。我们的代理能够在不到一秒钟的时间内以 350 的路径代价,次优地解决了这个迷宫:
```
python pacman.py -l bigSearch -p ClosestDotSearchAgent -z .5
```
提示:完成 `findPathToClosestDot` 的最快方法是填写 `AnyFoodSearchProblem` 中缺少的目标测试 `isGoalState`。然后,用适当的搜索函数解决这个问题。解决方案应该非常简短!
你的 `ClosestDotSearchAgent` 并不总是能找到穿过迷宫的最短路径。请确保你理解原因,并尝试提出一个小例子,在这个例子中,反复寻找最近的点并不能找到吃掉所有点的最短路径。(不计分)
运行以下命令来查看你的实现是否通过了所有自动评分测试用例。
```
python autograder.py -q q7
```