better doc

2026-04-28 06:19:32 +00:00 · 2026-02-27 01:11:57 +08:00 · 2026-02-27 01:11:57 +08:00 · 665831c774
commit 665831c774
parent aea8844bac
46 changed files with 1217 additions and 3505 deletions
--- a/docs/zh/s01-the-agent-loop.md
+++ b/docs/zh/s01-the-agent-loop.md
@ -1,40 +1,37 @@
-# s01: Agent Loop (智能体循环)
+# s01: The Agent Loop (智能体循环)

-> AI 编程智能体的核心是一个 while 循环 -- 把工具执行结果反馈给模型, 直到模型决定停止。
+`[ s01 ] s02 > s03 > s04 > s05 > s06 | s07 > s08 > s09 > s10 > s11 > s12`
+
+> *"One loop & Bash is all you need"* -- 一个工具 + 一个循环 = 一个智能体。

 ## 问题

-为什么语言模型不能直接回答编程问题? 因为编程需要**与真实世界交互**。模型需要读取文件、运行测试、检查错误、反复迭代。单次的提示-响应交互无法做到这些。
-
-没有 agent loop, 你就得手动把输出复制粘贴回模型。用户自己变成了那个循环。Agent loop 将这个过程自动化: 调用模型, 执行它要求的工具, 把结果送回去, 重复 -- 直到模型说 "我完成了"。
-
-考虑一个简单任务: "创建一个打印 hello 的 Python 文件。" 模型需要 (1) 决定写文件, (2) 写入文件, (3) 验证是否正常工作。至少三次工具调用。没有循环的话, 每一次都需要人工干预。
+语言模型能推理代码, 但碰不到真实世界 -- 不能读文件、跑测试、看报错。没有循环, 每次工具调用你都得手动把结果粘回去。你自己就是那个循环。

 ## 解决方案

 ```
-+----------+      +-------+      +---------+
-|   User   | ---> |  LLM  | ---> |  Tool   |
-|  prompt  |      |       |      | execute |
-+----------+      +---+---+      +----+----+
-                      ^               |
-                      |   tool_result |
-                      +---------------+
-                      (loop continues)
-
-The loop terminates when stop_reason != "tool_use".
-That single condition is the entire control flow.
+--------+      +-------+      +---------+
+|  User  | ---> |  LLM  | ---> |  Tool   |
+| prompt |      |       |      | execute |
+--------+      +---+---+      +----+----+
+                    ^                |
+                    |   tool_result  |
+                    +----------------+
+                    (loop until stop_reason != "tool_use")
 ```

+一个退出条件控制整个流程。循环持续运行, 直到模型不再调用工具。
+
 ## 工作原理

-1. 用户提供一个 prompt, 成为第一条消息。
+1. 用户 prompt 作为第一条消息。

 ```python
-history.append({"role": "user", "content": query})
+messages.append({"role": "user", "content": query})
 ```

-2. 消息数组连同工具定义一起发送给 LLM。
+2. 将消息和工具定义一起发给 LLM。

 ```python
 response = client.messages.create(
@ -43,22 +40,18 @@ response = client.messages.create(
 )
 ```

-3. 助手的响应被追加到消息列表中。
+3. 追加助手响应。检查 `stop_reason` -- 如果模型没有调用工具, 结束。

 ```python
 messages.append({"role": "assistant", "content": response.content})
-```
-
-4. 检查 stop_reason。如果模型没有调用工具, 循环结束。在本节最小实现里, 这是唯一的循环退出条件。
-
-```python
 if response.stop_reason != "tool_use":
    return
 ```

-5. 对响应中的每个 tool_use 块, 执行工具 (本节课中是 bash) 并收集结果。
+4. 执行每个工具调用, 收集结果, 作为 user 消息追加。回到第 2 步。

 ```python
+results = []
 for block in response.content:
    if block.type == "tool_use":
        output = run_bash(block.input["command"])
@ -67,29 +60,24 @@ for block in response.content:
            "tool_use_id": block.id,
            "content": output,
        })
-```
-
-6. 结果作为 user 消息追加, 循环继续。
-
-```python
 messages.append({"role": "user", "content": results})
 ```

-## 核心代码
-
-最小可行智能体 -- 不到 30 行代码实现整个模式
-(来自 `agents/s01_agent_loop.py`, 第 66-86 行):
+组装为一个完整函数:

 ```python
-def agent_loop(messages: list):
+def agent_loop(query):
+    messages = [{"role": "user", "content": query}]
    while True:
        response = client.messages.create(
            model=MODEL, system=SYSTEM, messages=messages,
            tools=TOOLS, max_tokens=8000,
        )
        messages.append({"role": "assistant", "content": response.content})
+
        if response.stop_reason != "tool_use":
            return
+
        results = []
        for block in response.content:
            if block.type == "tool_use":
@ -102,9 +90,9 @@ def agent_loop(messages: list):
        messages.append({"role": "user", "content": results})
 ```

-## 变更内容
+不到 30 行, 这就是整个智能体。后面 11 个章节都在这个循环上叠加机制 -- 循环本身始终不变。

-这是第 1 节课 -- 起点。没有前置课程。
+## 变更内容

 | 组件          | 之前       | 之后                           |
 |---------------|------------|--------------------------------|
@ -113,10 +101,6 @@ def agent_loop(messages: list):
 | Messages      | (无)       | 累积式消息列表                 |
 | Control flow  | (无)       | `stop_reason != "tool_use"`    |

-## 设计原理
-
-这个循环是所有基于 LLM 的智能体基础。生产实现还会增加错误处理、token 计数、流式输出、重试、权限策略与生命周期编排, 但核心交互模式仍从这里开始。本节强调简洁性: 在本节最小实现里, 一个退出条件 (`stop_reason != "tool_use"`) 就能支撑我们先学会主流程。本课程中的其他内容都在这个循环上叠加。理解这个循环是建立基础心智模型, 不是完整的生产架构。
-
 ## 试一试

 ```sh
@ -124,7 +108,7 @@ cd learn-claude-code
 python agents/s01_agent_loop.py
 ```

-可以尝试的提示:
+试试这些 prompt (英文 prompt 对 LLM 效果更好, 也可以用中文):

 1. `Create a file called hello.py that prints "Hello, World!"`
 2. `List all Python files in this directory`