Docs: update zh-CN translations and pipeline

What:
- update zh-CN glossary, TM, and translator prompt
- regenerate zh-CN docs and apply targeted fixes
- add zh-CN AGENTS pipeline guidance

Why:
- address terminology/spacing feedback from #6995

Tests:
- pnpm build && pnpm check && pnpm test
This commit is contained in:
Josh Palmer
2026-02-03 13:23:00 -08:00
parent 9f03791aa9
commit a3ec2d0734
228 changed files with 10651 additions and 10475 deletions
+17 -14
View File
@@ -1,12 +1,12 @@
---
read_when:
-需要基于 Firecrawl 的网页提取
-想要 Firecrawl 支持的网页提取
- 你需要 Firecrawl API 密钥
-需要为 web_fetch 提供反爬虫提取功能
summary: Firecrawl 作为 web_fetch 的备用方案(反爬虫 + 缓存提取)
-想要 web_fetch 的反机器人提取
summary: 用于 web_fetch 的 Firecrawl 回退(反机器人 + 缓存提取)
title: Firecrawl
x-i18n:
generated_at: "2026-02-01T21:42:22Z"
generated_at: "2026-02-03T10:10:35Z"
model: claude-opus-4-5
provider: pi
source_hash: 08a7ad45b41af41204e44d2b0be0f980b7184d80d2fa3977339e42a47beb2851
@@ -16,12 +16,14 @@ x-i18n:
# Firecrawl
OpenClaw 可以使用 **Firecrawl** 作为 `web_fetch`备用提取器。它是一个托管的内容提取服务,支持反爬虫绕过和缓存,有助于处理 JS 密集型网站或阻止普通 HTTP 请求的页面。
OpenClaw 可以使用 **Firecrawl** 作为 `web_fetch`回退提取器。它是一个托管的
内容提取服务,支持机器人规避和缓存,有助于处理
JS 密集型网站或阻止普通 HTTP 请求的页面。
## 获取 API 密钥
1. 创建 Firecrawl 账户并生成 API 密钥。
2. 将其存储在配置中或在 Gateway网关环境中设置 `FIRECRAWL_API_KEY`
2. 将其存储在配置中或在 Gateway 网关环境中设置 `FIRECRAWL_API_KEY`
## 配置 Firecrawl
@@ -46,20 +48,21 @@ OpenClaw 可以使用 **Firecrawl** 作为 `web_fetch` 的备用提取器。它
注意事项:
- 当存在 API 密钥时,`firecrawl.enabled` 默认为 true。
- `maxAgeMs` 控制缓存结果的最大有效时长(毫秒)。默认为 2 天。
- `maxAgeMs` 控制缓存结果可以保留多久(毫秒)。默认为 2 天。
## 隐身/反爬虫绕过
## 隐身 / 机器人规避
Firecrawl 提供了一个用于反爬虫绕过的**代理模式**参数(`basic``stealth``auto`)。
OpenClaw 对 Firecrawl 请求始终使用 `proxy: "auto"` `storeInCache: true`
如果省略 proxyFirecrawl 默认使用 `auto``auto` 模式在基本尝试失败会使用隐身代理重试,这可能比仅使用基本模式的抓取消耗更多积分。
Firecrawl 提供了一个用于机器人规避的**代理模式**参数(`basic``stealth``auto`)。
OpenClaw 对 Firecrawl 请求始终使用 `proxy: "auto"``storeInCache: true`
如果省略 proxyFirecrawl 默认使用 `auto``auto` 在基本尝试失败会使用隐身代理重试,这可能比
仅使用基本抓取消耗更多积分。
## `web_fetch` 如何使用 Firecrawl
`web_fetch` 提取顺序:
1. Readability(本地)
2. Firecrawl(如已配置)
3. 基本 HTML 清理(最终备用方案
2. Firecrawl(如已配置)
3. 基本 HTML 清理(最后回退
阅[网页工具](/tools/web)了解全部网页工具设置。
见 [Web 工具](/tools/web) 了解完整的 Web 工具设置。