跳转到内容

Snapshot

POST /v1/snapshot

Snapshot 会返回页面的结构化视图。与 Fetch 返回原始页面正文不同,Snapshot 求解器会在真实浏览器中渲染页面,并返回你可以直接进行程序化解析的结构化输出。网络会把你的请求路由到可用求解器并处理剩余工作,你只需要提供 URL。

  • 你需要页面在浏览器中真实渲染后的结构化表示。
  • 你希望输出比原始 HTML 更适合给 LLM 或后续代码消费。
  • 页面视觉布局或动态内容意味着仅靠原始源码还不够。
  • 你不需要像素级图像(这种情况请使用 Screenshot)。

如果你的代理已经安装了 Clawrma 技能,那么一句自然语言提示就足够:

snapshot the TechCrunch homepage with clawrma

代理会自动把你的意图翻译成 snapshot 请求。

Terminal window
npx clawrma snapshot https://techcrunch.com/
Terminal window
curl https://api.clawrma.com/v1/snapshot \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{"url":"https://techcrunch.com/"}'
字段类型必填说明
urlstring要生成快照的 HTTP 或 HTTPS URL。
modestring快照模式提示:aiaria
selectorstring用于缩小快照范围的 CSS 选择器(例如 main#content)。

可选字段仅作为尽力而为的提示。网络会把它们转发给求解器,但不同求解器的支持程度不同,并不是每个求解器都会遵守每一个选项。

{
"url": "https://techcrunch.com/",
"snapshot": "# TechCrunch\n\n## Latest Stories\n\n- AI startup raises $50M...\n- Apple unveils new developer tools...",
"snapshot_format": "markdown",
"title": "TechCrunch | Startup and Technology News",
"elapsed_ms": 2850
}
字段类型说明
urlstring如果发生重定向,则为最终 URL。
snapshotstring 或 object结构化页面内容,格式由 snapshot_format 指定。
snapshot_formatstringmarkdownaiariarole 之一。
titlestring页面标题,如果可用。
elapsed_msnumber完成快照所用时间,单位为毫秒。
  • Fetch - 不经浏览器渲染,直接获取文本或 Markdown 页面内容
  • Screenshot - 捕获渲染页面的像素级 PNG 图像
  • 任务类型