Spider 是速度最快的网络爬虫。它可以将任何网站转换为纯 HTML、Markdown、元数据或文本,同时支持您使用 AI 进行自定义操作来执行爬取。Documentation Index
Fetch the complete documentation index at: https://langchain-zh.cn/llms.txt
Use this file to discover all available pages before exploring further.
概述
Spider 允许您使用高性能代理来防止被检测,缓存 AI 操作,通过 Webhook 获取爬取状态,安排定时爬取等。 本指南展示了如何使用 Spider 来爬取/抓取网站,并通过 LangChain 中的SpiderLoader 加载可用于 LLM 的文档。
设置
在 spider.cloud 上获取您自己的 Spider API 密钥。使用方法
以下是如何使用SpiderLoader 的示例:
Spider 提供两种抓取模式:scrape 和 crawl。scrape 仅获取所提供 URL 的内容,而 crawl 则获取所提供 URL 的内容并进一步爬取子页面。
额外参数
有关所有可用params 的详细信息,请参阅 Spider 文档。
Connect these docs to Claude, VSCode, and more via MCP for real-time answers.

