IPEX-LLM 是一个 PyTorch 库,用于在 Intel CPU 和 GPU(例如带有集成显卡的本地 PC、独立显卡如 Arc、Flex 和 Max)上运行 LLM,具有极低的延迟。本示例介绍如何使用 LangChain 结合
ipex-llm 优化在 Intel CPU 上执行嵌入任务。这对于 RAG、文档问答等应用很有帮助。
环境设置
sentence-transformers。
注意 对于 Windows 用户,在安装ipex-llm时不需要--extra-index-url https://download.pytorch.org/whl/cpu。
基本用法
API 参考
Connect these docs to Claude, VSCode, and more via MCP for real-time answers.

