LangChain核心概念解析

2026-03-23
LangChain LLM 教程入门

Last updated on 2026-03-23

LangChain 核心概念解析

2026年最新版 | Model I/O、Chain、Memory、LCEL 全面掌握

一、引言

LangChain 是由 Harrison Chase 于2022年10月发起的开源LLM应用开发框架，比ChatGPT问世还要早一个月。经过近三年的发展，LangChain已从单一开源包成长为覆盖开发、调试、部署全流程的完整生态系统。

截至2026年，LangChain在GitHub上已获得超过90,000 Stars，每月数百万次下载，成为企业级LLM应用开发的标准基础设施。本文将深入解析LangChain的四大核心概念：Model I/O、Chain、Memory、LCEL，帮助你建立完整的知识体系。

二、整体架构概览

2.1 分层架构设计

LangChain采用分层架构，不同层级各司其职又可协同工作：

langchain-core：提供基础抽象与LCEL，是组件协同的核心
langchain-community：第三方集成模块，覆盖Model I/O、Retrieval、Tool等
langchain：包含Chains、Agents、Retrieval等核心业务组件
langgraph：编排多个节点，负责整个工作流的调度与状态跳转

2.2 核心组件关系

三、Model I/O：与LLM的沟通桥梁

Model I/O是应用与LLM交互的核心模块，类似于JDBC与数据库的关系。其核心价值在于解耦应用逻辑与底层模型实现，让你可以自由切换不同提供商（OpenAI、Anthropic、Google等）而不改变业务代码。

3.1 三步工作流程

Model I/O的工作流程分为三个关键步骤：

3.2 Prompt Templates

Prompt Templates 用于结构化提示词，支持变量替换和复用：

1
from langchain_core.prompts import ChatPromptTemplate
2

3
# 方式一：from_messages（推荐）
4
prompt = ChatPromptTemplate.from_messages([
5
    ("system", "你是一个{role}，专门帮助用户解决{topic}问题"),
6
    ("human", "我的问题是：{question}")
7
])
8

9
# 方式二：from_template（传统方式）
10
prompt = ChatPromptTemplate.from_template(
11
    "你是{role}，请用{style}风格回答以下问题：{question}"
12
)
13

14
# 格式化输入
15
formatted_prompt = prompt.format(
16
    role="技术顾问",
17
    topic="编程",
18
    question="Python如何处理异常？",
19
    style="简洁专业"
20
)
21

22
print(formatted_prompt)

输出：

1
System: 你是一个技术顾问，专门帮助用户解决编程问题
2
Human: 我的问题是：Python如何处理异常？

3.3 Chat Models

LangChain提供统一的模型接口，支持多种提供商：

1
from langchain_openai import ChatOpenAI
2
from langchain_anthropic import ChatAnthropic
3
from langchain_google_genai import ChatGoogleGenerativeAI
4

5
# OpenAI
6
openai_llm = ChatOpenAI(
7
    model="gpt-4o",
8
    temperature=0.7,
9
    streaming=True  # 启用流式输出
10
)
11

12
# Anthropic
13
claude_llm = ChatAnthropic(
14
    model="claude-3-5-sonnet-20241022",
15
    temperature=0.7
16
)
17

18
# Google Gemini
19
gemini_llm = ChatGoogleGenerativeAI(
20
    model="gemini-2.0-flash-exp",
21
    temperature=0.7
22
)

3.4 Output Parsers

Output Parsers 将原始输出转换为结构化数据：

1
from langchain_core.output_parsers import StrOutputParser
2
from langchain_core.output_parsers import JsonOutputParser
3
from langchain.output_parsers import PydanticOutputParser
4
from pydantic import BaseModel
5

6
# 字符串解析器（最常用）
7
str_parser = StrOutputParser()
8

9
# JSON解析器
10
json_parser = JsonOutputParser()
11

12
# Pydantic解析器（推荐用于结构化输出）
13
class Answer(BaseModel):
14
    result: str
15
    confidence: float
16
    sources: list[str]
17

18
pydantic_parser = PydanticOutputParser(pydantic_object=Answer)
19

20
# 使用示例
21
response = llm.invoke("What is 2+2?")
22
parsed = str_parser.invoke(response)
23
print(parsed)  # "2"

3.5 完整调用示例

将三个组件串联成完整流程：

1
from langchain_openai import ChatOpenAI
2
from langchain_core.prompts import ChatPromptTemplate
3
from langchain_core.output_parsers import StrOutputParser
4

5
# 初始化模型
6
llm = ChatOpenAI(model="gpt-4o-mini", temperature=0)
7

8
# 创建Prompt模板
9
prompt = ChatPromptTemplate.from_template(
10
    "用一句话解释{concept}，用中文回答"
11
)
12

13
# 创建输出解析器
14
parser = StrOutputParser()
15

16
# 方式一：传统方式（手动调用）
17
formatted_prompt = prompt.format(concept="LLM")
18
response = llm.invoke(formatted_prompt)
19
result = parser.invoke(response)
20
print(result)
21

22
# 方式二：LCEL管道方式（推荐）
23
chain = prompt | llm | parser
24
result = chain.invoke({"concept": "LLM"})
25
print(result)

四、Chains：串联组件的工作流

Chains（链）用于将多个组件串联成自动化工作流，实现步骤化任务处理。

4.1 LLMChain

最基本的链，用于将Prompt模板、LLM、输出解析器组合：

1
from langchain_openai import ChatOpenAI
2
from langchain_core.prompts import ChatPromptTemplate
3
from langchain.chains import LLMChain
4

5
llm = ChatOpenAI(model="gpt-4o-mini")
6

7
prompt = ChatPromptTemplate.from_template(
8
    "帮我写一首关于{topic}的诗"
9
)
10

11
chain = LLMChain(llm=llm, prompt=prompt)
12
result = chain.run(topic="春天")
13
print(result)

4.2 Sequential Chain

顺序执行多个链：

1
from langchain.chains import SequentialChain
2
from langchain.chains import LLMChain
3
from langchain_core.prompts import ChatPromptTemplate
4

5
# 链1：生成标题
6
title_chain = LLMChain(
7
    llm=llm,
8
    prompt=ChatPromptTemplate.from_template("为以下内容生成一个标题：{content}"),
9
    output_key="title"
10
)
11

12
# 链2：生成摘要
13
summary_chain = LLMChain(
14
    llm=llm,
15
    prompt=ChatPromptTemplate.from_template("用50字概括以下内容：{content}"),
16
    output_key="summary"
17
)
18

19
# 组合顺序链
20
sequential_chain = SequentialChain(
21
    chains=[title_chain, summary_chain],
22
    input_variables=["content"],
23
    output_variables=["title", "summary"]
24
)
25

26
result = sequential_chain.invoke({"content": "Python是一门易学难精的编程语言..."})
27
print(result)

4.3 传统方式 vs LCEL方式对比

特性	传统方式 (LLMChain)	LCEL方式
语法	面向对象，方法调用	管道运算符 `\|`
灵活性	较低，固定模式	高，可自由组合
并行支持	需额外处理	原生支持
流式输出	需额外配置	原生支持
异步支持	需异步封装	原生async/await

五、LCEL语法：LangChain Expression Language

LCEL是LangChain最强大的特性之一，它将所有组件统一为Runnable接口，通过管道运算符实现声明式组合。

5.1 Runnable接口

LangChain v1.x中，所有组件都实现了Runnable接口：

1
from langchain_core.runnables import Runnable
2

3
# Runnable接口的核心方法
4
class Runnable:
5
    def invoke(self, input, config=None):
6
        """同步调用"""
7
        pass
8

9
    async def ainvoke(self, input, config=None):
10
        """异步调用"""
11
        pass
12

13
    def stream(self, input, config=None):
14
        """流式输出"""
15
        pass
16

17
    def batch(self, inputs, config=None):
18
        """批量处理"""
19
        pass

5.2 管道运算符

| 运算符将前一个组件的输出作为下一个组件的输入：

1
# 基本语法
2
chain = component_a | component_b | component_c
3

4
# 等价于
5
result = component_c.invoke(component_b.invoke(component_a.invoke(input)))

5.3 完整示例对比

传统方式：

1
from langchain_openai import ChatOpenAI
2
from langchain_core.prompts import ChatPromptTemplate
3
from langchain_core.output_parsers import StrOutputParser
4

5
llm = ChatOpenAI(model="gpt-4o-mini")
6
prompt = ChatPromptTemplate.from_template("用中文介绍{topic}")
7
parser = StrOutputParser()
8

9
# 手动串联
10
formatted = prompt.format(topic="人工智能")
11
response = llm.invoke(formatted)
12
result = parser.invoke(response)
13
print(result)

LCEL方式：

1
# 一行搞定
2
chain = prompt | llm | parser
3
result = chain.invoke({"topic": "人工智能"})
4
print(result)

5.4 并行与分支

LCEL支持并行处理和条件分支：

1
from langchain_core.runnables import RunnableParallel, RunnableBranch
2

3
# 并行执行多个分支
4
parallel_chain = RunnableParallel(
5
    chinese = prompt | llm | parser,
6
    english = (prompt | llm | parser).bind(language="en"),
7
    code = code_prompt | llm | parser
8
)
9

10
# 条件分支
11
branch_chain = RunnableBranch(
12
    (lambda x: x.get("type") == "code", code_chain),
13
    (lambda x: x.get("type") == "data", data_chain),
14
    default_chain  # 默认链
15
)

5.5 流式输出

LCEL原生支持流式输出：

1
chain = prompt | llm | parser
2

3
# 流式输出（一个字一个字显示）
4
for chunk in chain.stream({"topic": "量子计算"}):
5
    print(chunk, end="", flush=True)

5.6 LCEL的优势

优势	说明
简洁性	用管道运算符替代嵌套函数调用
可组合性	组件可自由组合，易于扩展
原生支持	并行、流式、异步开箱即用
可观测性	易于调试和监控
性能	官方称并行处理效率提升30%-50%

六、Memory：对话状态的守护者

Memory（内存）用于在对话过程中维护状态，解决LLM上下文窗口有限的问题。

6.1 短期记忆 vs 长期记忆

6.2 ConversationBufferMemory

最简单的内存，保存完整对话历史：

1
from langchain.memory import ConversationBufferMemory
2
from langchain.chains import LLMChain
3
from langchain_openai import ChatOpenAI
4
from langchain_core.prompts import ChatPromptTemplate
5

6
llm = ChatOpenAI(model="gpt-4o-mini")
7

8
# 创建带记忆的链
9
memory = ConversationBufferMemory(
10
    memory_key="history",
11
    return_messages=True  # 返回消息对象列表
12
)
13

14
prompt = ChatPromptTemplate.from_template(
15
    """基于以下对话历史回答问题：
16

17
历史：
18
{history}
19

20
问题：{question}"""
21
)
22

23
chain = LLMChain(llm=llm, prompt=prompt, memory=memory)
24

25
# 多轮对话
26
print(chain.invoke({"question": "我叫张三"}))
27
print(chain.invoke({"question": "我叫什么名字？"}))

6.3 ConversationBufferWindowMemory

限制保存最近N轮对话，避免历史过长：

1
from langchain.memory import ConversationBufferWindowMemory
2

3
memory = ConversationBufferWindowMemory(
4
    k=3,  # 只保留最近3轮对话
5
    memory_key="chat_history",
6
    return_messages=True
7
)

6.4 ConversationSummaryMemory

自动总结对话要点，适合长对话：

1
from langchain.memory import ConversationSummaryMemory
2

3
memory = ConversationSummaryMemory(
4
    llm=llm,  # 用于生成摘要的LLM
5
    memory_key="summary",
6
    return_messages=True
7
)

6.5 VectorStoreRetrieverMemory：基于向量检索的语义记忆

VectorStoreRetrieverMemory 是LangChain提供的长期记忆组件，它将对话内容存储在向量数据库中，通过语义相似性检索来回忆相关信息。与短期记忆不同，它不显式跟踪对话顺序，而是根据语义相关性动态检索最”显著”的记忆片段。

6.5.1 核心特点

特性	说明
存储方式	向量数据库（FAISS、Chroma、Pinecone等）
检索方式	语义相似性搜索，而非时间顺序
适用场景	跨会话记忆、语义检索、长周期知识积累
优势	支持海量记忆、按语义检索、不受token限制

6.5.2 工作原理

6.5.3 初始化向量存储

方式一：FAISS（本地向量库）

1
import faiss
2
from langchain.docstore import InMemoryDocstore
3
from langchain_community.vectorstores import FAISS
4
from langchain_openai import OpenAIEmbeddings
5
from langchain.memory import VectorStoreRetrieverMemory
6
from langchain.chains import ConversationChain
7
from langchain_openai import ChatOpenAI
8
from langchain_core.prompts import ChatPromptTemplate
9

10
# 初始化嵌入模型和LLM
11
embedding = OpenAIEmbeddings()
12
llm = ChatOpenAI(model="gpt-4o-mini")
13

14
# 创建FAISS向量存储
15
embedding_size = 1536  # OpenAIEmbeddings维度
16
index = faiss.IndexFlatL2(embedding_size)
17
vectorstore = FAISS(index, embedding, InMemoryDocStore(), {})
18

19
# 创建retriever（k=3表示返回最相关的3条记忆）
20
retriever = vectorstore.as_retriever(search_kwargs={"k": 3})
21

22
# 创建向量记忆
23
memory = VectorStoreRetrieverMemory(
24
    retriever=retriever,
25
    memory_key="chat_history"
26
)
27

28
# 保存一些对话记忆
29
memory.save_context(
30
    {"input": "我最喜欢的食物是披萨"},
31
    {"output": "好的，我记住了 你喜欢披萨"}
32
)
33
memory.save_context(
34
    {"input": "我喜欢在周末去跑步"},
35
    {"output": "运动是个很好的习惯！"}
36
)
37
memory.save_context(
38
    {"input": "我最近在学习Python编程"},
39
    {"output": "Python是一门很实用的语言，继续加油！"}
40
)
41

42
# 检索相关记忆
43
print(memory.load_memory_variables({"prompt": "我应该吃什么？"}))

输出：

1
{'chat_history': 'input: 我最喜欢的食物是披萨\noutput: 好的，我记住了...'}

方式二：Chroma（本地向量库）

1
from langchain_community.vectorstores import Chroma
2
from langchain.embeddings import OpenAIEmbeddings
3

4
# 创建Chroma向量存储
5
vectorstore = Chroma.from_documents(
6
    documents=[],  # 初始为空
7
    embedding=OpenAIEmbeddings()
8
)
9

10
# 创建memory
11
memory = VectorStoreRetrieverMemory(
12
    retriever=vectorstore.as_retriever(search_kwargs={"k": 3}),
13
    memory_key="history"
14
)

方式三：Pinecone（云端向量数据库）

1
from langchain_pinecone import PineconeVectorStore
2
from langchain.embeddings import OpenAIEmbeddings
3
from langchain.memory import VectorStoreRetrieverMemory
4

5
# 连接Pinecone
6
vectorstore = PineconeVectorStore.from_params(
7
    index_name="my-index",
8
    embedding=OpenAIEmbeddings(),
9
    namespace="memory"
10
)
11

12
memory = VectorStoreRetrieverMemory(
13
    retriever=vectorstore.as_retriever(search_kwargs={"k": 5}),
14
    memory_key="long_term_memory"
15
)

6.5.4 在ConversationChain中使用

将向量记忆与对话链结合：

1
# 创建对话链
2
prompt = ChatPromptTemplate.from_template("""
3
基于以下记忆回答用户问题。如果没有相关信息，请如实说明。
4

5
记忆：
6
{chat_history}
7

8
问题：{input}
9
""")
10

11
conversation = ConversationChain(
12
    llm=llm,
13
    memory=memory,
14
    prompt=prompt,
15
    verbose=True
16
)
17

18
# 第一次对话
19
response1 = conversation.invoke({"input": "我的爱好是什么？"})
20
print(response1)
21

22
# 第二次对话（跨会话）
23
response2 = conversation.invoke({"input": "我应该学习什么编程语言？"})
24
print(response2)

6.5.5 高级配置：检索策略

相似度搜索（默认）

1
retriever = vectorstore.as_retriever(
2
    search_type="similarity",  # 默认
3
    search_kwargs={"k": 3}
4
)

最大边际相关性（MMR）- 更具多样性

1
retriever = vectorstore.as_retriever(
2
    search_type="mmr",  # 避免返回相似度过高的结果
3
    search_kwargs={"k": 5, "fetch_k": 20}
4
)

带分数阈值的检索

1
retriever = vectorstore.as_retriever(
2
    search_kwargs={"k": 5, "score_threshold": 0.7}
3
)

6.5.6 使用场景与注意事项

适用场景	不适用场景
跨会话持久化记忆	需要严格时间顺序的场景
基于语义而非关键词的检索	短对话、简单上下文
海量历史信息存储	实时性要求极高的场景
个性化用户画像构建	隐私敏感的数据

注意事项：

k值选择：k越大，检索越多，但可能引入噪声；k越小，可能遗漏重要信息
嵌入模型：选择与场景匹配的嵌入模型，中文推荐text-embedding-3-small或中文专用模型
存储成本：云端向量数据库有存储费用，本地FAISS/Chroma免费但占用磁盘
定期清理：长期使用后需要清理无效记忆，避免检索质量下降

6.6 LangGraph中的持久化

LangGraph提供检查点机制实现状态持久化：

1
from langgraph.checkpoint.memory import MemorySaver
2
from langgraph.graph import StateGraph, START
3

4
# 创建带持久化的图
5
checkpointer = MemorySaver()
6

7
graph = StateGraph(GraphState)
8
graph.add_node("process", process_node)
9
graph.add_edge(START, "process")
10
graph.compile(checkpointer=checkpointer)
11

12
# 线程ID用于恢复状态
13
config = {"configurable": {"thread_id": "user_123"}}
14
result = graph.invoke({"input": "hello"}, config)
15

16
# 恢复状态继续执行
17
result = graph.invoke({"input": "continue"}, config)

6.7 LangGraph 执行流程

LangGraph 的执行流程清晰简洁，核心围绕状态（State）、节点（Node）、**边（Edge）**三个概念展开：

核心概念：

概念	说明	关键函数
State	图的共享状态，可以是dict或Pydantic模型	`StateGraph(GraphState)`
Node	执行逻辑的函数，接收state并返回更新	`graph.add_node(name, func)`
Edge	定义节点间的流转关系	`graph.add_edge()` / `graph.add_conditional_edges()`
compile	将图编译为可执行的app	`graph.compile()`

最小示例：

1
from langgraph.graph import StateGraph, START, END
2

3
# 1. 定义状态类型
4
class GraphState(TypedDict):
5
    input: str
6
    result: str
7

8
# 2. 定义节点函数
9
def node_a(state: GraphState) -> GraphState:
10
    return {"result": f"处理: {state['input']}"}
11

12
def node_b(state: GraphState) -> GraphState:
13
    return {"result": state["result"] + " + 节点B"}
14

15
# 3. 构建图
16
graph = StateGraph(GraphState)
17
graph.add_node("A", node_a)
18
graph.add_node("B", node_b)
19
graph.add_edge(START, "A")    # 起点 → A
20
graph.add_edge("A", "B")      # A → B
21
graph.add_edge("B", END)      # B → 终点
22

23
# 4. 编译并执行
24
app = graph.compile()
25
result = app.invoke({"input": "hello"})
26
print(result)  # {'input': 'hello', 'result': '处理: hello + 节点B'}

执行流程：

用户调用 app.invoke(input) 传入初始状态
图从 START 节点开始，按照边的定义依次执行
每个节点接收当前state，处理后返回更新后的state
执行到 END 节点或无出边时结束
返回最终状态作为结果

与Chain相比，LangGraph适合需要多步骤状态传递、条件分支、人机协作的复杂场景，是构建AI Agent的核心框架。

七、总结与进阶路径

7.1 核心概念回顾

概念	作用	关键类
Model I/O	与LLM交互的标准化接口	ChatOpenAI, PromptTemplate, OutputParser
Chain	串联组件的工作流	LLMChain, SequentialChain
LCEL	声明式组件组合语法	管道运算符 `\|`
Memory	对话状态管理	BufferMemory, VectorStoreMemory

7.2 2026年新特性

LCEL全面取代旧语法：v1.x推荐全部使用LCEL
LangGraph整合：复杂工作流优先使用LangGraph
MCP协议支持：标准化工具和数据接入
LangSmith监控：生产环境必备