健兼
博客
更多>>
(LLM系列)RAG系统性能优化实战:从评估不达标到全面通关的完整历程

(LLM系列)RAG系统性能优化实战:从评估不达标到全面通关的完整历程

基于阿里云百炼+pgvector的RAG系统优化实战,使用Ragas框架进行专业评估。详细记录从4项指标不达标到全面通过的完整优化过程,包含LLM-as-a-Judge评估器创建、Rerank API修复、配置参数调优、模型选型优化。最终所有指标达标,生成延迟下降34%,成本降低60%。

RAG LLM AI 阿里云 优化 pgvector Ragas
RAG混合检索:关键词 + 向量的最佳组合

RAG混合检索:关键词 + 向量的最佳组合

在RAG系统中,没有哪一种检索方式是万能的。本文从原理出发,结合LangChain工程实践,深入拆解混合检索的架构设计与场景调参,带你找到关键词与向量的黄金配比。

RAG LangChain 向量检索 BM25 混合检索 Reranker LLM应用 工程实践
LangChain核心概念解析

LangChain核心概念解析

2026年最新版LangChain核心概念详解:Model I/O、Chain、Memory、LCEL、LangGraph(含执行流程)

LangChain LLM 教程 入门
© 2026 Jian Zhang
Developed by Jian Zhang using Astrofy Template ⚡️
  • 首页
  • 博客