健兼
博客
更多>>
Harness Engineering:AI Agent 时代的工程化实践

Harness Engineering:AI Agent 时代的工程化实践

深度解析 Harness Engineering 核心概念、实践方法与行业案例

AI Agent Harness Engineering 工程化 大语言模型
(LLM系列)RAG系统性能优化实战:从评估不达标到全面通关的完整历程

(LLM系列)RAG系统性能优化实战:从评估不达标到全面通关的完整历程

基于阿里云百炼+pgvector的RAG系统优化实战,使用Ragas框架进行专业评估。详细记录从4项指标不达标到全面通过的完整优化过程,包含LLM-as-a-Judge评估器创建、Rerank API修复、配置参数调优、模型选型优化。最终所有指标达标,生成延迟下降34%,成本降低60%。

RAG LLM AI 阿里云 优化 pgvector Ragas
RAG混合检索:关键词 + 向量的最佳组合

RAG混合检索:关键词 + 向量的最佳组合

在RAG系统中,没有哪一种检索方式是万能的。本文从原理出发,结合LangChain工程实践,深入拆解混合检索的架构设计与场景调参,带你找到关键词与向量的黄金配比。

RAG LangChain 向量检索 BM25 混合检索 Reranker LLM应用 工程实践
© 2026 Jian Zhang
Developed by Jian Zhang using Astrofy Template ⚡️
  • 首页
  • 博客