健兼
博客 - 优化
    (LLM系列)RAG系统性能优化实战:从评估不达标到全面通关的完整历程

    (LLM系列)RAG系统性能优化实战:从评估不达标到全面通关的完整历程

    基于阿里云百炼+pgvector的RAG系统优化实战,使用Ragas框架进行专业评估。详细记录从4项指标不达标到全面通过的完整优化过程,包含LLM-as-a-Judge评估器创建、Rerank API修复、配置参数调优、模型选型优化。最终所有指标达标,生成延迟下降34%,成本降低60%。

    RAG LLM AI 阿里云 优化 pgvector Ragas
1 / 1
© 2026 Jian Zhang
Developed by Jian Zhang using Astrofy Template ⚡️
  • 首页
  • 博客