这就是优秀演示原型与真正生产级系统之间的鸿沟。语言模型即便在输出错误信息时,也显得无比笃定,而这在生产环境中,会迅速造成高昂的损失。
正因如此,专业的AI团队都会使用**检索增强生成(RAG)**技术。不是因为它是潮流,而是因为它能让模型始终基于真实信息输出内容。
大多数人忽略的一点是,RAG并非只有一种形态。它包含多种架构,每种架构都用于解决不同的问题。选错架构,就会白白浪费数月的开发时间。
本指南将拆解那些真正能在生产环境中落地生效的RAG架构。
我们先从了解RAG的基础概念开始。
按下回车键或点击查看图片完整尺寸
来源:https://hyperight.com/7-practical-applications-of-rag-models-and-their-impact-on-society/
在深入探讨架构之前,我们先明确核心概念。
检索增强生成(RAG)的作用是,让语言模型在生成回答前先参考外部知识库,以此优化输出内容。它并非让模型凭空“回忆”知识,而是从你的文档、数据库或知识图谱中调取相关且实时的信息。
RAG的实际工作流程如下:
按下回车键或点击查看图片完整尺寸
图片来源:Gemini
按下回车键或点击查看图片完整尺寸
来源:https://www.bentoml.com/blog/building-rag-with-open-source-and-custom-ai-models