深入LLM与RAG 原理、实现与应用
深入LLM与RAG 原理、实现与应用 一、什么是 RAG? RAG 全称 Retrieval-Augmented Generation,翻译成中文是检索增强生成。检索指的是检索外部知识库,增强生成指的是将检索到的知识送给大语言模型以此来优化大模型的生成结果,使得大模型在生成更精确、更贴合上下文答案的同时,也能有效减少产生误导性信息的可能。 二、RAG 的流程 RAG 的中文名称是检索增强生成,从字面意思来理解,包含三个检索、增强和生成三个过程。 检索: 根据用户的查询内容,从外挂知识库获取相关信息。具体来说,就是将用户的查询通过嵌入模型转换成向量,以便与向量数据库中存储的知识相关的向量进行比对。通过相似性搜索,从向量数据库中找出最匹配的前 K 个数据。 增强: 将用户的查询内容和检索到的相关...阅读全文