最新文章

怎么实时保持模型记忆的更新?

怎么实时保持模型记忆的更新(一) 在构建实时智能体、智能客服、RAG问答系统时:如何让已有模型随着数据变化不断“更新记忆”,而不是总依赖静态的知识。 一句话 语言模型的“记忆”分为静态记忆(训练时参数内化)与动态记忆(运行时知识注入)。实时更新通常通过 外部知识组件 + 缓存机制 + 向量检索/RA
2025-07-15

为什么重排序比粗排效果更好

为什么重排序比粗排效果更好 因为粗排模型只做了粗略的相似度匹配,很多细节和语义关系无法捕捉,而重排序模型可以结合查询和文档内容进行深入理解,所以能更准确判断哪些文档更相关,效果自然更好。 深入解释 一、粗排模型的机制与局限 粗排模型通常用的是: 稀疏向量方法(如 BM25):匹配关键词出现频次 稠密
2025-07-14

为什么需要重排序

重排序是什么 重排序(Re-ranking)是对初步检索到的文档进行二次排序的关键步骤,目的是提升最相关文档的优先级,从而优化最终生成答案的质量。 为什么需要重排序 在 RAG 中,系统通常会使用: BM25、TF-IDF 等稀疏方法,或 Embedding 相似度(如 DPR、ColBERT)等稠
2025-07-14

模型的知识冲突现象

在大语言模型(LLM)的世界里,知识不是储存在一个线性的书架上,而是弥散在亿万个参数之间,像一张看不见的神经网络星图。它不像人类那样“记得”一件事,而是“统计地倾向于”某种表达。当你问它一个问题,它会从这张星图中沿着概率最高的路径走出来,告诉你它“认为”最可能的答案。 一、什么是大模型的知识冲突 “
2025-07-03

稀疏向量 vs 稠密向量:到底有什么区别?

稀疏向量 vs 稠密向量:到底有什么区别? 我们常听到“稀疏向量”和“稠密向量”这两个词,它们到底差在哪?一句话概括: 稀疏 vs 稠密,说白了就是信息在向量中的分布方式不同。 一、最直观的区别 稀疏向量(Sparse Vector):大多数维度都是 0,只有少量非零元素。 稠密向量(Dense V
2025-07-02

Text2sql 框架

Text2sql 框架 一个完整的 文本到 SQL(Text-to-SQL)任务框架 应该包括四个关键步骤:预处理、抽取、生成、精炼。 预处理(Preprocessing) 该阶段主要处理与自然语言查询(NLQ)无关但对 SQL 生成至关重要的辅助信息,包括: 数据库模式信息(Schema Info
2025-04-03

Text2Sql相关论文及code

Text2Sql 以下是一些关于Text-to-SQL的相关论文及其代码仓库: OpenSearch-SQL:一个开源的Text-to-SQL框架,提供了将自然语言查询转换为SQL查询的功能。 GitHub链接:OpenSearch-AI/OpenSearch-SQL CHASE-SQL:该框架利用
2025-04-02