MaXiaoTiao

怎么实时保持模型记忆的更新？

怎么实时保持模型记忆的更新（一）在构建实时智能体、智能客服、RAG问答系统时：如何让已有模型随着数据变化不断“更新记忆”，而不是总依赖静态的知识。一句话语言模型的“记忆”分为静态记忆（训练时参数内化）与动态记忆（运行时知识注入）。实时更新通常通过外部知识组件 + 缓存机制 + 向量检索/RA

2025-07-15

为什么重排序比粗排效果更好

为什么重排序比粗排效果更好因为粗排模型只做了粗略的相似度匹配，很多细节和语义关系无法捕捉，而重排序模型可以结合查询和文档内容进行深入理解，所以能更准确判断哪些文档更相关，效果自然更好。深入解释一、粗排模型的机制与局限粗排模型通常用的是：稀疏向量方法（如 BM25）：匹配关键词出现频次稠密

2025-07-14

为什么需要重排序

重排序是什么重排序（Re-ranking）是对初步检索到的文档进行二次排序的关键步骤，目的是提升最相关文档的优先级，从而优化最终生成答案的质量。为什么需要重排序在 RAG 中，系统通常会使用： BM25、TF-IDF 等稀疏方法，或 Embedding 相似度（如 DPR、ColBERT）等稠

2025-07-14

模型的知识冲突现象

在大语言模型（LLM）的世界里，知识不是储存在一个线性的书架上，而是弥散在亿万个参数之间，像一张看不见的神经网络星图。它不像人类那样“记得”一件事，而是“统计地倾向于”某种表达。当你问它一个问题，它会从这张星图中沿着概率最高的路径走出来，告诉你它“认为”最可能的答案。一、什么是大模型的知识冲突 “

学习

2025-07-03

稀疏向量 vs 稠密向量：到底有什么区别？

稀疏向量 vs 稠密向量：到底有什么区别？我们常听到“稀疏向量”和“稠密向量”这两个词，它们到底差在哪？一句话概括：稀疏 vs 稠密，说白了就是信息在向量中的分布方式不同。一、最直观的区别稀疏向量（Sparse Vector）：大多数维度都是 0，只有少量非零元素。稠密向量（Dense V

学习

2025-07-02

Text2sql 框架

Text2sql 框架一个完整的文本到 SQL（Text-to-SQL）任务框架应该包括四个关键步骤：预处理、抽取、生成、精炼。预处理（Preprocessing）该阶段主要处理与自然语言查询（NLQ）无关但对 SQL 生成至关重要的辅助信息，包括：数据库模式信息（Schema Info

学习

2025-04-03

Text2Sql相关论文及code

Text2Sql 以下是一些关于Text-to-SQL的相关论文及其代码仓库： OpenSearch-SQL：一个开源的Text-to-SQL框架，提供了将自然语言查询转换为SQL查询的功能。 GitHub链接：OpenSearch-AI/OpenSearch-SQL CHASE-SQL：该框架利用

学习

2025-04-02