大模型

RAG优化技巧

RAG优化技巧 RAG的挑战 RAG通过检索现有的大量知识,结合强大的生成模型,为复杂的问答、文本摘要和生成任务带来了全新的解决方案。然而,尽管RAG有其独特的优势,但在实践过程中也遭遇了多个挑战。 1数据质量差导致检索效果差 在RAG模型中,检索阶段的输出直接影响到生成阶段的输入和最终的输出质量。
2024-05-10

语义匹配问题

语义匹配问题 对向量知识库中的相关内容与相关实体进行语义匹配 难点:如何准确计算用户输入的和知识库相关内容语义相似度。 解决方案: 使用嵌入技术(如Word2Vec, BERT,m3e等)将文本转换为向量表示,然后计算向量之间的相似度。 应用余弦相似度、欧几里得距离或更复杂的相似度度量方法,如基于深
2024-04-19

RAG 效果评估

RAG 效果评估 RAG模块拆分 代入产品经理需求沟通的视角回顾下: 改写(Query Rewriting):优化查询以便更好地与检索系统交互。机器人也需要做需求分析,改写约等于产品经理的需求分析,让你更好的理解用户的需求,需要做背景调研等工作。 检索(Retrieval):从一个大型的文档集合中找
2024-03-06

自己在做RAG项目时,遇到的问题

自己在做RAG项目时,遇到的问题 文档的读取和处理 (PDF PPT EXCEL等各种格式的文档) 如何把文档合理的分割成不同的 chunks 段落 如何合理的 embedding 向量化 ,使用什么样的向量数据库 对问题做一个扩充或重新改写(用户问题比较简段或与上下文
2024-02-17

SPN4RE(Set Prediction Networks for Joint Entity and Relation Extraction

SPN4RE(Set Prediction Networks for Joint Entity and Relation Extraction SPN4RE(Set Prediction Networks for Relation Extraction)模型是一种用于联合实体和关系抽取的深度学习模型
2024-01-10

微调(LoRA微调)

微调(LoRA微调) 什么是参数高效微调?固定大部分预训练模型(LLM)参数,微调少量或额外的模型参数。以往说的微调,一般指的是全量微调,就是所有的参数都来训练。为什么在大语言模型领域,很少人提全量微调,反而参数高效微调被提得更多呢?因为全量微调占用的显存太大了。以llama2-7B为例,不考虑中间
2023-12-15

估算大模型需要多大的显存

估算大模型需要多大的显存 目前模型的参数绝大多数都是float32类型, 占用4个字节。所以一个粗略的计算方法就是,每10亿个参数,占用4G显存</
2023-10-15

端到端模型指什么?

端到端模型指什么? 端到端的模式是什么意思?如何理解? 理解:端到端的模型本质是解决复杂问题的一种方法、思路。 端到端的模型解决问题的办法和非端到端模型解决复杂问题的区别 端到端 VS 流程化处理的区别 非端到端解决办法 在处理复杂任务的时候,倾向于将复杂任务拆解成多个子模块,分布的解决问题 比如:
2023-05-16