MaXiaoTiao
Always like this.
Home
Archives
Categories
Label
Moments
Photos
Link
About
大模型
#Vanna
4
#Ollama
1
#分布式存储
2
#k8s
8
#nginx
2
#docker
4
#LInux
1
#FastApi
1
#日报
0
#爬虫
12
#pandas
3
#数据处理
3
#大模型
18
#AIGC
17
#金融
33
#量化交易
8
#Swagger2
1
#Spring Boot
7
#LeetCode
9
#课程作业
1
#软件测试
2
#bert
1
#计算机网络
0
#操作系统
4
#数据结构
0
#go
0
#redis
0
#python
10
#java
30
#证据理论
1
#多标签
3
#机器学习
14
#深度学习
39
#单纯记录
0
RAG优化技巧
RAG优化技巧 RAG的挑战 RAG通过检索现有的大量知识,结合强大的生成模型,为复杂的问答、文本摘要和生成任务带来了全新的解决方案。然而,尽管RAG有其独特的优势,但在实践过程中也遭遇了多个挑战。 1数据质量差导致检索效果差 在RAG模型中,检索阶段的输出直接影响到生成阶段的输入和最终的输出质量。
学习
2024-05-10
语义匹配问题
语义匹配问题 对向量知识库中的相关内容与相关实体进行语义匹配 难点:如何准确计算用户输入的和知识库相关内容语义相似度。 解决方案: 使用嵌入技术(如Word2Vec, BERT,m3e等)将文本转换为向量表示,然后计算向量之间的相似度。 应用余弦相似度、欧几里得距离或更复杂的相似度度量方法,如基于深
学习
2024-04-19
RAG 效果评估
RAG 效果评估 RAG模块拆分 代入产品经理需求沟通的视角回顾下: 改写(Query Rewriting):优化查询以便更好地与检索系统交互。机器人也需要做需求分析,改写约等于产品经理的需求分析,让你更好的理解用户的需求,需要做背景调研等工作。 检索(Retrieval):从一个大型的文档集合中找
学习
2024-03-06
自己在做RAG项目时,遇到的问题
自己在做RAG项目时,遇到的问题 文档的读取和处理 (PDF PPT EXCEL等各种格式的文档) 如何把文档合理的分割成不同的 chunks 段落 如何合理的 embedding 向量化 ,使用什么样的向量数据库 对问题做一个扩充或重新改写(用户问题比较简段或与上下文
学习
2024-02-17
SPN4RE(Set Prediction Networks for Joint Entity and Relation Extraction
SPN4RE(Set Prediction Networks for Joint Entity and Relation Extraction SPN4RE(Set Prediction Networks for Relation Extraction)模型是一种用于联合实体和关系抽取的深度学习模型
学习
2024-01-10
微调(LoRA微调)
微调(LoRA微调) 什么是参数高效微调?固定大部分预训练模型(LLM)参数,微调少量或额外的模型参数。以往说的微调,一般指的是全量微调,就是所有的参数都来训练。为什么在大语言模型领域,很少人提全量微调,反而参数高效微调被提得更多呢?因为全量微调占用的显存太大了。以llama2-7B为例,不考虑中间
学习
2023-12-15
估算大模型需要多大的显存
估算大模型需要多大的显存 目前模型的参数绝大多数都是float32类型, 占用4个字节。所以一个粗略的计算方法就是,每10亿个参数,占用4G显存</
学习
2023-10-15
端到端模型指什么?
端到端模型指什么? 端到端的模式是什么意思?如何理解? 理解:端到端的模型本质是解决复杂问题的一种方法、思路。 端到端的模型解决问题的办法和非端到端模型解决复杂问题的区别 端到端 VS 流程化处理的区别 非端到端解决办法 在处理复杂任务的时候,倾向于将复杂任务拆解成多个子模块,分布的解决问题 比如:
学习
2023-05-16
上一页