MaXiaoTiao

Always like this.

大模型

#git ¹ #随笔 ⁰ #Text2SQL ³ #Vanna ⁴ #Ollama ¹ #分布式存储 ² #k8s ⁸ #nginx ² #docker ⁴ #LInux ¹ #FastApi ¹ #日报 ⁰ #爬虫 ¹² #pandas ³ #数据处理 ³ #大模型 ²⁰ #AIGC ¹⁷ #金融 ³³ #量化交易 ⁸ #Swagger2 ¹ #Spring Boot ⁷ #LeetCode ⁹ #课程作业 ¹ #软件测试 ² #bert ¹ #计算机网络 ⁰ #操作系统 ⁴ #数据结构 ⁰ #go ⁰ #redis ⁰ #python ¹⁰ #java ³⁰ #证据理论 ¹ #多标签 ³ #机器学习 ¹⁴ #深度学习 ⁴⁰ #单纯记录 ⁰

google-bert/bert-base-chinese下载链接

google-bert/bert-base-chinese下载链接 https://s3.amazonaws.com/models.huggingface.co/bert/bert-base-chinese.tar.gz

学习

2024-10-31

怎么解决大模型中的多轮对话问题？

怎么解决大模型中的多轮对话问题？难点：在多轮对话中，模型需要记住并正确理解之前对话的上下文。大型模型虽然能处理较长的上下文，但仍然存在记忆限制，无法记住非常早期的对话信息。在对话过程中，模型需要抽取关键信息并更新对话状态。解决办法：拼接历史query策略

学习

2024-05-29

RAG优化技巧

RAG优化技巧 RAG的挑战 RAG通过检索现有的大量知识，结合强大的生成模型，为复杂的问答、文本摘要和生成任务带来了全新的解决方案。然而，尽管RAG有其独特的优势，但在实践过程中也遭遇了多个挑战。 1数据质量差导致检索效果差在RAG模型中，检索阶段的输出直接影响到生成阶段的输入和最终的输出质量。

学习

2024-05-10

语义匹配问题

语义匹配问题对向量知识库中的相关内容与相关实体进行语义匹配难点：如何准确计算用户输入的和知识库相关内容语义相似度。解决方案：使用嵌入技术（如Word2Vec, BERT，m3e等）将文本转换为向量表示，然后计算向量之间的相似度。应用余弦相似度、欧几里得距离或更复杂的相似度度量方法，如基于深

学习

2024-04-19

RAG 效果评估

RAG 效果评估 RAG模块拆分代入产品经理需求沟通的视角回顾下：改写（Query Rewriting）：优化查询以便更好地与检索系统交互。机器人也需要做需求分析，改写约等于产品经理的需求分析，让你更好的理解用户的需求，需要做背景调研等工作。检索（Retrieval）：从一个大型的文档集合中找

学习

2024-03-06

自己在做RAG项目时，遇到的问题

自己在做RAG项目时，遇到的问题文档的读取和处理（PDF PPT EXCEL等各种格式的文档）如何把文档合理的分割成不同的 chunks 段落如何合理的 embedding 向量化，使用什么样的向量数据库对问题做一个扩充或重新改写（用户问题比较简段或与上下文

学习

2024-02-17

SPN4RE（Set Prediction Networks for Joint Entity and Relation Extraction

SPN4RE（Set Prediction Networks for Joint Entity and Relation Extraction SPN4RE（Set Prediction Networks for Relation Extraction）模型是一种用于联合实体和关系抽取的深度学习模型

学习

2024-01-10

微调（LoRA微调）

微调（LoRA微调）什么是参数高效微调？固定大部分预训练模型（LLM）参数，微调少量或额外的模型参数。以往说的微调，一般指的是全量微调，就是所有的参数都来训练。为什么在大语言模型领域，很少人提全量微调，反而参数高效微调被提得更多呢？因为全量微调占用的显存太大了。以llama2-7B为例，不考虑中间

学习

2023-12-15

估算大模型需要多大的显存

估算大模型需要多大的显存目前模型的参数绝大多数都是float32类型, 占用4个字节。所以一个粗略的计算方法就是，每10亿个参数，占用4G显存</

学习

2023-10-15

端到端模型指什么？

端到端模型指什么？端到端的模式是什么意思？如何理解？理解：端到端的模型本质是解决复杂问题的一种方法、思路。端到端的模型解决问题的办法和非端到端模型解决复杂问题的区别端到端 VS 流程化处理的区别非端到端解决办法在处理复杂任务的时候，倾向于将复杂任务拆解成多个子模块，分布的解决问题比如:

学习

2023-05-16