大模型

1B模型和1T数据要训练多久

1B模型和1T数据要训练多久 1. 训练时间计算公式 训练时间的计算公式如下: $\frac{abc
2025-01-22

大模型训练的核心要点

“既然大模型训练的过程就是其参数不断优化的过程,那到底应该怎么去优化这些参数呢?” 大模型训练的核心要点 既
2024-11-21

大模型训练的本质

“ 大模型训练的本质,是一个参数不断优化的过程 ” 大模型训练的本质是通过大量的数据和计算资源,优化一个参数化
2024-11-21

爬虫(关于大模型+爬虫技术)

爬虫(关于大模型+爬虫技术) 两个开源爬虫项目地址 crawl4ai:https://github.com/unclecode/crawl4ai ScrapeGraphAI:https://github.com/ScrapeGraphAI/Scrapegraph-ai
2024-11-08

RPM和TPM在AI模型领域的含义

RPM和TPM在AI模型领域的含义 RPM 模型请求数单位(在AI模型领域): 在人工智能和机器学习领域,特别是在模型推理定价中,RPM(Requests Per Minute)表示每分钟请求数。这是衡量模型处理能力的一个关键指标,反映了模型在给定时间内能够处理的请求数量。例如,在豆包大模型的定价中
2024-11-05

Prompt 提示词工程编写原则与操作实践

Prompt 提示词工程编写原则与操作实践 Prompt 提示词工程编写的原则 在编写Prompt提示词工程时,遵循一定的原则可帮助我们更有效地利用自然语言处理技术和生成高质量的内容。以下是一些重要的原则: 指令明确 清晰表达意图:确保你提供的prompt指令明确地传达了您想要达到的目标; 减少模糊
2024-11-01

提示词工程——链式思考(CoT)提示

提示词工程——链式思考(CoT)提示 链式思考(CoT)提示 图片来源:
2024-11-01

提示词工程——简介

提示词工程——简介 提示工程是一个较新的学科,应用于开发和优化提示词(Prompt),帮助用户有效地将语言模型用于各种应用场景和研究领域。掌握了提示工程相关技能将有助于用户更好地了解大型语言模型的能力和局限性。研究人员可利用提示工程来提高大语言模型处理复杂任务场景的能力
2024-11-01

google-bert/bert-base-chinese下载链接

google-bert/bert-base-chinese下载链接 https://s3.amazonaws.com/models.huggingface.co/bert/bert-base-chinese.tar.gz
2024-10-31

怎么解决大模型中的多轮对话问题?

怎么解决大模型中的多轮对话问题? 难点: 在多轮对话中,模型需要记住并正确理解之前对话的上下文。 大型模型虽然能处理较长的上下文,但仍然存在记忆限制,无法记住非常早期的对话信息。 在对话过程中,模型需要抽取关键信息并更新对话状态。 解决办法: 拼接历史query策略
2024-05-29