MaXiaoTiao

大模型训练的核心要点

“既然大模型训练的过程就是其参数不断优化的过程，那到底应该怎么去优化这些参数呢？” 大模型训练的核心要点既

学习

2024-11-21

大模型训练的本质

“ 大模型训练的本质，是一个参数不断优化的过程 ” 大模型训练的本质是通过大量的数据和计算资源，优化一个参数化

学习

2024-11-21

Json 格式数据导入与导出

1. json的数据格式 JSON 是用于存储和交换数据的语法。JSON （JavaScript Object Notation）最初是用 JavaScript 对象表示法编写的文本，但随后成为了一种常见格式，被包括Python在内的众多语言采用。 python里面的语言对象一般只有python能读

学习

2024-11-18

PlayWright——身份验证

PlayWright——身份验证简介 Playwright 在称为浏览器上下文的隔离环境中执行测试。此隔离模型提高了可重复性和防止了级联测试失败。测试可以加载现有的已认证状态。这样就不需要在每个测试中都进行身份验证，从而加快了测试执行速度。

学习

2024-11-15

Crawl4AI 提取策略：JSON CSS、LLM 和余弦相似度

Crawl4AI 提取策略：JSON CSS、LLM 和余弦相似度快速介绍介绍用于结构化数据的 JSON CSS 提取策略、用于智能解析的 LLM 提取策略和用于聚类相似内容的余弦策略。演示如何使用 JSON CSS 从电子商务网站抓取产品详细信息。以下是 LLM 提取策略视频的综合大纲，涵

学习

2024-11-11

arun() 方法的完整参数指南

arun() 方法的完整参数指南以下参数可以传递给 arun() 方法。它们根据主要使用上下文和功能组织。核心参数 python await crawler.arun( url="https://example.com", # 必填：要爬取的 URL verbose=Tru

学习

2024-11-11

AsyncWebCrawler 类介绍

AsyncWebCrawler 类介绍 AsyncWebCrawler 类是进行网络爬取操作的主要接口。它提供了异步网络爬取功能以及广泛的配置选项。构造函数参数浏览器设置 browser_type (str, 可选): 默认值为 "chromium"。可选值包括 "chromium"、"fire

学习

2024-11-11

MaXiaoTiao

最新文章

大模型训练的核心要点

大模型训练的本质

Json 格式数据导入与导出

PlayWright——身份验证

Crawl4AI 提取策略：JSON CSS、LLM 和 余弦相似度

arun() 方法的完整参数指南

AsyncWebCrawler 类介绍

Crawl4AI 提取策略：JSON CSS、LLM 和余弦相似度