MaXiaoTiao
Always like this.
Home
Archives
Categories
Label
Moments
Photos
Link
About
学习
默认分类
随笔
学习
生活
旅行
工作
大模型训练的核心要点
“既然大模型训练的过程就是其参数不断优化的过程,那到底应该怎么去优化这些参数呢?” 大模型训练的核心要点 既
学习
2024-11-21
大模型训练的本质
“ 大模型训练的本质,是一个参数不断优化的过程 ” 大模型训练的本质是通过大量的数据和计算资源,优化一个参数化
学习
2024-11-21
Json 格式数据导入与导出
1. json的数据格式 JSON 是用于存储和交换数据的语法。JSON (JavaScript Object Notation)最初是用 JavaScript 对象表示法编写的文本,但随后成为了一种常见格式,被包括Python在内的众多语言采用。 python里面的语言对象一般只有python能读
学习
2024-11-18
PlayWright——身份验证
PlayWright——身份验证 简介 Playwright 在称为 浏览器上下文 的隔离环境中执行测试。此隔离模型提高了可重复性和防止了级联测试失败。测试可以加载现有的已认证状态。这样就不需要在每个测试中都进行身份验证,从而加快了测试执行速度。
学习
2024-11-15
Crawl4AI 提取策略:JSON CSS、LLM 和 余弦相似度
Crawl4AI 提取策略:JSON CSS、LLM 和 余弦相似度 快速介绍 介绍用于结构化数据的 JSON CSS 提取策略、用于智能解析的 LLM 提取策略和用于聚类相似内容的余弦策略。演示如何使用 JSON CSS 从电子商务网站抓取产品详细信息。 以下是 LLM 提取策略视频的综合大纲,涵
学习
2024-11-11
arun() 方法的完整参数指南
arun() 方法的完整参数指南 以下参数可以传递给 arun() 方法。它们根据主要使用上下文和功能组织。 核心参数 python await crawler.arun( url="https://example.com", # 必填:要爬取的 URL verbose=Tru
学习
2024-11-11
AsyncWebCrawler 类介绍
AsyncWebCrawler 类介绍 AsyncWebCrawler 类是进行网络爬取操作的主要接口。它提供了异步网络爬取功能以及广泛的配置选项。 构造函数参数 浏览器设置 browser_type (str, 可选): 默认值为 "chromium"。可选值包括 "chromium"、"fire
学习
2024-11-11
Crawl4AI 使用 AsyncWebCrawler 进行 LLM 提取
Crawl4AI 使用 AsyncWebCrawler 进行 LLM 提取 Crawl4AI 的 AsyncWebCrawler 允许您使用语言模型(LLM)异步地从网页提取结构化数据或相关内容。以下两个示例展示了如何使用 AsyncWebCrawler 和 LLMExtractionStrateg
学习
2024-11-11
Crawl4AI 内容选择指南
Crawl4AI 内容选择指南 Crawl4AI 提供了多种方式来选择和过滤网页上的特定内容。学习如何精确地定位您需要的内容。 CSS 选择器 提取特定内容的最简单方式: # 使用 CSS 选择器提取特定内容 python result = await crawler.arun( url="
学习
2024-11-11
Crawl4AI 页面交互指南
Crawl4AI 页面交互指南 Crawl4AI 提供了强大的功能,用于与动态网页交互,处理 JavaScript 执行和管理页面事件。 JavaScript 执行 基本执行 # 单个 JavaScript 命令 python result = await crawler.arun( url
学习
2024-11-11
上一页
下一页