对于 AO,他们有一些 JSON,其中包含嵌入 HTML 中的产品数据。 HTML 格式的 AO 产品 JSON 此 JSON 位于每个产品页面上,因此我将使用 Screaming Frog 的自定义提取来提取所有内容: 尖叫青蛙自定义提取 我还提取了类别和子类别。AO 在 JSON 中包含此信息,但您也可以通过抓取面包屑来提取此信息。 以下是我用来从 JSON 中提取数据的正则表达式的示例: <[^>]*id=”product-json”[^>]*>[^<]*”sku”:\s*”([^”]*)”* 开始抓取,然后前往自定义提取选项卡并导出。您可能需要反复试验才能正确提取所需的数据。
如果您不是正则表达式专家
我建议使用 ChatGPT;如果您想要示例提示,这里是我的 ChatGPT SEO 资源提示中的一个。 ChatGPT 提示示例 对于本示例,我尚未完成网 印度尼西亚 WhatsApp 号码列表 站的完整抓取,但导出后,CSV 应如下所示。 导出的 CSV 文件示例 接下来,我可以使用 TEXTJOIN 公式以我想要的格式合并 SKU 和品牌名称,如下所示 – =(LOWER(TEXTJOIN(” “,TRUE,B6:C6))) 包含 AO 产品数据的 Excel 屏幕截图 然后,将关键字列复制并粘贴到关键字资源管理器中。 来自 Ahrefs 关键字浏览器的数据 我们现在拥有这些产品的关键字机会数据。TP(流量潜力)指标特别有用。它让我们了解总流量潜力,即使我们使用的品牌加产品代码组合不是搜索次数最多的查询。
这只是如何批量抓取有用数
据的示例。每个站点的方法都会有所不同,但过程是相同的。 有时,您可能只是抓取 H1,有时则抓取规格表。如果幸运的话,就像本示例中一样,将会有一些 JSON 包含您需 意大利 WhatsApp 号码列表 要的所有数据。 虽然我专注于本指南的产品页面,但我在博客上编写了另一个示例,用于使用类似的方法分析竞争对手的网站结构。如果您对出于 SEO 目的抓取数据感兴趣,那么这本书非常值得一读。 使用 Ahrefs 的站点资源管理器 如果无法抓取信息,您可以使用 Ahrefs 的站点资源管理器收集大型网站的数据。但是,这种方法可能不那么精确。