对于 Google Cloud 的新手来说,有机会利用免费积分。这是一种更便宜的方式,可以让您熟悉该平台,而无需立即做出财务承诺。我稍后会讨论定价和关键考虑因素,但请记住,BigQuery 和 Google Cloud 的成本很低。
将数据注入 BigQuery
先决条件
首先,您需要一个包含所有内部链接的 CSV。
您的文件至少应包含一列来源(内部链接的来源)和一列目标(链接指向的位置)。但是,如果可能的话,请添加锚点、状态代码和链接类型(例如图片、文本和 hreflang)的附加列,以丰富您的分析。
例如,我使用了我所在机构网站的数据。虽然这是一个拥有 1,678 个页面(包括重定向和错误页面)的小型网站,但考虑到 CSS、JavaScript、站点地图等,它包含 338,656 个链接。虽然在原始 Excel 表中可以管理,但应用自定义公式和过滤器可能会变得具有挑战性。
以下是我的 CSV 列:
-
类型:标识链接是否来自站点地图、hreflang、规范、简单超链接、图像、CSS 等。
-
来源:链接所在的页面。
-
目的地:指向目标页面。
-
Alt Text:如果链接是图像,则此列包含其 alt 属性文本。
-
锚点:目标的 HTTP 状态代码。
-
状态:目标的状态(例如,规范化、不可索引)。
-
关注:有助于确定链接是否影响 SEO。
-
链接位置:指示链接是在导航、头部、内容还是其他地方。确保工具设置准确。
-
链接来源:指定链接是仅存在于 HTML 中,还是 JavaScript 执行后呈现的 HTML 中。这有助于对富含 JavaScript 的网站进行故障排除。
文件准备好并且 Google Cloud 帐户设置好后,下一步做什么?
有两个选项:
1. 如果您的文件小于 100 MB,请直接通过 BigQuery 界面上传
2.对于较大的文件,请使用云存储。
虽然过程与第一个选项类似,但我将探索第二个选项(因为我的文件超过 100 MB)。
创建存储桶并加载 CSV
1. 返回云中心,点击左下角的“云存储”。
注意:您需要免费试用才能完成此步骤。否则, 比利时电报数据 您可以将 200 MB 文件拆分成两个,然后使用第一个选项将其导入两次。但是,此解决方案很耗时,而且效率不高。
2.在界面中,创建一个新的bucket。
3. 给它起一个简单的名字,例如,myagency-internal-links。
4. 选择一个地区(我选择比利时作为我的位置)。
5. 保留其他选项和公共访问设置不变。
6. 确认后,点击“上传文件”并 坚持创新和起亚顺voltz的创业力量 选择您的 CSV,上传您的 CSV 文件。
7.就是这样。
创建表
现在,让我们回到 BigQuery 来建立表。
1. 点击左上角的 Google Cloud 徽标,然后导航到页面左下角的 BigQuery。
2. 在 BigQuery 中,单击“+ 添加”,如下图所示。
3. 在新窗口中,选择“Google Cloud Storage”
4. 单击“云存储”后,您应该会在 (1) 中看到它。 丹麦电话线索 选择 CSV 格式 (3)。然后,单击中间行的“浏览”,转到您的存储桶,然后选择您的 CSV (2)。