包括描述、URL、图像、类型、站点名称等 اوپن گراف 字段
包括卡片、URL、标题、描述、图像的 Twitter اوپن گراف 字段
批量上传或修改重定向
更新 robots.txt 文件
同样重要的是确保在更新特定属性(例如h1)时,其他元素不受影响(即页面标题或任何导航菜单)۔
确定优先页面
网站迁移的最大挑战之一是成功在很大程 whatsapp 数据库 度上取决于迁移页面的数量和质量。因此,确保关注真正重要的页面非常重要。这些页面会为旧网站带来流量,会积累链接,会转化率会较高的页面等等。
为此您需要:
抓取旧版站点。
识别所有可索引的页面。
找出表现最佳的页面。
如何抓取遗留站点。
抓取旧网站,以便您拥有所有 URL、页面 如何为远程销售人员制定完美的销售薪酬计划 标题、元数据、标题、重定向、断开的链接等的副本。无论爬虫程序的首选请求是什么(参见附录),请确保爬取不会过于严格。在爬取旧版网站之前,请密切关注爬取工具的设置,并考虑是否需要:
忽略 如果关键部分被意外阻止
跟踪内部“nofollow”链接(以便爬虫能够到达更多页面)
抓取所有子域(取决于范围)
在起始文件夹外抓取(取决于范围)
将用户代理更改为 Google Bot(桌面)
将用户代理更改为 Google Bot(智能手机)。
专业提示:在迁移完成后的几个月内 购买电子邮件列表 保留旧网站的抓取数据副本(在文件中或云中),以防新网站上线后需要任何旧网站数据。
如何识别可索引的页面
爬取完成后,开始识别旧站点的索引页面。这些 HTML 页面具有以下特点:
返回 200 服务器响应。
要么没有规范标签,要么存在自引用的规范 URL。
Meta robots 不是 noindex。
未被排除在 robots.txt 文件中。
内部链接到其他页面
可索引页面是唯一有可能为网站带来流量的页面,因此需要优先考虑网站迁移目的。这些页面值得优化(如果它们存在于新网站上)或重定向(如果它们不存在于新网站上)。
如何识别高性能页面
一旦确定了所有可索引页面,您可能需要做更多的工作,特别是当旧网站包含大量页面,并且由于时间、资源或技术限制而无法优化或重定向所有页面时。
如果是这样,您应该确定旧版网站的高性能页面。这将有助于在后期关注页面优先级。
建议创建一个包含以下字段的电子表格: