如何将内容从Wayback Machine(archive.org)传输到Wordpress?

张贴者: 2019-12-04

通过使用“提取结构化内容”选项,您可以轻松地从Web存档上的站点和任何其他站点创建Wordpress博客。为此,首先找到源站点,然后在“还原网站”或“下载网站”工具中选中“提取结构化内容”选项。输入您的选项(电子邮件,时间戳等),然后开始下载。


网站下载过程完成后,系统会将其部署到我们的服务器并开始提取内容。在创建文章存档时,我们的解析器仅考虑有意义的内容(不包括重复的文章,控件和服务页面),仅保留格式已保存的文章准备导入您的网站。完成文章提取过程后,您将收到一封确认信,将其打开并下载内容-“文章(.zip)”按钮。


zip归档文件包含各种格式的提取内容,从中选择扩展名为.wxr的文件。在您的Wordpress网站上开始导入内容-(在Wordpress的管理面板中-工具-导入-Wordpress-开始导入)。


如果提取的内容中包含一些图像,则指向它们的链接将包含在文章文件中。要将它们导入到您的Wordpress网站,您需要使用我们的Archivarix外部图像导入器插件。在插件选项卡“下载设置”中,可以将参数“开始下载”设置为“立即”。这意味着在导入带有文章的文件时,插件将立即将所有外部图像下载到Wordpress媒体库。如果您有很多图像,则可以使用后台导入-在同一选项卡中,选择“放入队列”,然后单击“运行后台处理”按钮。一段时间后,所有可用的媒体文件都会导入到您的站点。

仅在发布到来源的链接时,才允许使用文章材料: https://zh.archivarix.com/blog/convert-archiveorg-to-wordpress/

最新消息:
2019.01.07
带有新功能的Archivarix CMS的下一次更新。现在,只需单击一个按钮,任何旧站点都可以正确转换为UTF-8。搜索过滤变得更好,因为现在,可以按MIME类型过滤结果。
2019.12.20
我们已经发布了期待已久的Archivarix CMS更新。在新版本中,除了各种改进和优化之外,还添加了一个非常有用的功能,用于对搜索结果进行额外的过滤,并完全支持URL的树结构以进行大量文件的恢复。可以在Archivarix CMS脚本的更改日志中找到更多详细信息。
2019.11.27
我们的Archivarix外部图像导入器插件已发布,该插件从第三方网站(位于帖子和页面中的链接)将图像导入WordPress画廊。如果该图像当前不可用或已删除,则插件将从Web存档下载其副本。
2019.11.20
我们在站点上添加了一个新部分-Archivarix Blog 。在这里,您可以阅读有关我们系统操作以及从Archive.org恢复站点的有用信息。
2019.10.02
最近,我们的系统已更新,现在有两个新选项:-您可以下载Darknet .onion网站。只需在Domain字段中输入.onion网站的地址,我们的系统就会像常规网站一样从Tor网络下载它。 -内容提取器。 Archivarix不仅可以下载现有站点或从Web存档中恢复它们,还可以从中提取内容。在“高级设置”字段中,选择“提取结构化内容”。之后,您将收到整个站点的完整存档以及xml,csv,wxr和json格式的文章存档。创建文章存档时,我们的解析器仅考虑信息内容,不包括重复的文章,设计元素,菜单,广告和其他不良元素。