如何将内容从Wayback Machine(archive.org)传输到Wordpress?

张贴者: 2019-12-04

通过使用“提取结构化内容”选项,您可以轻松地从Web存档上的站点和任何其他站点创建Wordpress博客。为此,首先找到源站点,然后在“还原网站”或“下载网站”工具中选中“提取结构化内容”选项。输入您的选项(电子邮件,时间戳等),然后开始下载。


网站下载过程完成后,系统会将其部署到我们的服务器并开始提取内容。在创建文章存档时,我们的解析器仅考虑有意义的内容(不包括重复的文章,控件和服务页面),仅保留格式已保存的文章准备导入您的网站。完成文章提取过程后,您将收到一封确认信,将其打开并下载内容-“文章(.zip)”按钮。


zip归档文件包含各种格式的提取内容,从中选择扩展名为.wxr的文件。在您的Wordpress网站上开始导入内容-(在Wordpress的管理面板中-工具-导入-Wordpress-开始导入)。


如果提取的内容中包含一些图像,则指向它们的链接将包含在文章文件中。要将它们导入到您的Wordpress网站,您需要使用我们的Archivarix外部图像导入器插件。在插件选项卡“下载设置”中,可以将参数“开始下载”设置为“立即”。这意味着在导入带有文章的文件时,插件将立即将所有外部图像下载到Wordpress媒体库。如果您有很多图像,则可以使用后台导入-在同一选项卡中,选择“放入队列”,然后单击“运行后台处理”按钮。一段时间后,所有可用的媒体文件都会导入到您的站点。

仅在发布到来源的链接时,才允许使用文章材料: https://zh.archivarix.com/blog/convert-archiveorg-to-wordpress/

1 Archivarix如何工作?

Archivarix系统旨在下载和还原不再可从Web存档访问的站点以及当前在线的站点。这是与其余“下载器”和“站点解析器”的主要区别。 Archivarix的目标不仅是下载,而且还以一种可在您的服务器上访问的形式恢复网站。

让我们从从Web Archive下载网站的模块开始。这些是位于加利福尼亚的虚拟服务器。选择它们的位置是为了获得与Web存档本身最大的连接速度,因为它的服务器位于旧金山。在…

4 月 返回
2 如何将内容从Wayback Machine(archive.org)传输到Wordpress?

通过使用“提取结构化内容”选项,您可以轻松地从Web存档上的站点和任何其他站点创建Wordpress博客。为此,首先找到源站点,然后在“还原网站”或“下载网站”工具中选中“提取结构化内容”选项。输入您的选项(电子邮件,时间戳等),然后开始下载。…

3 月 返回
3 简单紧凑的Archivarix CMS。 用于下载网站的平面文件CMS。

为了方便您编辑在我们系统中还原的网站,我们开发了一个仅包含一个小php文件的简单平面文件CMS。 尽管尺寸庞大,但此CMS是用于处理您的网站的功能强大且用途广泛的工具。 它提供了任何CMS的所有基本功能,以及网站管理员根据从Web存档还原的内容创建PBN的特殊功能。…

1 月 返回
4 Archivarix CMS中使用的正则表达式

本文介绍了用于搜索和替换使用Archivarix System还原的网站中的内容的正则表达式。 它们不是该系统独有的。 如果您知道PHP,Perl,Java或其他编程语言的正则表达式,那么您已经知道如何使用我们的搜索和替换。 如果没有,我们希望本文对您有所帮助。…

1 月 返回
最新消息:
2020.02.14
新星期五,新更新!
Archivarix CMS完成了许多新功能和有用功能:
-现在,在“搜索和替换”中,您可以按网址日期进行过滤。
-现在,单击按钮即可删除网站所有页面的外部链接。锚被保留。
-新参数ACMS_SAFE_MODE,该参数禁止更改Loader / CMS设置和加载自定义文件,也禁止导入以导入设置和自定义文件。
-现在可以将Loader和CMS的JSON设置文件下载到您的计算机,并从您计算机上的文件下载到CMS。因此,将设置转移到其他站点变得更加容易。
-创建自定义规则变得更加方便,您可以选择常用的模式。
-无需下载文件即可在文件管理器中创建新的自定义文件。
-主域的网址树始终排在第一位。
-如果您隐藏域/子域的网址树,则在使用CMS时会保存此设置。
-打开/折叠网址树,而不是两个按钮,现在可以同时执行这两个操作。
-简化了创建新URL的操作,并且在创建时可以立即从计算机中指定文件。
-在移动版式中,主要工作部分位于第一位。
-每次操作文件后,其大小都会在数据库中更新。
-修复了选择性历史回滚的按钮。
-修复了为域名中包含数字的子域创建新的url的问题。
2020.02.07
更新的新部分!
现在无需更改文件源代码中的任何内容。
-现在,您可以通过从Archivarix CMS仅将一个脚本上载到服务器来将站点上载到服务器。
-为了更改CMS设置中的某些内容,您不再需要打开其源代码。您可以直接从“设置”部分设置密码或下限。
-为了连接您的计数器,跟踪器,自定义脚本,.content.xxxxxx文件夹中现在使用了一个单独的“ includes”文件夹。您还可以直接通过CMS中的新文件管理器上传自定义文件。向站点的所有页面添加计数器和分析也变得方便和易于理解。
-导入支持带有设置和“ includes”文件夹的新文件结构。
-添加了用于在代码编辑器中工作的键盘快捷键。

新版本中的这些以及许多其他改进。加载程序也已更新,并且可以使用CMS创建的设置。
2020.01.23
Archivarix CMS的另一项重大更新!

添加了非常有用的工具,允许单击按钮:
-清理所有损坏的内部链接,
-删除丢失的图像,
-为所有外部链接设置rel =“ nofollow”。

现在,可以直接从CMS本身导入其他恢复。您可以将不同的恢复合并到一个工作站点中。

对于那些使用大型站点或使用较差托管的用户,以前可以在托管超时时停止的所有操作现在都将分为几部分,并自动继续直到完成。是否要用50万个文件的代码替换?导入几个千兆字节的恢复?所有这一切现在都可以在任何甚至非常便宜的主机上进行。可以在ACMS_TIMEOUT参数中更改超时时间(默认为30秒)。

现在,无论构建参数如何,我们的加载器(index.php)均可在http和https协议上运行。您可以通过更改ARCHIVARIX_PROTOCOL参数的值来强制使用协议。
2020.01.07
带有新功能的Archivarix CMS的下一次更新。现在,只需单击一个按钮,任何旧站点都可以正确转换为UTF-8。搜索过滤变得更好,因为现在,可以按MIME类型过滤结果。
2019.12.20
我们已经发布了期待已久的Archivarix CMS更新。在新版本中,除了各种改进和优化之外,还添加了一个非常有用的功能,用于对搜索结果进行额外的过滤,并完全支持URL的树结构以进行大量文件的恢复。可以在Archivarix CMS脚本的更改日志中找到更多详细信息。