James
James 书航,航通社创始人

请注意随手保存你看到的网页

请注意随手保存你看到的网页

百度搜索的网页快照功能下线了。

文/书航 2022.7.31

这是一个很随意的更新,本社最近几个月都没有正经更新过(接了几个广告)。

近几天陆续有人发现,百度搜索的网页快照功能下线了。意思是说,

  • 在以往搜索结果右侧的「快照」链接消失了;
  • 百度百科词条引用的外部链接如有快照的,也无法访问;
  • 直接输入已有的快照地址(以 cache.baiducontent.com 开头)打不开。

同样下线快照的还有搜狗搜索,头条搜索从一开始就没有。必应以国内 IP 访问时,点击快照链接只会看到一条错误提示。

截至目前 360 搜索尚可使用快照,不过我们可能要做好它也消失掉的心理准备。

网页快照并不推荐用作给网页留一个历史存档,因为它只会保存距离此刻最近的一次抓取内容,而丢弃前面的内容。所以如果页面并非 404 而是有后续更新,那么过段时间前面的内容版本会被顶掉。如果该网站不存在了,例如域名被收回无法访问,则快照的入口也会随之消失。

但快照功能对于被直接删除的页面来说仍然是有用的。举两个例子:

2021 年 1 月 4 日,当时拼多多的知乎官方账号发了一条带有情绪的回答,回应员工加班猝死一事。这条帖子仅存在了一小会儿(28 秒),但有人反映已经可以用百度快照看到这条存在过的痕迹。

2022 年 4 月 19 日,《扬子晚报》网站发布其记者的报道《小诗〈非必要离校〉戳中无数人内心的柔软,与作者朱皓月对谈》,此后该报道及各平台转载均陆续被清除,但百度快照则一直可看,直到近几天为止。

如果目的是希望保存某个页面在不同历史时期的版本,且哪怕是不再存在的网站,那么网页快照本来也不是最佳的解决方案。在快照功能暂时国内不可用之际,可以考虑通过互联网档案馆「时光机」的浏览器插件,随手保存你所看到的一些页面。

在安装好以后,进入任意页面点右键菜单,可以看到 4 个选项:「现在保存本页」,或者回看「最旧的版本」「最新的版本」以及「所有版本」。这个保存动作完全免费,互联网档案馆会负责爬取和存储的所有成本。

互联网档案馆曾做过的一些事情,包括给维基百科(Wikipedia)引用的页面在其变动或 404 时提供快照;以及在 Flickr 削减免费存储空间、Tumblr 下线大量内容、图片社区 500px 被付费图片库收购等关键时刻,备份它们尽可能多的即将消失的内容。

虽然互联网档案馆本身也是一个中心化的存储机构,但短时间内我们不用担心它被什么神秘力量炸掉,也许是能找到的最好的替代方案了。

ps 请自行解决访问文中有些服务时遇到的困难。

评论系统由 Disqus 驱动