让文心一言扮演成ChatWPS，效果如何？（2023年3月）

目前的问题随时间推移，是可以改善的。

文 / 书航 2023.3.29

前几天，金山办公称在海外的 WPS 版本将会使用 GPT-4 的技术。作为国内对标微软 Office 的最主要产品，人们都预测它可能会（至少在国内）和百度的文心一言合作。

就此，他们对雷峰网说「正在和百度紧密沟通中，当然也会考虑和一些创业公司合作」。也就是说，WPS 已经确定在海外使用 GPT-4，而在国内这事还没有定。

不过，在 27 日的百度智能云活动上，文心一言在演示中已经可以植入 WPS，而且还可以嵌入另一款流行的在线文档——石墨里面。这次活动推出的文心大模型 API「文心千帆」（本文接下来会简称为「文心 API」）还演示了在金融、营销、旅游等其它细分领域的一些能力。

不谈目前还没有确定消息的官方植入，我们可以试着模拟一下让文心一言来做一些办公软件内会用到的 AI 辅助操作。

官方介绍，文心一言有「文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成」五大能力，而这些能力都可以有机结合到 Office 类办公软件最常见的三个场景中：文档、表格、幻灯片。

至少对 ChatGPT 而言，我们现在可以用严谨的自然语言，直接让它假装自己是一个尽职的 Office 插件，这就可以非常直观地看到 GPT 植入 Office 的效果。

文心能把这件事能做到什么程度呢？让我们结合「文心千帆」发布会上举的例子，用手头的测试版文心一言来试试吧。

（本文内的截图都用 AI 工具去除了水印。）

文心 Word

发布会上举出的一个案例是生成关于「长安逸达」车型的幻灯片。我们会在稍后讲到该案例。

这个演示说明文心 API 可以联网读取内容，不过我手头的文心一言不能联网。

下图我提供的网址是「长安逸达」车型的官网，我希望它写一篇关于该车型的介绍文案。但它给我返回的是来源不明的「长安欧尚A5」的介绍。

我想知道它是从哪里获取这些介绍信息的，它最后进入了编造模式。最后一张图说明，它肯定没有去看那个网址。

但是，即使它真的不知道，它试图给出的网址也都是官方的，或者相对正规的大型网站。我此前测试发现它不会贸然提供不知名的网站链接，包括在问到医疗相关的问题时，也会老实提供它认为最权威的信息。

此后我询问它的知识库更新到什么时候，它则拒绝回答。从实际情况看，它自己也不知道它到底学了些什么。

目前，我使用 GPT 类工具的方法主要有两种：

对于能联网的工具比如必应，我会打开页面或输入网址，让它读取这一资料之后再回答；
对于不能联网的工具比如 ChatGPT，我会逐字录入内容，让它整理，整理一段也就学习了一段。都录入完毕，再回答。

对于能联网的工具比如必应，我会打开页面或输入网址，让它读取这一资料之后再回答；

对于不能联网的工具比如 ChatGPT，我会逐字录入内容，让它整理，整理一段也就学习了一段。都录入完毕，再回答。

所以之后的测试中，我都是先录入材料，以尽量避免它提供给我不准确的内容。

接下来的两个任务也是文字编辑的常用场景。不涉及联网内容时，文心一言完成得非常不错。

一是生成一份合同模板。

在文心一言里我生成了两次，结果大同小异。

二是生成活动邀请函。

我用了稍微不一样的 prompt，文心一言的完成度还要比演示稍微高一点。

值得注意的是，在结合上下文之后，它可以代入角色来生成适合角色的内容。下面这个问题，我本来没预期它会继续以上一篇「百度智能云」的身份说话。

上面生成的内容，我都节选不同段落的文字扔进搜索，做了简单的查重，结果是它们并不是直接摘抄自网络上的文本，至少变换了一种方式来说。

文心 Excel

数据和表格对数字的准确性有非常高的要求。为确保它不用什么奇怪的数据源，我需要预先给它一些资料。

文心一言的输入框有 1024 字符的限制，所以我提供的材料也必须很短。我找到的最简单、最基本的一段材料就是百度的财报。

在现场演示中，文心 API 首先给指定材料做了摘要。注意看营收数据有个错，把 331 亿元写成了 1331 亿元。

不过接下来让它写投资建议书时，它好像又把错误的数字改过来了。

在这一部分，我给出的任务是将百度财报的关键数据提取出来，并导出一份 Excel 表格。需要注意的是，这个任务是 ChatGPT（3.5，下同）可以轻松胜任的。

首先，我没有提供材料，直接询问百度 2022 年财报的主要信息，它可能学习了一些，但具体数字不完全准确。

然后，我把一篇文章贴给它，让它基于文本总结重要信息。它基本上把带数字的部分都总结出来了。

但当我让它基于上述信息再次抽象为表格时，它出错了。

此后我换了一种方式提问，得到的结果更有趣了：

在另一次测试中，它开始遗漏一些内容。无论我如何变换 prompt 都无法得到令人满意的结果。

我：请根据下列材料，将百度2022年第四季度及全年财报的主要信息列出为一个表格。你可以自己决定表格中应该包含哪些内容。（重贴一遍上文）

文心一言：

我：你可能混淆了2022年第四季度的数据，以及2022年全年的数据。请重新生成一次，并将第四季度数据和全年数据分开列表。

文心一言：（重新生成了一次跟上面一模一样的表格）

我回到上一次提问，让它把结果生成 Excel 可以读取的 CSV 文件。它照做了，但没有写在代码框里，而是直接在浏览器里渲染出来了。当然，我也无法复制粘贴并保存这个文件。

同样的任务在 ChatGPT 里结果是这样的，也是我预想的输出结果。

在这一部分，文心一言的缺陷非常明显，以目前测试的版本看，不能投入实际使用。或许针对行业训练的特定版本可能会突出改善这方面的表现。

文心 PPT

前一阵子，国内有个开发商做了个 PowerPoint 插件「ChatPPT」，原型的目的是根据输入框的一句指令从头生成一整个演示文档。它是可以跑起来的，但具体执行和微调方面似乎不太聪明。等到微软官宣了 Microsoft 365 Copilot，至少在演示中，效果是直接碾压的。根据必应 GPT 演示和实际的对比看，微软自家的自动做 PPT 效果应该也跟演示的区别不大，这波属于「官方逼死同人」。

这是前文提到的由 prompt 及外部网页信息相结合而生成 PPT 的一个演示。可以看到这时文心 API 可以做到自动优化排版，且寻找的模板和配图都有较强的相关性。