AI PPT:一部完整编年史
从只写教程不动手,到可编辑的PPTX文件,这三年我们经历了什么 文 / 书航 2026.5.12 三年前社长近距离接触了文心一言初代产品的发布会,见证了一开始没人相信百度是真的,直到它开放测试权限,股价从跌到涨的戏剧性过山车过程。 当时,文心一言及其企业级产品将做PPT视为核心生产力内容。只不过,第一版文心一言做PPT的时候,它只吐了个大纲,就蹲下了。 社长写这个AI PPT的评测稿子的时候,因为找到新工作,就存在草稿箱里没发出来,没想到这一存,就是三年。 这三年,社长是一点重新动它的心思也没有,因为后来的工作里很少用到PPT及对外汇报。就如同大家感受的一样,对大多数人,AI最大的用途是编程,写作文章/文档,以及生成图片或视频。 近几天,还是因为手搓了一个帮自己码字的Skill,社长才终于有勇气面对积压的选题,重新回顾AI PPT这个领域。 三年后,百度终究靠着文库及GenFlow把AI PPT这个品类做到了月活破亿。用大模型做PPT这事如今至少有5-6个流派,Kimi、ChatGPT、智谱等都可以直接给你生成.pptx格式的文件。 所以说,现在做PPT,真的不用自己动手了吗? 2023年4月:文心一言只吐了个大纲 2023年3月底,社长拿到文心一言的邀请测试资格。那会儿金山办公刚宣布海外版WPS要接GPT-4,国内版传闻可能跟百度合作,百度也在3月27日的智能云活动上,演示了文心千帆API生成PPT的能力,以及文心一言植入WPS和石墨文档。 社长好奇这种“中国版Copilot”到底行不行,就直接上手,让它模拟办公助手,在文档、表格、幻灯片三个场景跑了一遍。 (具体的内容请参考公众号“航通社”今天随本文一同推送的第二篇文章:《让文心一言扮演成ChatWPS,效果如何?(2023年3月)》) 文字部分还不错。让它起草合同模板、活动邀请函,甚至指定用“百度智能云”口吻写,结构完整、语气得体,连续几次生成结果自然流畅,查重后确认没直接抄。如果只是日常文案起草,它当时就够用了。 表格就完全露怯了。社长拿百度自己的2022年财报当材料,让它提取关键数字、整理成表。它一会儿混淆季度和全年数据,一会儿直接重复上一轮的错误,怎么调提示词都没用。同一任务扔给ChatGPT 3.5,对方干净利落吐出准确表格,差距大到让人有点尴尬。 PPT任务更说明问题。发布会里文心千帆API能根据“长安逸达”车型信息自动排版配图,看起来很炫,但那是API版,可以联网。社长手上的测试版不能联网,只能让它输出“手动操作步骤”来模拟。文心一言顶多给个大纲,每页放什么内容、怎么布局,统统没有。 换成GPT-4,它也是一样只能输出手动操作步骤,不过相对更细致,能描述每页的版式、内容分配、插入图片的位置,接近实际可执行了。 社长当时的判断是,文心一言确实是一个真的大语言模型,架构没问题,语料和训练量拖了后腿,属于“思而不学则殆”的状态。发布会里那些行业定制版的截图似乎效果好不少,社长当时想,如果这些能力尽快回流到通用版,文心完全有可能后来居上。 那时候最乐观的预测也没想到,三年后人们解决这个问题的方式跟当时预期的完全不同,包括超出了百度自己的预期。 模板、代码和Agent各有各的走法 当前AI制作演示文稿发展出了三条不同的技术路线。 一是基于PPT格式及模板,让大模型填充内容匹配预置模板的路线,采用旧式低代码结合盘活AI时代之前的海量模板库资源,可靠性高。AiPPT.cn、Slidesgo、WPS AI都属于此类。...