长文章“一图读懂”类信息图,如何一次出图并去幻觉

文 / 书航 2025.11.26
由于香蕉2对超长中文文本的生成把控非常好,不再生成伪汉字,因此为一次性出图创造了条件。但是,对于较长的信息内容,如果指代不明,仍可能会编造事实或者出图不符合预期。
本次工作的实际任务是给定一篇稿件,按照稿件内容生成“一图读懂”。在实操过程发生了两种问题:
直接将文章作为附件或者贴入提示词,会生成失败。
根据文章意思概括提示词,不附带原文。如果有哪个地方没有说清楚,就会发生意料之外的情况。
之前网上给出的案例基本是调用模型原本的世界知识,以one-shot生成信息图,如“生成图片说明咖啡机的工作原理”。


在接到任务后,我首先让AI出提示词方案,并经过记者选择合适的方案(在5个方案中选择了方案1和3)。


但当我将原文附件及提示词方案合并,选择“图像生成”模式并要求出图后,一直转圈却没有结果。

一小时后我回来刷新页面,发现根本就没成功。

所以在Gemini官方版本中,选择“图像生成”模式时是不应该叠加附件的。
与此同时,直接用方案文本作为提示词生成则可以出图。
Prompt:
帮我做一个信息图表,图片格式,要求是竖版,能确保信息素不丢失,宁愿图更长一点:(下接方案文本内容)
帮我做一个信息图表,图片格式,要求是竖版,能确保信息素不丢失,宁愿图更长一点:
(下接方案文本内容)
但随之而来的问题是,提示词过于简略,导致“自由发挥”的部分会出问题。

例如,这个局部的武汉、西安、郑州的取舍就出现了和正文描述不同的偏差,这是因为提示词没有详细说明这一部分。
解决方法:另开一个对话,拖入原文及上述提示词,要求:
请结合附件文章及现有提示词为nano banana设计出长图的完整提示词,因为它无法读取附件,也不能用太长的提示词文本,但我担心直接使用现有提示词会丢失文中数据,或者导致不准确。请注意:只出提示词,不出图片(下接刚才的Prompt)
请结合附件文章及现有提示词为nano banana设计出长图的完整提示词,因为它无法读取附件,也不能用太长的提示词文本,但我担心直接使用现有提示词会丢失文中数据,或者导致不准确。请注意:只出提示词,不出图片
(下接刚才的Prompt)
然后Gemini3输出了新的,经过事实核查并说明更丰富细节的提示词。

让Nano Banana 2新做一下就完全正常了,一次成功。

(成品图。水印及logo为后期添加)

接着下一个图,我发现它换了一个新的风格,因此我又提示它:
请把(图2名字)的画面风格,与上面(图1名字)相统一,其余数字等不变,输出一个新的提示词。
请把(图2名字)的画面风格,与上面(图1名字)相统一,其余数字等不变,输出一个新的提示词。
此时风格就和刚做的第一张图相统一。在记者对比后,最终选择图1作为本文的最终版配图。
去水印方法也说一下:
Nano Banana 作图在右下角有一个四芒星的水印,用去水印工具直接处理原图会识别不到水印。
建议将原图右下角截取一小段,去水印后升幅画质,直接在Windows自带的画图里面就可以拼合。

总结:
对于长文章,首先用Gemini 3阅读原文给出几个方案。
让Gemini 3根据你选择的方案,再次阅读原文,事实核查图片以及确保数字、事实等已经被明确框定。
用这个提示词去作图。
如果有系列图片,需要让Gemini 3指定跟系列图片的第一张图的提示词采用同样的风格,它就会给你完成风格对齐。