AI神笔:Nano Banana Pro,一切所想皆可入画(1)

2025.11.20,Google 的 Nano Banana Pro发布(以下简称 Banana),被网友认为是AI生图的王者!
王珏老师专门找到了国内的网站(省得翻墙了,网址见后),充了点值(每天只有一次免费机会),针对一些典型的教育场景,进行了多轮测试,结果确实惊为天人:
  • Banana的可控性(指令遵循能力)极强——无论你的提示词有多么复杂,它都能够准确理解你的意图,并完美地生成图片!
也就是说,它可以根据我们的要求,画出极为复杂的图像!
(访问Banana的网址见本文最后)
以下是王珏老师的测试情况。
一、《江雪》诗画
以柳宗元“江雪”,让Banana画一幅画,简单的提示词:画一幅唐诗:千山鸟飞绝,万径人踪灭,孤舟蓑笠翁,独钓寒江雪。中国古代山水画。
Banana输出如下:
AI神笔:Nano Banana Pro,一切所想皆可入画(1)
这其实已经相当厉害了!不过,当我用腾讯元宝针对这首诗撰写了详细的提示词后:

整体构图与视角



  • 构图:采用中国画经典的“
    上留天,下留地”的构图法。远景是连绵的雪山,中景是辽阔的江面,近景是孤舟与渔翁。整体呈现出一种由近及远的深远空间感。


  • 视角:采用略带俯视的视角,仿佛观画者正站在江边的高处远眺,更能感受到天地的广阔与人的渺小。

画面元素详细描述1. 远景:千山鸟飞绝



  • 形态:远处是连绵起伏的
    雪山,山形简练、朦胧,只用淡墨勾勒出轮廓,仿佛笼罩在一片雪雾之中。山峰顶部留白,表现出积雪覆盖的效果。


  • 氛围:不见任何飞鸟的踪迹,天空中也无日月,一片空濛,突出“绝”与“灭”的寂静感。

2. 中景:万径人踪灭



  • 江面
    江面占据画面大部分空间,大面积留白或用极淡的墨色渲染,表现出江水冰寒和平静的感觉。水天几乎一色,界限模糊,增强苍茫感。


  • 岸边:江岸被厚厚的积雪覆盖,隐约可见一两条被雪淹没的“小径”(“径”),但完全看不到任何人的足迹或生命的迹象。可画几株枯木寒林,枝叶凋零,挂着残雪。

3. 近景/画眼:孤舟蓑笠翁



  • 孤舟:一叶简陋的
    扁舟,静静地漂在江心。船体用稍重一点的墨线勾勒,船头堆积着少许白雪。


  • 渔翁(核心):舟上坐着一位披着
    蓑衣、戴着
    斗笠的老渔翁。他是整幅画唯一的人物,也是画面的视觉焦点。


    • 姿态:他
      微微蜷缩着身体,背对着或侧对着观者,脸部和表情模糊,重点突出其专注垂钓的
      姿态,而非具体相貌。这种处理能引发观者共鸣,使其成为一种精神符号。


    • 鱼竿:手中握着一根细长的钓竿,钓线垂入冰冷的江水中。


  • 细节:周围可略微波澜,或用极淡的墨点表现纷纷扬扬的
    雪花仍在飘落,点明“寒江雪”的主题。

艺术风格与技法建议



  • 风格
    中国传统水墨写意山水画。重在表达意境,而非精细写实。


  • 用墨:以
    黑白灰为主色调,通过墨色的浓、淡、干、湿来表现层次。


    • 浓墨:用于勾勒近处的船、渔翁和钓竿。


    • 淡墨:大量用于渲染远山、江面和天空。


    • 飞白:在表现山石肌理或水流时可用“飞白”笔法,增加画面的苍劲感。


  • 留白:大胆运用
    留白来表现积雪、天空和江面的空灵之感。这是中国画意境营造的关键。


  • 色彩:可完全不用色彩,保持水墨的纯粹。若想稍加点缀,可在天空或江水处染以极淡的
    花青
    赭石,营造更寒冷的氛围。

总结性画面描述(供绘画时参考)

一幅纵幅的水墨画:上方是淡墨渲染的朦胧远山,下方是留白构成的寒江。江心一叶扁舟,舟上有一蓑笠渔翁正躬身垂钓。画面大量留白,表现出雪覆千山、万籁俱寂的冰冷世界,唯有钓线轻垂,于极致静谧中透出孤高与坚韧的生命力。
Banana的输出更加完美:
AI神笔:Nano Banana Pro,一切所想皆可入画(1)应该说,Banana完全遵循了对画面的复杂指令!
我也用国内极为出色的即梦AI试了试,相同的提示词,即梦输出的效果也相当不错:
AI神笔:Nano Banana Pro,一切所想皆可入画(1)
不过,就画面的意境、一些细节的处理来说,似乎Banana还是更胜一筹?
二、端午文化宣传海报
我先手搓了一版简单提示词:我要为宣传一下中华传统文化,请帮创作一张”端午节宣传“的大幅海报,需要包含端午文化中的主要元素,包括但不限于:来由、粽子、龙舟、以及优秀的端午诗歌等,应做到图文并茂,既有生动有趣典型的图像,又配有相应的文字进行简要描述,便于大家学习。
Banana生成如下:
AI神笔:Nano Banana Pro,一切所想皆可入画(1)
同样的提示词,即梦AI生成如下:
AI神笔:Nano Banana Pro,一切所想皆可入画(1)
即梦和Banana的差异肉眼可见,Banana远远胜出!
在上例的基础上,我又改为以“端午诗歌”为主题,让腾讯元宝扩写了一版非常详细的提示词:

1. 报头 (顶部醒目位置)主标题:诗韵端午设计:采用毛笔行书字体,墨色淋漓。可在笔画间加入龙舟船桨的水纹或粽子形状的墨点作为装饰。副标题:—— 一曲离骚咏千年,舟行万里寄相思设计:较小字号,置于主标题下方。背景:报头底部衬以淡淡的龙舟竞渡或山水画卷的剪影。2. 左栏:诗魂千古 (聚焦屈原与经典诗歌)栏目标题:诗魂千古核心内容:屈原画像:一幅古典线描风格的屈原仰天沉吟画像,衣袂飘飘。《离骚》经典名句:“长太息以掩涕兮,哀民生之多艰。”“路漫漫其修远兮,吾将上下而求索。”【简要解读】:这两句诗集中体现了屈原深沉的爱国情怀和追求理想、九死不悔的执着精神,成为中华民族精神的重要组成部分。张耒《和端午》:“竞渡深悲千载冤,忠魂一去讵能还。国亡身殒今何有,只留离骚在世间。”【简要解读】:这首诗直接点出了端午节龙舟竞渡的由来是为了纪念屈原的“千载冤屈”,表达了后世对屈原忠魂的深切怀念。3. 中栏:诗中的端午意象 (图文并茂解析)栏目标题:诗中的端午意象核心内容:采用“图+文”卡片式设计。意象一:龙舟竞渡插图:一幅简洁有力的龙舟插画,船员们奋力划桨。配诗:“鼓声三下红旗开,两龙跃出浮水来。”(刘禹锡《竞渡曲》)文字:龙舟竞渡象征着团结协作、奋勇争先的民族精神。意象二:粽香艾草插图:一串精巧的粽子和一束艾草菖蒲。配诗:“粽包分两髻,艾束著危冠。”(陆游《乙卯重五诗》)文字:粽子是美味的寄托,艾草菖蒲则代表了驱邪避疫、祈求健康的美好愿望。意象三:五彩长命缕插图:编织精美的五彩丝线手环。配诗:“五彩丝长系臂,宜男萱草绿。”(佚名)文字:五彩丝线,又称长命缕,寓意祈福纳吉,保佑孩童平安健康。5. 报尾 (底部)标题:端午溯源内容:一段简洁的总结性文字。端午节,又称端阳节、龙舟节,日期在每年农历五月初五。它起源于先民的龙图腾祭祀,后与纪念屈原等历史人物相结合,形成了赛龙舟、吃粽子、挂艾草等丰富多彩的习俗。2009年,端午节被列入联合国教科文组织《人类非物质文化遗产代表作名录》,成为举世瞩目的文化瑰宝。设计小贴士字体:标题用书法体,正文用宋体或楷体,确保清晰易读。留白:适当留白,避免画面过于拥挤,保持呼吸感。边框:可使用竹节纹、祥云纹等作为栏与栏之间的分隔线。

以上这么复杂的提示词,Banana的表现仍然非常出色:
AI神笔:Nano Banana Pro,一切所想皆可入画(1)
对于同样的提示词,即梦AI表现得总体上也不错,不过却存在不少“非字”的字,如下图中箭头所示:
AI神笔:Nano Banana Pro,一切所想皆可入画(1)
“非字之字”,是AI生图中对文字处理的老问题了。当字少的时候,即梦的表现不错,当字很多时,看样子即梦的表现还是差一些)
三、圆明园全景图
海报中的元素虽然多,但相比一些宏大的画作来说,还是小巫见大巫的。
为了进一步测试Banana的能力,王珏老师又测试了一下“圆明园全景图”,先是最简单的提示词:复原万园之园”圆明园“的全貌,要求尽量符合历史真实
Banana表现如下:
AI神笔:Nano Banana Pro,一切所想皆可入画(1)
宏观的景色倒也有点像(山、水、格局等),不过建筑风格就完全不对了(更不要说具体的建筑了)。
所以,提示词对Banana的影响还是很大的!
于是,王珏老师又让元宝写了一版非常详细的提示词(1500字左右):

圆明园全景图详细描述一、 宏观布局与意境这是一幅鸟瞰视角下的“万园之园”。整座园林并非整齐划一,而是依山就水,宛若天成。总体格局:园林由三个核心部分组成,如同三颗璀璨的明珠镶嵌在广阔的山水之间。圆明园(本园):位于西侧,是最大、最核心的部分,布局自由灵活,由无数个小园林景区组成,通过蜿蜒的水系和连绵的丘陵分隔与串联。长春园:位于东北侧,规划更为规整,拥有壮丽的水景和著名的西洋楼景区。绮春园:位于东南侧,由多个小型园林合并而成,景色更显秀丽婉约。山水骨架:水是园林的灵魂。福海如一面巨大的明镜居于东方,大小湖泊、河道如血脉般纵横交错,将全园贯通。山是园林的风骨。连绵起伏的土山不仅划分了空间,也构成了步移景异的观赏线,山上林木葱郁,四季色彩变幻。整体意境:这幅全景图展现的是一种“虽由人作,宛自天开”的最高造园境界。既有皇家宫苑的恢弘气派,又充满了江南水乡的诗情画意与田园牧歌的闲适情趣。二、 建筑风格与类型圆明园的建筑是集大成者,融合了多种风格:中式古典建筑(主流):皇家宫殿式:采用等级最高的官式建筑,黄琉璃瓦歇山顶,红色立柱,金龙和玺彩画,显得富丽堂皇,如“正大光明”殿。江南园林式:大量运用白墙灰瓦、栗色门窗,造型轻巧玲珑,如“上下天光”、“曲院风荷”。田园村舍式:模仿农舍、草堂,用茅草、竹材等天然材料,营造返璞归真的意境,如“杏花春馆”。西洋建筑(点睛之笔):位于长春园北部,风格为巴洛克式,大量使用汉白玉石柱、精美的雕刻、拱券和玻璃窗,但在细节上融入了中式元素(如琉璃瓦装饰),形成独特的“中西合璧”风格。三、 主要建筑群的外形与材质描述在您的画作中,可以重点刻画以下几组标志性建筑:1. 宫廷区 – “正大光明”殿建筑群位置:圆明园南部,入园后的核心区域。外形与材质:这是皇家的“金銮殿”。建筑群规整、对称、等级森严。主殿“正大光明”殿坐北朝南,建在高大的汉白玉台基上。殿身是厚重的砖木结构,红色立柱支撑着巨大的屋顶,屋顶覆盖着明亮的黄色琉璃瓦,在阳光下熠熠生辉。屋檐下是色彩斑斓的金龙彩画。殿前有宽阔的广场和精美的铜香炉。2. 核心景观 – “九州清晏”景区位置:圆明园中部,环绕后湖的九座岛屿。外形与材质:这是皇帝和后妃的居住区,也是全景的构图中心。九座小岛如同华夏“九州”,环抱一片开阔湖水。建筑错落有致地分布在岛上,通过小桥相连。这里是中式园林的精华,可见:歇山顶、攒尖顶等各式屋顶,覆盖着黄、绿、蓝、黑各色琉璃瓦,交织成华丽的乐章。建筑材质以木材(红柱、棕褐色门窗) 和砖石为主,与周围的垂柳、桃花相映成趣。3. 西洋楼景区 – “大水法”喷泉群位置:长春园最北端,在一片中式园林中显得格外独特。外形与材质:这里是石材的殿堂。主体建筑由巨大的汉白石砌成,充满了华丽的雕刻花纹、拱形门窗和曲线造型。核心景观“大水法”是一个大型喷泉,主体是数个巨大的石龛,门前有狮子头喷水,前方还有“猎狗逐鹿”的喷水雕塑群。旁边的“观水法”是皇帝观赏喷泉的宝座台,同样由汉白玉雕砌而成,气势不凡。4. 地标性建筑 – “海岳开襟”位置:长春园的一个大湖中心。外形与材质:这是一座建于圆形石基上的双层楼阁,犹如仙境琼楼。汉白玉的基座和栏杆使其纯净圣洁,主体建筑色彩绚丽,黄瓦红柱,在碧水蓝天的映衬下,倒影尤为壮观。四、 画面细节与氛围建议植被:山上松柏常青,水边垂柳依依,庭院内种植海棠、玉兰、牡丹等四季花卉。人物与活动:可在湖面点缀几艘精致的画舫游船,道路上出现太监、宫女的微小身影,为园林增添生机。光影与季节:建议描绘春夏之交的晴朗日子,阳光明媚,水面波光粼粼,建筑光影分明,更能体现其鼎盛时期的辉煌。总结提示:在构图时,请注意近大远小的透视关系,前景的建筑(如宫廷区)可以刻画得更精细,中景的“九州清晏”是视觉焦点,远景的福海和西洋楼景区则可处理得朦胧一些,以增强画面的空间感和层次感。

Banana的作品,完全遵循了上述提示词的要求,只能说是叹为观止!大家可以将文字和下面的图详细对照一下:
AI神笔:Nano Banana Pro,一切所想皆可入画(1)
相比之下,即梦连1500字的提示词都放不下(最多只支持800字),我删为800字后,最后的效果基本没法看:
AI神笔:Nano Banana Pro,一切所想皆可入画(1)
四、大模型工作机制图
看来,Banana的绘图能力已经无比强大了!那么,各种科研绘图能力如何呢?
我以大模型的工作机制图为例,先手搓了一个简单的提示词(意在测试Banana的深度思考的能力:以LLM大模型工作机制(包括但不限于:深度神经网络、Transformer、token化、训练过程、微调过程等),制作一个完整的信息结构图
结果如下:
AI神笔:Nano Banana Pro,一切所想皆可入画(1)
虽然大的框架上差不多,图画得很漂亮,但很多细节都没有,而且有些细节还不大准确。
于是,我用腾讯元宝生成了一段LLM工作机制图的描述:

大模型(LLM)工作机制信息架构描述第一层:宏观工作流程

这是一个分阶段的线性流程,展示了从用户输入到模型输出的完整路径。
  1. 1.

    输入 (Input)


    • 内容:用户提供的文本(问题、指令、上下文等)。


    • 形态:人类可读的自然语言。
  2. 2.

    分词与编码 (Tokenization & Encoding)


    • 过程:将输入文本拆分成模型能理解的较小单元(Token,可以是词、子词或字符)。


    • 转换:将每个Token转化为对应的数字标识符(Token ID)。


    • 输出:一串代表输入文本的数字序列。
  3. 3.

    模型推理 (Model Inference) – 核心处理层


    • 嵌入层 (Embedding Layer):将每个Token ID转换为一个高维向量,捕获其语义信息。


    • Transformer块 (Transformer Blocks):数据流经多个(N个)相同的Transformer块。每个块包含:


    • 自注意力机制 (Self-Attention Mechanism):计算每个Token与序列中所有其他Token的关联权重,从而理解上下文关系。


    • 前馈神经网络 (Feed-Forward Network):对每个Token的表示进行非线性变换,增加模型的表达能力。


    • 残差连接与层归一化 (Residual Connections & Layer Normalization):确保训练稳定,缓解梯度消失问题。


    • 位置:数字序列被送入已训练好的大模型核心。


    • 核心架构:基于
      Transformer架构


    • 关键机制


    • 输出:经过所有层处理后,为序列中的
      下一个位置生成一个概率分布,表示每个可能出现的Token的概率。
  4. 4.

    解码与输出生成 (Decoding & Output Generation)


    • 常用策略:贪婪采样、束搜索、核采样等,用于平衡输出的准确性和多样性。


    • 过程:根据上一步生成的概率分布,选择一个Token作为输出。


    • 循环:将新生成的Token添加回输入序列,重复步骤3(模型推理),预测下一个Token,形成“自回归”生成。


    • 终止:循环直到生成一个特殊的
      结束符或达到长度限制。
  5. 5.

    输出 (Output)


    • 内容:模型生成的完整文本序列。


    • 形态:人类可读的自然语言。

第二层:模型能力来源(训练阶段)

宏观流程中的“已训练好的模型”是通过以下两个关键阶段获得的。


  • 1. 预训练 (Pre-Training)


    • 目标:让模型学习通用的语言规律、知识和推理能力。


    • 方法:在海量无标注文本数据上,使用“自监督学习”完成核心任务,如
      下一个词预测


    • 结果:得到一个具备通用能力的
      基座模型


  • 2. 微调 (Fine-Tuning) – 可选但关键


    • 指令微调:训练模型更好地理解和遵循人类指令。


    • 人类反馈强化学习:利用人类偏好数据优化模型的输出质量,使其更有用、真实、无害。


    • 目标:使基座模型更适应特定任务或风格(如对话、代码生成)。


    • 方法:使用特定任务的高质量标注数据,对预训练好的模型参数进行进一步的训练。


    • 重要技术

图表设计建议

您可以基于以上描述,绘制一幅层次清晰的架构图:


  • 主流程线:从左到右展示
    输入 -> 分词/编码 -> 模型推理 -> 解码/生成 -> 输出


  • 展开“模型推理”模块:将其绘制为一个包含
    N x Transformer Block的堆叠结构,并在旁边注解每个Block的核心组件(自注意力、前馈网络等)。


  • 区分“训练”与“推理”:可以用虚线框或不同颜色区域将“预训练”和“微调”阶段与主推理流程区分开,表明它们是模型上线前的准备阶段。


  • 使用图标:用数据库图标表示“海量训练数据”,用齿轮图标表示“微调过程”,用大脑或网络图标表示“Transformer架构”,以增加可视性

再让Banana生成,就相当准确了:AI神笔:Nano Banana Pro,一切所想皆可入画(1)

看来,Banana擅长于绘图,但它并不擅长于对你的指令进行详细分析和拆解!我们需要给Banana非常详细的指令(可以借助于其它大模型),才能得到比较符合我们心意的作品。
五、课题或项目申报书中的“技术路线图/信息结构图”
既然Banana能画工作机制图,那么它能否画课题或项目申报书中的“信息结构图”或“技术路线图”呢?
已经有很多人问过我这个问题了。在Banana之前,我的回答是:一个都没有!
因为,AI只会画“画”——就像梵高,它可以画出向日葵,但却不能表达出申报书中那么多元素之间的复杂框图!
但,Banana的出现,似乎使这件事出现了曙光,于是,我也勇敢地尝试了一下。
当然,想必大家都想到了:直接把申报书中的一大段文字发给Banana,它肯定画不出我们想要的东东!
所以,我们还是也有请元宝,把申报书中的相关文字,提炼、加工为“技术路线图”或“信息结构图”)的详细描述。由于字数太多了,我只摘录一小部分供大家参考:

信息结构图设计规范1. 图的整体层次结构

该信息结构图应包含以下四个主要层次,从上至下,从抽象到具体:
  1. 1.

    目标层 (根节点):最顶层,代表项目的总体目标。
  2. 2.

    模块层 (一级节点):由总体目标直接分解出的四大核心模块。
  3. 3.

    功能/组件层 (二级节点):每个核心模块下属的关键组成部分、核心技术路径或主要功能。
  4. 4.

    元素/实现层 (叶子节点):最底层,描述具体的实现手段、技术细节、数据内容或交付物。

2. 各层次框图的表达方式

为了清晰区分不同层次的元素,建议使用不同形状的框图:


  • 目标层 (根节点):使用
    【圆角矩形】,表示一个概括性的概念或目标。


    • 示例框图:[ 计量经济学“智小思”智能教学体 ]


  • 模块层 (一级节点):使用
    【矩形】,表示系统的主要组成部分。


    • 示例框图:[ 知识图谱与智能答疑模块 ]


  • 功能/组件层 (二级节点):使用
    【扁平的六边形】,表示模块内部的关键功能或技术组件。


    • 示例框图:[ 构建知识图谱 ]


  • 元素/实现层 (叶子节点):使用
    【椭圆形】,表示具体的操作、数据、技术或产出。


    • 示例框图:( 命名实体识别 )
    • ………………………………
然后,把这个描述扔给Banana,让它输出“技术路线图”或“信息结构图”,输出的结果如下:
AI神笔:Nano Banana Pro,一切所想皆可入画(1)
最后要说明的是:Banana和其它多模态大模型一样,你每次让它重新执行,都会得到一个全新的版本:
AI神笔:Nano Banana Pro,一切所想皆可入画(1)
AI神笔:Nano Banana Pro,一切所想皆可入画(1)
粗看上去,Banana设计得有模有样,不过有两点:
1、每次生成的版本都不大一样,而且似乎都还有点道理——换句话来说,每个版本都有缺失的逻辑。
2、Banana生成的是一张“纯图片”,而且无法生成svg格式(这种格式似乎可以编辑),所以生成的图基本难以修改,作个参考还可以。
因此,即便Banana如此强大,真正要发挥作用、尤其是在专业领域,还是需要“HI+AI”的共同协作呀!
最后,是王珏老师使用的国内Banana网址:imini.com,然后选:Banana Pro即可:
AI神笔:Nano Banana Pro,一切所想皆可入画(1)
该网站的其它工具也很棒(比如AI Video中可以用Sora2),感兴趣的老师都可以试试——在不缺银子的情况下
AI神笔:Nano Banana Pro,一切所想皆可入画(1)
AI神笔:Nano Banana Pro,一切所想皆可入画(1)
【下篇预告】Banana不仅能画非常复杂的“画”、画技术路线图,还能将理工科知识“入画”,用生动形象的方式极大地帮助学生理解,欢迎持续关注本公众号!)
© 版权声明

相关文章