AI绘画里的“脏兮兮”到底是咋回事?唠唠噪点弥散那点事儿

mysmile 16 0

哎,不知道你玩AI绘画的时候,有没有碰到过这种让人抓狂的情况:明明网上人家发的提示词(Prompt),你是一个字不差地抄下来了,参数也调得大差不差,结果你生成出来的图,就跟蒙了一层磨砂玻璃似的,或者细节地方糊得跟浆糊一样,更有甚者,人物脸上跟下雪似的全是小白点。这时候你心里头肯定在骂娘,这破AI是不是针对我?

其实吧,这事儿还真不赖你,也不是AI故意偷懒。这背后藏着一个特别基础但又老被人忽略的概念,咱们今天就好生掰扯掰扯,用咱老百姓的大白话,把这个“ai噪点弥散”给唠明白了。

首先你得明白,现在的AI画图,不管是国外的Midjourney还是咱常用的Stable Diffusion,它们干活的方式,跟咱们人类画家完全两个路子。人类画画是从一张白纸开始,一笔一笔往上加东西。AI相反,它一开始面对的是一张糊满了随机像素的图,学名叫“噪声”-1。这玩意儿长啥样?就像老式电视机没信号时那个雪花屏,密密麻麻全是黑白点。AI要干的事儿,就是从这个啥也不是的雪花图里头,一点一点把乱七八糟的燥点给收拾干净,最后变出一只猫、一个美女或者一片风景。这个过程里头,燥点的变化和消除,就是咱们说的“ai噪点弥散”。

为了让你更好理解,咱举个不太恰当但贼拉形象的例子。你包过饺子没?尤其是那种白菜猪肉馅的,刚拌好的馅儿,白菜是白菜,肉是肉,清清爽爽。但你要是倒上酱油、香油,再拿筷子使劲那么一搅和,馅儿就“弥散”开了,各种味道混在一起,分不清谁是谁。AI加噪点的过程,就像是使劲搅和这碗馅儿,直到搅和成一锅糊涂粥,啥也看不清。而AI画画的本事,就是把这锅糊涂粥,再给你变回一盘盘馅儿分明、个个饱满的大饺子-1。厉害吧?但问题就出在这个“变回来”的步骤上。

我滴个乖乖,这个“变回来”的过程,技术含量可太高了。搞研究的那些大神们,给AI设计了一个叫“采样器”的东西,指挥它该怎么一步一步去掉噪点。但这里头有个坑,很多新手甚至老手都没注意到的坑——就是那个“ai噪点弥散”的步子和节奏没踩对。

你看啊,就像刚才说的搅饺子馅,你要想把味道分开,那得按照一个特别精密的顺序来。AI也一样。有研究人员发现,很多常见的AI模型,在训练的时候,最后一步的噪点其实没加够,也就是说,留给AI的那个初始“雪花图”,还不够纯粹,里头还藏着一丢丢原图的影子-8。这就好比你要教一个学生从一堆废墟里复原一个花瓶,但你给他的废墟里头,其实藏着半个完整的花瓶,这学生学了半天,其实学的是怎么把半个花瓶拼好。可等你考试的时候,你给他一堆真正的碎渣子,他就彻底傻眼了,拼出来的东西要么是灰蒙蒙的,要么颜色不对,使劲一调参数,图片又亮得跟曝光过度似的-8

这就是为啥你有时候写提示词,明明写了“纯黑色的背景”,结果出来的是深灰色;写了“雪白的墙壁”,结果出来的是米黄色。根源就在这!那个“ai噪点弥散”的源头就没整对,模型被带沟里去了。

咱们普通玩家碰到这种情况咋整?总不能再训练一个模型吧?别急,山人自有妙计。除了等那些技术大神修复底层的噪点调度问题,咱们在操作的时候也能留个心眼。

比如,你得学会跟那个“采样器”搞好关系。市面上常见的采样器,什么Euler、DPM++、DDIM,它们的脾气秉性完全不一样-2-4。有些性子急,三下五除二就把噪点给抹了,出的图可能比较平滑,但也可能丢失细节,看起来有股子塑料味儿;有些性子慢,走一步看三步,出来的图细节丰富,纹理清晰,但也可能因为步子太碎,把一些小噪点给保留下来了,导致画面显脏。你要生成那种光影复杂、纹理多的图,就得用DPM++这种慢性子,让它把噪点弥散的过程做得精致些;你要生成那种简单的概念草图,用个Euler a就挺快,还能带点随机的惊喜-4

说到这儿,我还想起一个事儿。最近看新闻,苹果公司跟大学里搞研究的那帮人,琢磨出了一个叫“DarkDiff”的新技术-10。这玩意儿干啥用的?就是专门治咱们刚才说的那种“脏兮兮”的毛病,尤其是在伸手不见五指的黑夜里拍照。以前的手机,晚上一拍照片,为了掩盖那些密密麻麻的噪点,算法就直接给你来个暴力磨皮,结果照片糊得跟油画一样,细节全没了-10。苹果这个新技术牛就牛在,它不是在照片拍完之后再去修修补补,而是在相机处理原始数据的半道上,就直接用AI去干预那个“噪点弥散”的过程,从根儿上就把噪点给理顺了,让该有的细节留下来,不该有的燥点滚蛋-10。这就像包饺子的时候,不是等饺子煮烂了再去捞饺子皮,而是在调馅儿的时候,就把水分控干了,让饺子皮更有韧性,煮出来自然就晶莹剔透,一个破皮儿的都没有。

所以说啊,玩AI这事儿,不管是画图还是修图,归根结底是在跟“噪点”打交道,是在学习怎么控制这个“弥散”的过程。你越理解它,就越能容忍它的那些小脾气。下次再看到图崩了、糊了、出燥点了,别光顾着骂显卡,不妨停下来琢磨琢磨,是不是这个“弥散”的哪一步没整明白。搞不好,你调调参数,给它换个节奏,它就能还你一个惊喜。

真的,看着一张纯粹的雪花图,在手里慢慢变出心中所想的样子,那种感觉,比拆盲盒得隐藏款还得劲儿。你也快去试试吧,说不定下次出图,那感觉就贼拉顺溜了。