搭建屬于你自己的中文AI作畫(huà)師

標(biāo)簽: 手機(jī)軟件 官網(wǎng):https://stablediffusionweb.com/
《Stable Diffusion AI中文(機(jī)畫(huà)師)》是Stability AI開(kāi)源的一個(gè)text-to-image的擴(kuò)散模型,旨在激發(fā)人類(lèi)的潛能,提供了多種工具和模型,讓用戶(hù)可以利用AI技術(shù)創(chuàng)造新穎和獨(dú)特的設(shè)計(jì)、音樂(lè)、視頻、文本等內(nèi)容,完成專(zhuān)屬于自身的內(nèi)容創(chuàng)作,并向所有公眾用戶(hù)展現(xiàn)!
Stable Diffusion AI中文是由CompVis、Stability AI和LAION共同開(kāi)發(fā)的一個(gè)文本轉(zhuǎn)圖像模型,通過(guò)LAION-5B子集大量的512x512圖文模型進(jìn)行訓(xùn)練。只要輸入一段簡(jiǎn)單的文本,Stable Diffusion就可以快速將其轉(zhuǎn)換為圖像,也可以導(dǎo)入圖像或者視頻,配合文本對(duì)其進(jìn)行處理。
目前,Stable Diffusion代碼開(kāi)源了,已經(jīng)在Hugging Face上線(xiàn),無(wú)需擁有強(qiáng)大的硬件,也沒(méi)有復(fù)雜的本地安裝,只需輸入你想要的文字內(nèi)容(僅支持英文),就可以在線(xiàn)一鍵生成AI圖像。

1、Stable Diffusion是國(guó)外開(kāi)發(fā)的繪圖AI助手,讓AI幫助用戶(hù)快速繪圖
2、AI可以識(shí)別的繪畫(huà)風(fēng)格非常多,卡通的、寫(xiě)實(shí)的、油畫(huà)的都可以快速繪制
3、自動(dòng)完成繪圖上色,并且可以添加風(fēng)格效果,一分鐘內(nèi)完成高質(zhì)量繪圖作品
4、個(gè)人用戶(hù)可以通過(guò)AI快速繪圖,可以為自己設(shè)計(jì)草圖,方便后期自由優(yōu)化
5、Stable Diffusion提供的繪圖AI構(gòu)圖能力還是非常專(zhuān)業(yè)的,可以滿(mǎn)足大部分繪圖場(chǎng)景需求
6、無(wú)論是古典的繪圖作品還是現(xiàn)代風(fēng)格的繪圖作品都可以輕松完成
7、Stable Diffusion AI也可以對(duì)局部圖像內(nèi)容做簡(jiǎn)單的修改
8、無(wú)論是設(shè)計(jì)美術(shù)作品還是設(shè)計(jì)草圖、設(shè)計(jì)插畫(huà)、設(shè)計(jì)原畫(huà)都可以通過(guò)Stable Diffusion AI執(zhí)行
Midjourney對(duì)語(yǔ)句的訓(xùn)練更精準(zhǔn),圖片存留更友好;圖片跑出來(lái)后調(diào)整空間不大,只能通過(guò)墊圖繼續(xù)“精準(zhǔn)”一點(diǎn),建議ps會(huì)更快。
Stable Diffusion跑小圖會(huì)更快,目前一次最多可以跑出9張圖,墊圖的時(shí)候可以使用畫(huà)筆涂抹區(qū)域,更人性化;生成大圖很肉痛,并且圖片也略小。
這是一個(gè)通用的指南,內(nèi)容是基本通用的,可能有例外情況,請(qǐng)讀對(duì)應(yīng)的章節(jié)了解不同應(yīng)用的特性。
提示詞是提示而不是判定依據(jù),比如你輸入質(zhì)量判定詞匯的時(shí)候,其實(shí)是在限制數(shù)據(jù)的范圍,而不是 “要求” AI 出一張很好的圖片。
單詞標(biāo)簽#
對(duì)于在標(biāo)簽單詞上特化訓(xùn)練的模型,建議使用逗號(hào)隔開(kāi)的單詞作為提示詞。
普通常見(jiàn)的單詞,例如是可以在數(shù)據(jù)集來(lái)源站點(diǎn)找到的著名標(biāo)簽(比如 Danbooru)。單詞的風(fēng)格要和圖像的整體風(fēng)格搭配,否則會(huì)出現(xiàn)混雜的風(fēng)格或噪點(diǎn)。
避免出現(xiàn)拼寫(xiě)錯(cuò)誤。NLP 模型可能將拼寫(xiě)錯(cuò)誤的單詞拆分為字母處理。
自然語(yǔ)言#
對(duì)于在自然語(yǔ)言上特化訓(xùn)練的模型,建議使用描述物體的句子作為提示詞。
取決于訓(xùn)練時(shí)使用的數(shù)據(jù)集,可以使用英文,日文,特殊符號(hào)或一些中文。大多數(shù)情況下英文較為有效。
避免 with 之類(lèi)的連接詞或復(fù)雜的語(yǔ)法,大多數(shù)情況下 NLP 模型只會(huì)進(jìn)行最簡(jiǎn)單的處理。
避免使用重音符(如 é 和 è)和德語(yǔ) umlauts(如 ä 和 ö),它們可能無(wú)法被映射到正確的語(yǔ)義中。
不建議隨意套用現(xiàn)成模板,尤其是無(wú)法經(jīng)過(guò)人類(lèi)理解的模板。
Emoji#
Emoji (💰,💶,💷,💴,💵,🎊,🪅🪄,🎀,👩🚀) 表情符號(hào)也是可以使用并且 非常準(zhǔn)確 的。
Emoji 因?yàn)橹挥幸粋(gè)字符,所以在語(yǔ)義準(zhǔn)確度上表現(xiàn)良好。
Emoji 在構(gòu)圖上有影響,比如 💐☺️💐。
表情符號(hào)參考
顏文字#
對(duì)于使用 Danbooru 數(shù)據(jù)的模型來(lái)說(shuō),可以使用顏文字在一定程度上控制出圖的表情。
例如:
:-) 微笑 :-( 不悅 ;-) 使眼色 :-D 開(kāi)心 :-P 吐舌頭 :-C 很悲傷 :-O 驚訝 張大口 :-/ 懷疑
僅支持西方顏文字,詳細(xì)內(nèi)容請(qǐng)見(jiàn) Danbooru 顏文字部分 或 維基百科
空格#
逗號(hào)前后的少量空格并不影響實(shí)際效果。
開(kāi)頭和結(jié)尾的額外空格會(huì)被直接丟棄。詞與詞之間的額外空格也會(huì)被丟棄。
標(biāo)點(diǎn)符號(hào)#
用逗號(hào)、句號(hào)、甚至是空字符(\0)來(lái)分隔關(guān)鍵詞,可以提高圖像質(zhì)量。目前還不清楚哪種類(lèi)型的標(biāo)點(diǎn)符號(hào)或哪種組合效果最好。當(dāng)有疑問(wèn)時(shí),只要以一種使提示更容易被閱讀的方式來(lái)做。
對(duì)于部分模型,建議將下劃線(xiàn)(_)轉(zhuǎn)換為空格。
藝術(shù)風(fēng)格詞#
可以通過(guò)指定風(fēng)格關(guān)鍵詞來(lái)創(chuàng)作帶有特效或指定畫(huà)風(fēng)的圖片。
提示詞長(zhǎng)度#
避免過(guò)長(zhǎng)的提示詞。
提示詞放入的順序就是優(yōu)先級(jí)。由于提示詞的權(quán)重值從前向后遞減,放置在特別靠后的提示詞已經(jīng)對(duì)圖片的實(shí)際生成影響甚微。
不堆疊提示詞是一個(gè)好習(xí)慣,但是如果你確實(shí)有很多內(nèi)容要寫(xiě),可以適當(dāng)提高生成步數(shù),以便在生成過(guò)程中更好地利用提示詞。
SD-WebUI 突破最多 75 個(gè)詞組限制的方式是將每 20 + 55 個(gè)詞分為一組。選項(xiàng) Increase coherency by padding from the last comma within n tokens when using more than 75 tokens 讓程序試圖通過(guò)查找最后 N 個(gè)標(biāo)記中是否有最后一個(gè)逗號(hào)來(lái)緩解這種情況,如果有,則將所有經(jīng)過(guò)該逗號(hào)的內(nèi)容一起移動(dòng)到下一個(gè)集合中。該策略可適當(dāng)緩解提示詞過(guò)多無(wú)法處理的問(wèn)題,但可能破壞提示詞之間的權(quán)重關(guān)系。
除了 WebUI 對(duì)此情況進(jìn)行了特殊處理外,由于 GPT-3 模型限制,提示詞處理空間并不是無(wú)限的,大多在在 75-80 之間,75 字符后的內(nèi)容會(huì)被截?cái)唷?/p>
特異性#
問(wèn)題體現(xiàn)在語(yǔ)義偏移上。對(duì)于神經(jīng)網(wǎng)絡(luò)的訓(xùn)練來(lái)說(shuō),特征的質(zhì)量很重要:輸入和輸出之間的聯(lián)系越強(qiáng),神經(jīng)網(wǎng)絡(luò)就越容易學(xué)習(xí)這種聯(lián)系。
換句話(huà)說(shuō),如果一個(gè)關(guān)鍵詞有非常具體的含義,那么學(xué)習(xí)它與圖像之間的聯(lián)系要比一個(gè)關(guān)鍵詞有非常廣泛的含義容易得多。
這樣一來(lái),即使是像 "Zettai Ryouiki" 這樣很少使用的關(guān)鍵詞也能產(chǎn)生非常好的結(jié)果,因?yàn)樗辉诜浅>唧w的情況下使用。另一方面,"動(dòng)漫" 即使是一個(gè)比較常見(jiàn)的詞,也不會(huì)產(chǎn)生很好的結(jié)果,這可能是因?yàn)樗挥糜谠S多不同的情況,即使是沒(méi)有字面意思的動(dòng)漫。如果你想控制你的圖片的內(nèi)容,選擇具體的關(guān)鍵詞尤其重要。另外:你的措辭越不抽象越好。如果可能的話(huà),避免留下解釋空間的措辭,或需要 "理解" 不屬于圖像的東西。甚至像 "大" 或 "小" 這樣的概念也是有問(wèn)題的,因?yàn)樗鼈兣c物體離相機(jī)近或遠(yuǎn)是無(wú)法區(qū)分的。理想情況下,使用有很大可能逐字出現(xiàn)在你想要的圖像標(biāo)題上的措辭。
語(yǔ)義失衡#
每一個(gè)提示詞就像染料一樣,它們的 “親和性“ 不同,如果更常見(jiàn)的提示詞,比如 loli (和其他提示詞并列放置)的影響就大于其他提示詞。
比如,如果你想生成動(dòng)漫圖片,使用了 星空 startrail 標(biāo)簽,相比你期望出現(xiàn)的動(dòng)漫星空,會(huì)有更多來(lái)自真實(shí)照片的星空元素。
否定提示詞#
SD-WebUI 網(wǎng)頁(yè)應(yīng)用會(huì)在生成時(shí) 避免生成否定提示詞提及的內(nèi)容。
否定提示是一種使用 Stable-Diffusion 的方式,允許用戶(hù)指定他不想看到的內(nèi)容,而不對(duì)模型本身做額外的要求。
通過(guò)指定 unconditional_conditioning 參數(shù),在生成中采樣器會(huì)查看去噪后符合提示的圖像(城堡)和去噪后看起來(lái)符合負(fù)面提示的圖像(顆粒狀、霧狀)之間的差異,并嘗試將最終結(jié)果遠(yuǎn)離否定提示詞。
比如使用以下提示詞避免生成水印和文字內(nèi)容:
lowres, bad anatomy, bad hands, text, error, missing fingers,
extra digit, fewer digits, cropped, worst quality, low quality,
normal quality, jpeg artifacts, signature, watermark, username, blurry
還如這個(gè)例子:
ugly, fat, obese, chubby, (((deformed))), [blurry], bad anatomy,
disfigured, poorly drawn face, mutation, mutated, (extra_limb),
(ugly), (poorly drawn hands fingers), messy drawing, morbid,
mutilated, tranny, trans, trannsexual, [out of frame], (bad proportions),
(poorly drawn body), (poorly drawn legs), worst quality, low quality,
normal quality, text, censored, gown, latex, pencil
Stable Diffusion AI是當(dāng)下一款強(qiáng)大的AI圖片生成器。它不僅支持文本描述生成圖片,還能以圖生圖,利用各種模型得到AI繪畫(huà)作品,還能訓(xùn)練個(gè)人的圖片模型,為大家提供的是最新2.2版本的下載方式,很多老司機(jī)懂的功能也將回歸,歡迎各位來(lái)本站安裝詳細(xì)了解哦。
專(zhuān)業(yè)的游戲下載、綜合門(mén)戶(hù)網(wǎng)站
Copyright 2009-2016 www.jiufm22.cn 版權(quán)所有
鄂ICP備17018784號(hào)-1
熱門(mén)評(píng)論
最新評(píng)論
支持( 0 ) 蓋樓(回復(fù))