資訊文章
供應(yīng)信息
企業(yè)大全
網(wǎng)站技術(shù)
品牌大全
招商商機(jī)
展會(huì)展覽
有問(wèn)有答
資源下載

推廣 熱搜： APP 品牌深圳APP外包公司中國(guó) 發(fā)展吉三代智能出口產(chǎn)業(yè) 手機(jī)

愛(ài)因斯坦霉霉同框只需15秒！最新可控AI一玩停不下來(lái)

日期：2023-03-24 來(lái)源：快科技作者：白交瀏覽：47 違規(guī)舉報(bào)

現(xiàn)在,，AI繪畫完全可以做到指哪打哪了！

這邊哈士奇,，那邊牧羊犬,，背景在下雪天。

啪嘰,！一幅畫就這么完成了,。

愛(ài)因斯坦霉霉同框只需15秒！最新可控AI一玩停不下來(lái)

這個(gè)最新MultiDiffusion模型,，不管選的區(qū)域位置有多離譜,，它都能給你畫出指定的東西來(lái)。

比如,，你能看到大象和奶牛同時(shí)握草,？？

愛(ài)因斯坦霉霉同框只需15秒,！最新可控AI一玩停不下來(lái)

而且在線可試,，親測(cè)大概15秒就能出，你甚至可以看到泰勒與愛(ài)因斯坦跨時(shí)空同框,。

愛(ài)因斯坦霉霉同框只需15秒,！最新可控AI一玩停不下來(lái)

要知道以前AI繪畫最大的一個(gè)bug就是不可控，但現(xiàn)在人類擁有了更多的控制權(quán),。

總之就是,，想畫什么就畫什么，想往哪畫就往哪畫,！

有網(wǎng)友趕緊上手試了試：Not Bad,！

愛(ài)因斯坦霉霉同框只需15秒！最新可控AI一玩停不下來(lái)

想往哪畫就往哪畫

從效果來(lái)看,，主要有三個(gè)方面的應(yīng)用,。

文本到高分辨率全景生成；

精確區(qū)域生成,；

任意長(zhǎng)寬比粗略區(qū)域生成,。

首先，只需要一句話,，就可以生成512*4609分辨率的全景圖,。

一張有滑雪者的雪山頂峰的照片。

愛(ài)因斯坦霉霉同框只需15秒,！最新可控AI一玩停不下來(lái)

攝影師也不用爬樓了,，直接獲得城市夜景圖。

愛(ài)因斯坦霉霉同框只需15秒！最新可控AI一玩停不下來(lái)

當(dāng)然更為主體功能,，那就是給特定區(qū)域單獨(dú)提示,，然后AI繪畫就來(lái)指哪畫哪。

比如在黑色部分是一個(gè)明亮的盥洗室,，紅色區(qū)域是一面鏡子,、藍(lán)色部分是花瓶、黃色部分是白色的水槽,。

愛(ài)因斯坦霉霉同框只需15秒,！最新可控AI一玩停不下來(lái)

就這么隨手一個(gè)拼圖畫，結(jié)果就生成了真實(shí)場(chǎng)景,。

愛(ài)因斯坦霉霉同框只需15秒,！最新可控AI一玩停不下來(lái)

不過(guò)也有一些bug，像一些超現(xiàn)實(shí)的,，他就有點(diǎn)太天馬行空了,。

比如三體人在宇宙中大戰(zhàn)人類。

愛(ài)因斯坦霉霉同框只需15秒,！最新可控AI一玩停不下來(lái)

當(dāng)然也可以無(wú)需那么精確,，只需標(biāo)個(gè)大致位置，還支持任意長(zhǎng)寬比的圖像,。

愛(ài)因斯坦霉霉同框只需15秒,！最新可控AI一玩停不下來(lái)

藍(lán)色部分是埃菲爾鐵塔、紅色是粉色的云,、綠色是熱氣球。

愛(ài)因斯坦霉霉同框只需15秒,！最新可控AI一玩停不下來(lái)

關(guān)鍵是各種構(gòu)圖都十分地合理,、場(chǎng)景效果以及實(shí)際物體相對(duì)大小也都十分精準(zhǔn)。

圖像生成可控

背后的這個(gè)模型叫做MultiDiffusion,，這是一個(gè)統(tǒng)一的框架,，能實(shí)現(xiàn)多功能和可控的圖像生成。

以往即便Diffusion模型給圖像生成帶來(lái)變革性影響,，但用戶對(duì)生成圖像的可控性,、以對(duì)新任務(wù)的快速適應(yīng)仍是不小的挑戰(zhàn)。

研究人員主要是通過(guò)重新訓(xùn)練,、微調(diào),，或者另外開(kāi)發(fā)工具等方式來(lái)解決。前不久爆火插件ControlNet正是解決了圖像生成的可控性,，

而MultiDiffusion無(wú)需進(jìn)一步訓(xùn)練或微調(diào),，就可一次實(shí)現(xiàn)對(duì)生成內(nèi)容的多種靈活控制，包括期望的長(zhǎng)寬比、空間引導(dǎo)信號(hào)等,。

愛(ài)因斯坦霉霉同框只需15秒,！最新可控AI一玩停不下來(lái)

簡(jiǎn)單來(lái)說(shuō)，MultiDiffusion的關(guān)鍵在于,，在預(yù)先訓(xùn)練好的擴(kuò)散模型上定義一個(gè)全新的生成過(guò)程,。從噪聲圖像開(kāi)始，在每個(gè)生成步驟中,，解決一個(gè)優(yōu)化任務(wù),。

然后再將多個(gè)擴(kuò)散生成過(guò)程與一組共享的參數(shù)或約束結(jié)合起來(lái)，目標(biāo)是將每個(gè)部分都盡可能去接近去噪版本,。

愛(ài)因斯坦霉霉同框只需15秒,！最新可控AI一玩停不下來(lái)

即便有時(shí)候每個(gè)步驟都可能會(huì)將圖像拉向不同的方向，但最終融合到一個(gè)全局去噪步驟當(dāng)中,，得到一個(gè)無(wú)縫圖像,。

愛(ài)因斯坦霉霉同框只需15秒！最新可控AI一玩停不下來(lái)

來(lái)自魏茨曼科學(xué)研究所

這篇論文主要來(lái)自位于以色列雷霍沃特的魏茨曼科學(xué)研究所,。

愛(ài)因斯坦霉霉同框只需15秒,！最新可控AI一玩停不下來(lái)

兩位共同一作Omer Bar-Tal、Lior Yariv分別是魏茲曼科學(xué)研究院計(jì)算機(jī)科學(xué)和應(yīng)用數(shù)學(xué)系的研究生和博士生,，后兩位分別是他們的導(dǎo)師,。

愛(ài)因斯坦霉霉同框只需15秒！最新可控AI一玩停不下來(lái)

△左：Omer Bar-Tal,；右：Lior Yariv

好了,，感興趣的旁友可戳下方試一試哦！

https://huggingface.co/spaces/weizmannscience/MultiDiffusion

主頁(yè)鏈接：https://multidiffusion.github.io/

論文鏈接：https://arxiv.org/abs/2302.08113

文章出處：量子位

免責(zé)聲明：
1,、本站所收集的部分公開(kāi)資料來(lái)源于互聯(lián)網(wǎng),，轉(zhuǎn)載的目的在于傳遞更多信息及用于網(wǎng)絡(luò)分享，并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),，也不構(gòu)成任何其他建議,。
2、本站部分作品內(nèi)容是由網(wǎng)友自主投稿和發(fā)布,、編輯整理上傳,，對(duì)此類內(nèi)容本站僅提供交流平臺(tái)，不為其版權(quán)負(fù)責(zé),，更不為其觀點(diǎn)承擔(dān)任何責(zé)任,。
3、因行業(yè)及專業(yè)性有限,，故未能核驗(yàn)會(huì)員發(fā)布內(nèi)容的真實(shí)性及有效性,，不為其負(fù)責(zé),，如有虛假或違規(guī)內(nèi)容敬請(qǐng)準(zhǔn)備材料圖片發(fā)郵件到info@n#舉報(bào)，本站核實(shí)后積極配合刪除,。
4,、如果您發(fā)現(xiàn)網(wǎng)站上有侵犯您的知識(shí)產(chǎn)權(quán)的作品，請(qǐng)與我們?nèi)〉寐?lián)系,，我們會(huì)及時(shí)處理或刪除,。

標(biāo)簽： 模型長(zhǎng)寬比位置藍(lán)色紅色愛(ài)因斯坦

更多>同類資訊文章

0 條相關(guān)評(píng)論

推薦圖文

第八屆中國(guó)國(guó)際管道會(huì)	全國(guó)三八紅旗手｜張
追求卓越· 邁向第一	年薪超47萬(wàn) 15年不用
汽車配件生意怎么做（	武漢一女子懷孕后遭公
賽凡回應(yīng)《流浪地球2	百度：文心一言發(fā)布首

推薦資訊文章

• 00后用DeepSeek日賣3.3億元”,？	• AI聚合平臺(tái) Cherry Studio 超詳細(xì)介紹
• 最具顛覆性技術(shù) 馬斯克再次警告：AI有可能給人	• 李想稱自己微博是理想Mind GPT大模型生成：擅長(zhǎng)
• 7000多個(gè)小組說(shuō)關(guān)就關(guān) 美國(guó)貼吧的用戶這次徹底	• 印度也要自研AI技術(shù) OpenAI直接潑冰水：完全沒(méi)
• ChatGPT大更新,！API新增殺手級(jí)能力還降價(jià)：新模	• 三天漲超20%！富士康最新發(fā)聲今年已漲150%
• 自研千億參數(shù),！360智腦獲工信部信通院認(rèn)證：國(guó)	• 大模型三大能力超越ChatGPT 千億AI巨頭科大訊飛