中文字幕亚洲欧美日韩在线不卡,亚洲欧美日产综合在线网性色,思思久久精品6一本打道,综合视频中文字幕

    <sub id="dxmnt"><ol id="dxmnt"></ol></sub>

      1. DeepMind谷歌研究員力薦:擴(kuò)散模型效率&生成質(zhì)量提升竅門

        更新時間:2022-06-04 18:41:42作者:佚名

        DeepMind谷歌研究員力薦:擴(kuò)散模型效率&生成質(zhì)量提升竅門

        新晉圖像生成王者擴(kuò)散模型,剛剛誕生沒多久。

        有關(guān)它的理論和實(shí)踐都還在“野蠻生長”。

        來自英偉達(dá)StyleGAN的原班作者們站了出來,嘗試給出了一些設(shè)計(jì)擴(kuò)散模型的竅門和準(zhǔn)則,結(jié)果模型的質(zhì)量和效率都有所改進(jìn),比如將現(xiàn)有ImageNet-64模型的FID分?jǐn)?shù)從2.07提高到接近SOTA的1.55分。


        他們這一工作成果迅速得到了業(yè)界大佬的認(rèn)同。

        DeepMind研究員就稱贊道:這篇論文簡直就是訓(xùn)練擴(kuò)散模型的人必看,妥妥的一座金礦。

        我們從以下幾個方面來看StyleGAN作者們對擴(kuò)散模型所做的三大貢獻(xiàn):

        用通用框架表示擴(kuò)散模型

        在這部分,作者的貢獻(xiàn)主要為從實(shí)踐的角度觀察模型背后的理論,重點(diǎn)關(guān)注出現(xiàn)在訓(xùn)練和采樣階段的“有形”對象和算法,更好地了解了組件是如何連接在一起的,以及它們在整個系統(tǒng)的設(shè)計(jì)中可以使用的自由度(degrees of freedom)。

        精華就是下面這張表:


        該表給出了在他們的框架中復(fù)現(xiàn)三種模型的確定變體的公式。

        (這三種方法(VP、VE、iDDPM+ DDIM)不僅被廣泛使用且實(shí)現(xiàn)了SOTA性能,還來自不同的理論基礎(chǔ)。)

        這些公式讓組件之間原則上沒有隱含的依賴關(guān)系,在合理范圍內(nèi)選擇任意單個公示都可以得出一個功能模型。

        隨機(jī)采樣和確定性采樣的改進(jìn)

        作者的第二組貢獻(xiàn)涉及擴(kuò)散模型合成圖像的采樣過程。

        他們確定了最佳的時間離散化(time discretization),對采樣過程應(yīng)用了更高階的Runge–Kutta方法,并在三個預(yù)訓(xùn)練模型上評估不同的方法,分析了隨機(jī)性在采樣過程中的有用性。

        結(jié)果在合成過程中所需的采樣步驟數(shù)量顯著減少,改進(jìn)的采樣器可以用作幾個廣泛使用的擴(kuò)散模型的直接替代品。

        先看確定性采樣。用到的三個測試模型還是上面的那三個,來自不同的理論框架和模型族。

        作者首先使用原始的采樣器(sampler)實(shí)現(xiàn)測量這些模型的基線結(jié)果,然后使用表1中的公式將這些采樣方法引入他們的統(tǒng)一框架,再進(jìn)行改進(jìn)。

        接著根據(jù)在50000張生成圖像和所有可用真實(shí)圖像之間計(jì)算的FID分?jǐn)?shù)來評估質(zhì)量。


        可以看到,原始的的確定性采樣器以藍(lán)色顯示,在他們的統(tǒng)一框架(橙色)中重新實(shí)現(xiàn)這些方法會產(chǎn)生類似或更好的結(jié)果。

        作者解釋,這些差異是由于原始實(shí)現(xiàn)中的某些疏忽,加上作者對離散噪聲級的處理更仔細(xì)造成的。

        確定性采樣好處雖然多,但與每一步都向圖像中注入新噪聲的隨機(jī)采樣相比,它輸出的圖像質(zhì)量確實(shí)更差。

        不過作者很好奇,假設(shè)ODE(常微分方程)和SDE(隨機(jī)微分方程)在理論上恢復(fù)相同的分布,隨機(jī)性的作用到底是什么?

        在此他們提出了一種新的隨機(jī)采樣器,它將現(xiàn)有的高階ODE積分器與添加和去除噪聲的顯式“Langevin-like ‘churn’”相結(jié)合。

        最終模型性能提升顯著,而且僅通過對采樣器的改進(jìn),就能夠讓ImageNet-64模型原來的FID分?jǐn)?shù)從2.07提高到1.55,接近SOTA水平。


        預(yù)處理和訓(xùn)練

        作者的第三組貢獻(xiàn)主要為分?jǐn)?shù)建模(score-modeling)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。

        這部分繼續(xù)依賴常用的網(wǎng)絡(luò)體系結(jié)構(gòu)(DDPM、NCSN),作者通過對擴(kuò)散模型設(shè)置中網(wǎng)絡(luò)的輸入、輸出和損失函數(shù)的預(yù)處理進(jìn)行了原則性分析,得出了改進(jìn)訓(xùn)練動態(tài)的最佳實(shí)踐。

        比如使用依賴于σ(noise level)的跳躍連接對神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)處理,使其能夠估計(jì)y(signal)或n(noise),或介于兩者之間的東西。

        下表具體展示了模型彩英不同訓(xùn)練配置得到的FID分?jǐn)?shù)。


        作者從基線訓(xùn)練配置開始,使用確定性采樣器(稱為配置A),重新調(diào)整了基本超參數(shù)(配置B),并通過移除最低分辨率層,并將最高分辨率層的容量加倍來提高模型的表達(dá)能力(配置C)。

        然后用預(yù)處理(配置D)替換原來的{cin,cout,cnoise,cskip}選項(xiàng)。這使結(jié)果基本保持不變,但VE在64×64分辨率下有很大改善。該預(yù)處理方法的主要好處不是改善FID本身,而是使訓(xùn)練更加穩(wěn)健,從而將重點(diǎn)轉(zhuǎn)向重新設(shè)計(jì)損失函數(shù)又不會產(chǎn)生不利影響。

        VP和VE只在Fθ的架構(gòu)上有所不同(配置E和F)。

        除此之外,作者還建議改進(jìn)訓(xùn)練期間的噪聲級分布,并發(fā)現(xiàn)通常與GANs一起使用的無泄漏風(fēng)險增強(qiáng)(non-leaking augmentation)操作也有利于擴(kuò)散模型。

        比如從上表中,我們可以看到:有條件和無條件CIFAR-10的最新FID分別達(dá)到了1.79和1.97,打破了之前的記錄(1.85和2.1046)。

        更多細(xì)節(jié)歡迎查看論文原文:
        https://arxiv.org/abs/2206.00364

        參考鏈接:
        https://twitter.com/sedielem/status/1532466208435494930?s=12&t=Uzg6OWwe5AgXHSBrzlnFrg

        為您推薦

        網(wǎng)易云音樂私人FM是什么意思 網(wǎng)易云音樂是什么軟件

        1、私人FM其實(shí)就是私人電臺,這個私人FM只要調(diào)教的好了就會推送用戶喜歡的音樂。網(wǎng)易云音樂私人FM是根據(jù)用戶聽歌習(xí)慣,進(jìn)行智能推薦歌曲的一個功能。該功能依賴于平臺的智能推薦算法,算法越強(qiáng)大,推薦的歌曲也就越符合用戶喜好。

        2023-01-29 10:39

        信息技術(shù)是什么 關(guān)于信息技術(shù)的介紹

        1、信息技術(shù)是指利用電子計(jì)算機(jī)和現(xiàn)代通訊手段實(shí)現(xiàn)獲取信息、傳遞信息、儲存信息、處理信息、顯示信息、分配信息等的相關(guān)技術(shù)。 2、從廣義上講,凡是能擴(kuò)展人類信息功能的技術(shù),都是信息技術(shù)。隨著微電子技術(shù)、計(jì)算機(jī)技術(shù)和通信技術(shù)

        2023-01-29 03:39

        wps通配符使用技巧 WPS中通配符怎么用

        1、首先,我們使用鍵盤快捷鍵“ctrl+F”找到“查找與替換”的對話框,選擇“替換(P)”選項(xiàng)。2、然后,點(diǎn)擊下面的“高級搜索”,搜索(C)選擇為“全部”并且同時打開下面的“使用通配符”選項(xiàng)。3、之后在查找內(nèi)容欄里面輸入

        2023-01-27 10:39

        理財和基金的區(qū)別 關(guān)于理財和基金的區(qū)別介紹

        1、購買門檻,銀行理財一般的購買門檻要求較高,有的在5萬元以上,有的在上百萬元以上;而基金的認(rèn)購起點(diǎn)多在1000元左右,有的沒有門檻限制。 2、安全性的區(qū)別,銀行理財和基金雖然安全性都比較高,但是由于基金同時受基金法和

        2023-01-26 00:08

        結(jié)構(gòu)性存款和理財產(chǎn)品的區(qū)別 關(guān)于結(jié)構(gòu)性存款和理財產(chǎn)品的區(qū)別

        1、本質(zhì)的區(qū)別在于,結(jié)構(gòu)性存款依舊是存款范圍,而理財不屬于存款的范圍,也就是說理財是有本金虧損的風(fēng)險在,而存款則一般不會有。2、結(jié)構(gòu)性存款的門檻相對較高,一般五萬元起投,也有部分銀行推出一萬起投的。而理財產(chǎn)品一般沒有什么

        2023-01-26 00:08

        理財小知識 介紹 詳解兩個理財小知識

        1、要分清理財和投資的區(qū)別:(1)投資追求的是投入于產(chǎn)出比,比如我們分析上市公司,經(jīng)常用到ROE,其本質(zhì)我們是在分析企業(yè)賺錢的能力,而理財側(cè)重于財富的穩(wěn)定增長。(2)投資的為了在最短時間內(nèi),讓有限的資源產(chǎn)生最大的回報,而

        2023-01-25 21:09