91精品国产三级_国语对白做受xxxxx在线中国_国产精品12p_黄色成人在线看_久久久久久久久久久99_91嫩草国产丨精品入口麻豆_各处沟厕大尺度偷拍女厕嘘嘘_久久9精品区-无套内射无码_国产原创精品在线_国产成人免费高清视频_国产高清视频网站_国产l精品国产亚洲区久久

登錄
首頁 > 媒體學習 > 北大與字節團隊BranchGRPO,「樹形分叉 + 剪枝」重塑擴散模型

北大與字節團隊BranchGRPO,「樹形分叉 + 剪枝」重塑擴散模型

發布時間:2025-09-23 10:06:25

擴散 / 流匹配模型的人類偏好對齊中,實現高效采樣與穩定優化的統一,一直是一個重大挑戰。

近期,北京大學與字節團隊提出了名為 BranchGRPO 的新型樹形強化學習方法。不同于順序展開的 DanceGRPO,BranchGRPO 通過在擴散反演過程中引入分叉(branching)與剪枝(pruning),讓多個軌跡共享前綴、在中間步驟分裂,并通過逐層獎勵融合實現稠密反饋。

該方法在 HPDv2.1 圖像對齊與 WanX-1.3B 視頻生成上均取得了優異表現。最令人矚目的是,BranchGRPO 在保證對齊效果更優的同時,迭代時間最高近 5×(Mix 變體 148s vs 698s)。

  • 單位:該項目主要由來自北京大學、北京師范大學、字節跳動的師生聯合研究,作者包括李聿明、王一凱等,通訊作者為北京大學仉尚航。

 

研究背景與挑戰

近年來,擴散模型與流匹配模型憑借在圖像與視頻生成上的高保真、多樣性與可控性,已成為視覺生成的主流方案。然而,僅靠大規模預訓練并不能保證與人類意圖完全對齊:模型生成的結果常常偏離美學、語義或時間一致性的需求。

為解決這一問題,「人類反饋強化學習(RLHF)」被引入,用以直接優化生成模型,使其輸出更貼近人類偏好。

在 RLHF 體系中,「群體相對策略優化(GRPO)」被證明在圖生文、文生圖和視頻生成中具有良好的穩定性與可擴展性。然而,當 GRPO 應用于擴散 / 流模型時,依舊面臨兩大根本性瓶頸:

低效性:標準 GRPO 采用順序 rollout,每條軌跡必須在舊策略和新策略下獨立采樣,復雜度達到 O (N×T)(其中 T 是擴散步數,N 是組大小)。這種重復采樣帶來大量計算冗余,嚴重限制了大規模生成任務的擴展性。

稀疏獎勵:現有方法通常只在最終生成結果上計算單一獎勵,并將其均勻回傳至所有步。這種 “稀疏且均勻” 的反饋忽視了中間狀態中蘊含的關鍵信號,導致 credit assignment 不準確,訓練波動大、收斂不穩,甚至出現高方差梯度。

因此,一個關鍵問題被提出:如何在不破壞多樣性的前提下,既提升采樣效率,又讓獎勵信號更稠密、更穩定地作用于訓練過程?

正是在這一背景下,我們提出了 BranchGRPO。通過樹形分叉、獎勵融合與剪枝機制,BranchGRPO 做到了「又快又穩、又強又準」,為大規模視覺生成對齊開辟了新路徑。

Copyright 2013-2025 今日媒體網 版權所有  京ICP備13154207號-1
91精品国产三级_国语对白做受xxxxx在线中国_国产精品12p_黄色成人在线看_久久久久久久久久久99_91嫩草国产丨精品入口麻豆_各处沟厕大尺度偷拍女厕嘘嘘_久久9精品区-无套内射无码_国产原创精品在线_国产成人免费高清视频_国产高清视频网站_国产l精品国产亚洲区久久
国产精品日韩| 国产精品一区二区美女视频免费看| 精品一区91| 欧美日韩精品免费观看视频完整| 久久激情五月激情| 欧美日韩精品免费观看视频完整| 美女视频黄 久久| 免费人成网站在线观看欧美高清| 红杏一区二区三区| 午夜欧美精品| 高清日韩中文字幕| 日韩国产在线观看| 激情婷婷亚洲| 91亚洲一区| 国产精品一区毛片| 蜜臀av国产精品久久久久| 日韩在线欧美| 精品国产欧美日韩| 欧美啪啪一区| 亚洲在线久久| 香蕉久久久久久久av网站| 久久精品导航| 日韩国产一区| 日本久久黄色| 国产精品亚洲一区二区在线观看| 综合激情五月婷婷| 亚洲图片久久| 日韩精品一区二区三区免费视频 | 日本少妇一区| 久久精品国产99国产| 国产欧美日本| 国产精品色在线网站| 欧美日韩一视频区二区| 日韩精品免费视频一区二区三区| 日韩视频不卡| 视频一区中文字幕精品| 视频一区在线视频| 日本三级亚洲精品| 欧美激情福利| 亚洲黄色免费看| 欧美亚洲精品在线| 香蕉久久国产| 国产精品蜜月aⅴ在线| 国产精品一区二区三区www| 国产探花在线精品一区二区| 卡一卡二国产精品| 日本精品不卡| 免费观看日韩电影| 国产伦一区二区三区| 福利一区二区三区视频在线观看| 日本综合字幕| 国产一区日韩一区| 蜜臀av国产精品久久久久| 色8久久久久| 色爱综合网欧美| 亚洲欧洲一区| 国产精品成人自拍| 亚洲福利免费| 国产精品自拍区| 激情综合网五月| 日韩精品免费观看视频| 国产一区二区精品福利地址| 视频福利一区| 日韩精品欧美大片| se01亚洲视频| 国产丝袜一区| 色网在线免费观看| 无码日韩精品一区二区免费| 高清日韩中文字幕| 国产模特精品视频久久久久| 国产精品最新自拍| 亚洲免费观看| 伊人久久在线| 国产日韩欧美在线播放不卡| 99久久亚洲精品蜜臀| 国产精品美女在线观看直播| 亚洲激情社区| 精品国产91| 日本亚州欧洲精品不卡| 91精品综合| 久久精品99国产国产精| 日韩一区二区三区免费| 国产三级精品三级在线观看国产| 欧美日韩高清| 日韩在线高清| 久久天堂影院| 日本v片在线高清不卡在线观看| 久久精品影视| 国产欧洲在线| 久久麻豆视频| 国产欧美一级| 日韩国产欧美在线播放| 欧美日韩国产亚洲一区| 亚洲综合在线电影| 国产精品主播| 国产亚洲欧美日韩在线观看一区二区 | 中文字幕一区日韩精品| 99精品美女| 久久久久久久欧美精品| 视频一区二区国产| 欧美~级网站不卡| 久久久影院免费| 久久婷婷亚洲| 黄色免费成人| 亚洲最新av| 日韩va欧美va亚洲va久久| 欧美日韩中文| caoporn视频在线| 久久国产中文字幕| 婷婷综合亚洲| 国产国产精品| 成人午夜国产| 日韩精品首页| 午夜一级在线看亚洲| 在线观看精品| 亚洲欧美日韩高清在线| 国产白浆在线免费观看| 人人精品久久| 欧美中文高清| 欧美视频一区| 日韩成人精品一区二区| 欧美激情aⅴ一区二区三区| 国产日产一区| 国产精品最新| 精品久久视频| 日本不卡中文字幕| 精品视频91| 97精品在线| 国产美女高潮在线| 国产私拍福利精品视频二区| 日韩免费久久| 98精品视频| 国产不卡人人| 日韩av福利| 在线亚洲一区| 亚洲精品美女| 中文字幕一区二区三区日韩精品| 精品视频久久| 欧美日韩国产观看视频| 日韩三区免费| 在线综合视频| 日韩国产在线不卡视频| 69堂精品视频在线播放| 日韩欧美1区| 香蕉人人精品| 亚洲性色av| 一区在线视频观看| 亚洲ww精品| 精品国产不卡一区二区| 色婷婷亚洲mv天堂mv在影片| 久久中文视频| 亚洲一区欧美激情| 日本一区二区免费高清| 在线日韩一区| 日本一区福利在线| 久久伊人国产| 亚洲欧美日韩国产一区| 久久久久蜜桃| 欧美日韩18| 色在线视频观看| 日韩一区精品视频| 国产精品久久久久久久久妇女| 亚洲精品大片| 国产拍在线视频| 99视频+国产日韩欧美| 欧美精品中文| 伊人精品在线| 国产aⅴ精品一区二区四区| 欧美另类综合| 国产精品2区| 国产精品美女久久久| 久久亚洲资源中文字| 欧美日韩精品免费观看视欧美高清免费大片| 欧美亚洲tv| 蜜臀91精品国产高清在线观看| 日韩av网站在线免费观看| 在线日韩欧美| 成人在线视频区| 亚洲深深色噜噜狠狠爱网站| 欧美在线亚洲| 91视频一区| 国产精品99久久久久久董美香| 九九久久婷婷| 国内在线观看一区二区三区| 美女久久精品| 日本一区福利在线| 亚洲高清成人| 五月天av在线| 国产一区二区三区成人欧美日韩在线观看 | 国产日韩精品视频一区二区三区| 99热精品久久| 欧美少妇精品| 嫩呦国产一区二区三区av| 免费在线视频一区| 国产精品一区免费在线| 午夜亚洲一区| 好看不卡的中文字幕| 九九精品调教| 亚洲网站视频| 99视频一区|