首页 > 财经数据 > 财经数据 > 解锁任意步数文生图,港大&Adobe全新Self-E框架学会自我评估

解锁任意步数文生图,港大&Adobe全新Self-E框架学会自我评估

发布时间:2026-01-15 14:10:18

尽管扩散模型(Diffusion Model)与流匹配(Flow Matching)已经把文本到图像生成(Text-to-Image, T2I)推向了更高的视觉质量与可控性,但他们通常在推理时需要数十步网络迭代,限制了其对于一些需要低延迟,Real-Time 的应用。

为了把推理步数降下来,现有路线通常依赖知识蒸馏(Distillation):先训练一个多步教师模型,再把能力迁移到少步学生模型。但这条路的代价同样明显 —— 既依赖预训练教师,又引入了额外的训练开销,并在「从零训练(from scratch)」与「极少步高质量」之间留下了长期空白。

近日,香港大学(The University of Hong Kong)与 Adobe Research 联合发布 Self-E(Self-Evaluating Model):一种无需预训练教师蒸馏、从零开始训练的任意步数文生图框架。其目标非常直接:让同一个模型在极少步数也能生成语义清晰、结构稳定的图像,同时在 50 步等常规设置下保持顶级质量,并且随着步数增加呈现单调提升。



 

  • 论文标题:Self-Evaluation Unlocks Any-Step Text-to-Image Generation
  • 项目主页:https://xinyu-andy.github.io/SelfE-project/
  • 论文 PDF:https://www.arxiv.org/pdf/2512.22374

 



引言:从「轨迹匹配」到「落点评估」

扩散 / 流匹配范式本质上是在学习一张「局部向量场」:给定噪声状态,预测下一步该往哪里走。这个监督信号在「小步、密集积分」时非常有效,但一旦尝试「大步跳跃」,误差会被轨迹曲率放大,生成往往滑向平均解、语义漂移或结构坍塌。


Self-E 的切入点是一个根本上的范式改变:我们能否不再执着于「每一步走得对不对」,而是把训练重心转向「落点好不好」?也就是把目标从「轨迹匹配(trajectory matching)」转变为「落点评估(destination/landing evaluation)」。

换句话说,传统 Diffusion Model 训练强调「在起点对齐局部方向」;Self-E 强调「在落点评估结果并给出纠偏方向」。监督位置的改变,带来了训练信号性质的改变:从静态监督变成动态反馈。

财经数据更多>>

“恐怖数据”驾到 黄金、美元指数、日元、欧元、英镑、澳元和人民币技术前景分析 东鹏特饮A+H股双上市、TikTokShop强化风控、X投票改进 新款小米SU7续航曝光:三种电池版本,CLTC最高902km 2025年陕西省级人才计划拟入选名单公示 Seedance2.0引爆应用端,还有哪些方向值得重视?周二收盘点评 渭滨50万元电子消费券正式开抢!满500减100、满200减50...... W4周排名出炉,苹果、华为位置互换,小米、荣耀位置也互换 涨价潮下的“生存游戏”:谁能率先穿越周期? 4年前机型将喜提ColorOS 16正式版:还能再战 曦望联席CEO王勇:启望S3研发完成,年中流片年底回片量产 商汤开源多模态自主推理模型SenseNova-MARS 字节、阿里、腾讯 AI 大战全记录:一场影响命运的战争 微信内公众号图标变了:从“一页”变成了“两页” 中国互联网大厂的 AI 时代船票争夺战已经开始了 字节扣子 2.0 发布,我们深挖了它这两年的生长真相 短剧红利狂欢下:屏幕里手握数亿元的“霸总”,屏幕外追要万元欠薪? 泰山啤酒重整:鲜啤王牌,何以渡劫? 2025年新建商品房销售额83937亿元 厂商称被冒名代工名创优品围巾?名创优品暂无回应 五菱大SUV卖6.28万,配1.5T+四轮独悬,轴距超2米8,又要火了! 解锁任意步数文生图,港大&Adobe全新Self-E框架学会自我评估 日产大5座SUV,NX8实车现身,车长4870mm,两种动力,上半年上市 买车等等!比亚迪26年有超13台新车值得等:汉唐9系叫啥合适? 比黄金还猛!白银价格飙升150%,三个被忽视的原因非常重要 长城证券汪毅:2026年看好AI应用领域 科技有AI,连接全球:海信家电参展CES 2026,定义智慧生活新图景 拼多多内测“百亿超市”,低价再拓新场景 真我 Neo8 参数曝光,骁龙 8 Gen5 、8000mAh电池 2026年第一款真全面屏来了!红魔11 Air官宣 被Jim Fan点赞!全球第一的千寻智能Spirit v1.5正式开源!