PG娱乐最新资讯ag手机客户端下载_社会新闻_大众网
栏目:PG娱乐 发布时间:2025-04-13
  PG电子(Pocket Games Soft )全球首屈一指的电子游戏供货商[永久网址:363050.com],首位跨足线下线上电子游戏开发。PG电子,pg娱乐,PG电子试玩平台,PG电子技巧,PG电子下载,欢迎注册体验!   本篇论文是由南洋理工大学 S-Lab 与普渡大学提出的无分类引导新范式,支持所有 Flow Matchin

  PG电子(Pocket Games Soft )全球首屈一指的电子游戏供货商[永久网址:363050.com],首位跨足线下线上电子游戏开发。PG电子,pg娱乐,PG电子试玩平台,PG电子技巧,PG电子下载,欢迎注册体验!

PG娱乐最新资讯ag手机客户端下载_社会新闻_大众网

  本篇论文是由南洋理工大学 S-Lab 与普渡大学提出的无分类引导新范式,支持所有 Flow Matching 的生成模型。目前已被集成至 Diffusers 与 ComfyUI。

  随着生成式 AI 的快速发展,文本生成图像与视频的扩散模型(Diffusion Models)已成为计算机视觉领域的研究与应用热点。

  近年来,Flow Matching 作为一种更具可解释性、收敛速度更快的生成范式,正在逐步取代传统的基于随机微分方程(SDE)的扩散方法,成为主流模型(如 Lumina-Next、Stable Diffusion 3/3.5、Wan2.1 等)中的核心方案。

  然而,在这一技术迭代过程中,一个关键问题依然存在:如何在推理阶段更好地引导生成过程,使模型输出更加符合用户提供的文本描述。

  Classifier-Free Guidance(CFG)是当前广泛采用的引导策略,但其引导路径在模型尚未充分训练或估计误差较大时,容易导致样本偏离真实分布,甚至引入不必要的伪影或结构崩塌。

  对此,南洋理工大学 S-Lab 与普渡大学的研究者联合提出了创新方法——CFG-Zero*,针对传统 CFG 在 Flow Matching 框架下的结构性误差进行了理论分析,并设计了两项轻量级但效果显著的改进机制,使生成图像/视频在细节保真度、文本对齐性与稳定性上全面提升。

  传统的 CFG 策略通过对有条件与无条件预测结果进行插值来实现引导。然而在 Flow Matching 模型中,推理过程是通过解常微分方程(ODE)进行的,其每一步依赖于前一步的速度估计。

  当模型训练不足时,初始阶段的速度往往较为不准确,而 CFG 此时的引导反而会将样本推向错误轨迹。研究者在高斯混合分布的可控实验中发现,CFG 在初始步的引导效果甚至不如「静止不动」,即设速度为 0。

  1.优化缩放因子(Optimized Scale):在每个时间步中动态计算有条件速度与无条件速度的内积比值,从而调整 CFG 中无条件项的强度,避免「过度引导」导致的误差。

  2.零初始化(Zero-init):将 ODE 求解器的前 K 步速度置为零(默认 K=1),跳过模型最不可靠的预测阶段,有效降低初始误差传播。

  这两项策略可无缝集成至现有的 CFG 推理流程中,几乎不引入额外计算开销。下面我们具体介绍该方法的细节:

  首先,CFG 的目标是能够估计出一个修正的速度,能够尽可能接近真实速度:

  研究者在 2D 多元高斯分布上进行进一步定量分析,可以求解得到扩散过程中每一步的最优速度的 closed-form:

  基于此,他们在训练了一个模型,并分析训练不同轮数下模型的误差,如下图所示。

  研究者发现在训练早期阶段,无分类引导得到的速度误差较大,甚至不如将速度设置为 0:

  研究者对比原始 CFG 与仅使用零初始化的 CFG,发现随着模型的收敛,零初始化的收益逐渐变小,在 160 轮训练后出现拐点,与多元高斯实验结果吻合。

  研究者在多个任务与主流模型上验证了 CFG-Zero* 的有效性,涵盖了文本生成图像(Text-to-Image)与文本生成视频(Text-to-Video)两大方向。

  例如在 Stable Diffusion 3.5 上,美学分有明显提高,不仅图像美感更强,而且语义一致性更好。在 T2I-CompBench 评测中,CFG-Zero* 在色彩、纹理、形状等多个维度均取得更优表现,特别适用于需要精准表达复杂语义的生成任务。

  在视频生成任务中,研究者将 CFG-Zero* 集成到 Wan2.1 模型中,评估标准采用 VBench 基准套件。结果表明,改进后的模型在 Aesthetic Quality、Imaging Quality、Motion Smoothness 等方面均有所提升,呈现出更连贯、结构更稳定的视频内容。CFG-Zero* 有效减少了图像跳变与不自然的位移问题。

  CFG-Zero* 在开源社区中实现了快速落地。目前,该方法已正式集成至 ComfyUI 与 Diffusers 官方库,并被纳入视频生成模型 Wan2.1GP 的推理流程。借助这些集成,普通开发者与创作者也能轻松体验该方法带来的画质与文本对齐提升。

  得到的视频如下:(第一个为原始 CFG 生成的,第二个为 CFG-Zero* 生成的),效果还是比较明显,值得尝试。

  8、各班级、办公室必须在离校前关好门窗,彻底关闭日光灯、饮水机,班班通等电源,消除火灾隐患。

  04月03日,国务院“互联网+督查”平台公开征集影响营商环境建设问题线索,

  晚霞映红天边,将整座村子都染上了一层金色的光彩,在这夕阳下,一株焦黑的柳木上,一条嫩枝摇曳,晶莹剔透,说不出的瑰美。而地上,一片的尸体,血迹斑斑。这个画面映入了每一位强者的脑海,让他们毕生难忘。

  (3)假期如父母外出不在家时,一定要提高警惕,防止坏人诈骗独自在家的同学,防止伤害未成年人的事件发生。

  补天阁上下,原本士气低落,现在见到曾经的门人回来,莫不热血澎湃,激烈冲杀,大战各路敌手。

  五是严肃纪律,有效预防和监督各类不和谐的选举行为。严肃会场纪律是换届选举顺利进行的重要保证。换届选举与会者人数比较多,而且与会者素质参差不齐,有可能会因为个别村的一些历史遗留问题而出现争议,从而使选举出现中断和停止现象。为此,镇党委要求把矛盾化解在座谈调研过程中,有的甚至通过外围力量做好工作,并积极预案,取得了较理想的效果,在换届选举工作会议上,全镇各村无一例与选举无关的事件发生。尽管如此,在整个换届选举过程中,还是存在一定不足,个别农村指导员对选举程序掌握不够的情况依然存在,如在民主推荐阶段,个别村的党内票和党外票没有分开统计,给党内选举带来一定的盲目性。另外,极个别村部分、村民代表对“两推一选”换届方式表现出“异常”的关注热情,个别党支部和工作组事先警惕和动态掌握不够,给选举工作带来了一定的被动。

  幼时,他被夺了至尊骨,那里的人很冷漠,迫害他们一家人。而在这里,他的替身又遭遇如此凄惨,无人问津,这样的事一而再的发生,他对皇都的石族没有了一点归属感。

  新闻信息服务许可证音像制品出版许可证广播电视节目制作经营许可证网络视听许可证网络文化经营许可证