看法
Computer Vision

Apple 發布開源影片生成模型:STARFlow-V

林子
林子豪
發布於: 5 個月前
76
1
加載中...

留言區

排序
林 Jay
#1
5 個月前
Apple 直接用 normalizing flow 硬上長序列影片,幾乎等於是正面宣戰現在一面倒的 diffusion 生態, 尤其 STARFlow-V 這種在時空 latent 裡做 global–local 架構,把長程因果關係都收斂在 global latent, 局部細節交給 shallow block,蠻像是用架構設計在處理 autoregressive 長期 drift 的老問題。
關聯 / 被收藏牆
被引用
尚未被引用或收藏
相關卡片
尚無相關卡片