AI 影音生產線
講者:Ben Chen | Onelab | Principal Data Scientist
活動:11/12 Generative AI 年會小聚 2025
題目:AI 影音生產線
拍一支廣告,到底為什麼這麼貴。
這一場我聽了收穫滿滿,因為這演講是在回答一個老闆一定會問的現實問題,上一次 Ben 在台上分享的是怎麼用 AI 在股市賺錢,這一次他換了一個更接大眾的題目,拍廣告到底多燒錢。瑞嘉在做線上娛樂、平台、技術與維運等,廣告這件事本來就跑不掉,客戶一定一併要求。
但直到有一天,老闆真的坐下來看報價單,發現一支一分多鐘的廣告影片,開價就是一百五十萬到三百萬,那個瞬間老闆不是在想「這是不是被坑了」,而是「這件事一定有別的方法」,於是就將這個問題地丟給技術端,想看看可不可以用 AI 來替代。
這在個 AI 時代,想當然而答案是可以,Ben 最後只花了兩個人,加上一點工具成本,總花費不到三萬,就真的把一支廣告影片做出來了,這支影片不是 demo,也不是概念影片,而是真的可以拿去投放的內容。這個對比本身,就已經證明了一件事,AI 不是在省一點錢,而是在直接改寫生產邏輯

但其實事情沒有這麼輕鬆,真正最燒腦的地方,反而不是生成圖片或影片,而是最前面的那一段,如何構思劇情、拆分分鏡等,這是一個高度仰賴人腦的流程,要想故事結構內容,也要處理分鏡節奏,更要確保每一個畫面串起來是有意義的,Ben 很誠實地說這一段現在還是大量人工介入,而且非常耗能。不過也正因為一直在優化這段流程,他們開始意識到一件事,流程某些面向其實是可以被「重複」應用的。
不過老闆接著問了一個更狠的問題,可以再快一點嗎?
能不能不要每一支都這樣從頭燒一次腦,於是團隊的角色開始轉變,AI 不再只是工具,而是變成同事,人類變成 PM,在旁邊下指令、修方向,他們透過 ComfyUI,把不同模型接起來,再加上 vtuber 的形式,流量真的開始動了起來,但這階段還是半自動化量產。
第三階段,全自動化
有了以上根基,他們開始思索第三階段,希望用AI全自動化,Ben 提到簡單的影片其實非常適合全自動,用 n8n 串把腳本、圖片、影片生成、上架,全部接起來,可以做一個很完整的 pipline。但工程師一定都懂,真正卡關出問題的地方永遠不在簡報上,而是在各種奇奇怪怪的角落,舉例像是 Google 的 token 超級難拿,一定要走 GCP credential,影片生成本身是非同步的,要等三分鐘,還要過 RAI 檢查,這些都是實作時每天會撞牆的事情。
但整場我覺得最關鍵的一句話,是:
客戶要的是流量,不是影片有多好看
有時候我們這些技術人看了會覺得超厲害的作品,不一定會有好的轉換率。有時候反而是穩定、持續、量產的內容,才能在演算法裡慢慢累積效果。Ben 就提到,當整條線真的跑起來,會出現一個很奇特的狀態,你甚至忘了這個系統還在跑,直到有一天客戶跟你說,最近訂閱數真的在增加。

有些我們自己看了會覺得超厲害、超精緻的內容,不一定會轉換。反而是能穩定產出、持續投放的東西,慢慢在演算法裡累積效果。Ben 就提到當整條線真的跑起來,會出現一個很奇妙的狀態,你甚至會忘記這套系統還在跑,直到某天客戶跟你說,最近訂閱真的有在增加,那一刻你才會意識到,原來你不是在做影片而是在經營一條產銷系統。
整場聽完,我自己心裡整理成三個階段。
第一階段:把 AI 當工具,人做到滿意。
第二階段:半自動化,AI 是同事,你負責下決策。
第三階段:全自動化,AI 變員工,你只需要想題目。
只要第一步還有人類在想新的 idea,後面那條線就可以一直往後演進,如果要我用一句話總結這場分享,我會說,它不是在教你用什麼模型,而是在提醒你,一個人,真的有可能靠 AI,開一間一人影音公司,而且這件事不是未來,是現在。
作者:Chi