這是一份基於您提供的「零成本在地 YouTube AI 影片工廠心得」與「大型語言模型之錯誤防線」兩份核心文檔,經整合、重構後編寫的全新深度心得報告。
我們都曾幻想過那個「魔法 AI 按鈕」:按下它,一個全能的 AI Agent 就會搞定一切——從寫作、導演、剪輯到輸出成品。這是自動化創作的終極夢想。 為了驗證這個夢想,我構建了 HLN Machine(地獄新聞工廠)。這是一個嘗試在 Mac Studio M2 Ultra 上,以「零雲端成本、純本地運行」為目標,將單篇新聞自動轉化為 YouTube Shorts 的系統。 然而,這趟旅程並未讓我找到那個全能的 AI 之神。相反地,我發現了當前模型驚人的局限性。真正的突破並非來自更強的模型,而是來自工程設計——特別是如何構建一套防線,來管理這些充滿創造力卻極度不可靠的「數位實習生」。
以下是在構建這座白盒工廠過程中,最關鍵的五個工程與心法總結:
在自動化影片製作中,第一步是決定哪裡需要 B-Roll(輔助畫面),哪裡保留 A-Roll(講者畫面)。直覺上,我將劇本丟給 LLM,請它分配分鏡。結果是一場災難:即便修改了 60 次提示詞,LLM 依然無法產生穩定、合乎節奏的結果。
解決方案來自 1940 年代的資訊理論(Information Theory)與 1960 年代的心理學的結合:
這讓我建立了一條**「視覺需求曲線」**。高熵值代表資訊密度高、不可預測性強,因此需要 B-Roll 來輔助觀眾理解。最終,我放棄了 AI 的隨機決策,改用這套基於物理與心理學的公式,精準計算出 B-Roll 的插入窗口,將不可控的創作轉化為可計算的工程。