AI 影片工廠：零成本在地與錯誤防線工程

這是一份基於您提供的「零成本在地 YouTube AI 影片工廠心得」與「大型語言模型之錯誤防線」兩份核心文檔，經整合、重構後編寫的全新深度心得報告。

零成本在地 YouTube AI 影片工廠心得：當工程思維遇上不可靠的實習生

前言：「一鍵生成」的迷思與現實

我們都曾幻想過那個「魔法 AI 按鈕」：按下它，一個全能的 AI Agent 就會搞定一切——從寫作、導演、剪輯到輸出成品。這是自動化創作的終極夢想。為了驗證這個夢想，我構建了 HLN Machine（地獄新聞工廠）。這是一個嘗試在 Mac Studio M2 Ultra 上，以「零雲端成本、純本地運行」為目標，將單篇新聞自動轉化為 YouTube Shorts 的系統。然而，這趟旅程並未讓我找到那個全能的 AI 之神。相反地，我發現了當前模型驚人的局限性。真正的突破並非來自更強的模型，而是來自工程設計——特別是如何構建一套防線，來管理這些充滿創造力卻極度不可靠的「數位實習生」。

以下是在構建這座白盒工廠過程中，最關鍵的五個工程與心法總結：

以熵驅動剪輯，取代主觀分鏡。
用「盲人剪輯師」流程，逼 AI 只在現實世界選擇畫面。
為 LLM 建立內外兩道錯誤防線。
將高熵創造與低熵規則行為物理分離。
以白盒工廠取代黑盒系統設計。

一、我解雇了 AI 導演，改聘物理學家：以「熵」驅動剪輯

在自動化影片製作中，第一步是決定哪裡需要 B-Roll（輔助畫面），哪裡保留 A-Roll（講者畫面）。直覺上，我將劇本丟給 LLM，請它分配分鏡。結果是一場災難：即便修改了 60 次提示詞，LLM 依然無法產生穩定、合乎節奏的結果。

熵值與心理學的結合

解決方案來自 1940 年代的資訊理論（Information Theory）與 1960 年代的心理學的結合：

夏農熵（Shannon Entropy）：我計算句子中每個字的「資訊能量」。
PAC 模型驗證：結合溝通分析（Transactional Analysis），發現具備「父母（Parent，批判）」與「兒童（Child，情緒）」特質的句子，往往擁有較高的熵值。

這讓我建立了一條**「視覺需求曲線」**。高熵值代表資訊密度高、不可預測性強，因此需要 B-Roll 來輔助觀眾理解。最終，我放棄了 AI 的隨機決策，改用這套基於物理與心理學的公式，精準計算出 B-Roll 的插入窗口，將不可控的創作轉化為可計算的工程。