HLN 字幕管線技術分析

這套字幕系統的可靠性建立在一個多層級的「結構鎖定(Structure-Locked)」架構上,其核心理念是:讓 ASR(Whisper)負責「物理時間」,讓人工/LLM 負責「語義真相」,並透過多道閘門強制兩者對齊。

1. 核心流程:三階段對齊

整個管線並不是一次到位的,而是分層逐步收斂誤差:

第一層:生成物理骨架 (Physical Skeleton)

第二層:校正語義真相 (Semantic Truth)

第三層:注入靈魂 (Injection)