Semantic Encoder
稳定高层内容,低码率下优先保存可懂度和核心信息。
// language layer研究页按三步阅读:先看语义层如何保住"在说什么", 再看声学层如何恢复自然度、音色和细节, 最后回到接口与部署判断。
从含义到声学,再到接口判断 —— 每一层独立,可以分开训练、分开评估。
稳定高层内容,低码率下优先保存可懂度和核心信息。
// language layer恢复自然度、音色、节奏和微小细节,让语音更像真实语音。
// signal layer检查两层怎么对齐、谁负责什么,以及上线前如何评价。
// interface layer先保内容和可懂度,避免只追求压缩率导致语义断裂。
把自然度、音色和细节作为声学层的独立工程目标。
用清晰分工和可复查指标,决定两层如何连接。