看懂 YouTube 影音編碼規格
| | | 0 | |

老人腦中的影片格式還殘留 .avi、.wmv、.rm、.qt、.mov、.mp4 等上古時代的規格,影音編碼則停在 MPEG-2、DivX,後來加減聽過 H.264。殊不知,串流影片時代早是全新世界,如下圖是現今 YouTube 影片用到影音編碼格式,我一個也沒看過,滿滿的陌生術語,這篇來更新一下知識。

YouTube 是當今影音串流技術的權威之一,學會看懂它們至少不會離主流太遠。
常見影片解析度有哪些?
圖片裡列出了六種:144p (256X144)、240p (426X240)、360p (640X360)、480p (854X480)、720p (1280X720)、1080p (1920X1080),更高的有還有 1440p (2K, 2560X1440) 和 2160p (4K, 3840x2160),
為什麼畫面和聲音要分離?
YouTube 以及大多數現代串流平台會使用 DASH (Dynamic Adaptive Streaming over HTTP) 技術。伺服器端為節省頻寬並快速切換畫質,YouTube 主機上畫面及聲音其實會分開儲存在兩條獨立軌道,播放時瀏覽器同時下載這兩條軌道,並即時同步播放。當網路忽然變慢,可以只降低畫質 (Video 軌道切換成 480P) 但聲音保持不變,如此使用者不會覺得聲音卡頓。若要離線使用,可選擇適當的畫面尺寸及音質,自行合成影片。
AVC1/VP9/AV01/MP4A/OPUS 是什麼?
這些是當今串流平台使用的主流視訊及音訊編碼格式。
視訊編碼
| 編碼代號 | 全名 | 技術定位 | 優點 | 缺點 | 適用情境 |
|---|---|---|---|---|---|
| AVC1 | H.264 / MPEG-4 AVC | 舊世代標準 | 相容性最高。幾乎所有設備 (包含舊手機、嵌入式系統) 都能硬體解碼。 | 壓縮效率最低,同畫質下檔案最大 (但在低解析度下有時反而較小,如本例的 144P)。 | 需在舊設備播放,或為了最大相容性時使用。 |
| VP9 | VP9 (Google) | 中生代標準 | Google 為了取代 H.264 推出的開源格式。壓縮效率優於 AVC1。 | 雖然效率高,但逐漸被 AV1 取代。目前是 2K/4K 影片的主力。 | 大部分 Android 手機與現代瀏覽器皆支援。 |
| AV01 | AV1 (AOMedia Video 1) | 次世代標準 | 壓縮效率最高。由 Google、Netflix 等巨頭推動。同畫質下檔案最小 (見本例的 1080P 僅 138MB,遠小於 VP9 的 222MB)。 | 硬體解碼需求高。若硬體不支援 (如舊顯卡、舊手機),播放時 CPU 負載極高,可能導致卡頓。 | 設備較新、網路頻寬有限,或追求最高畫質/容量比時使用。 |
音訊編碼
| 編碼代號 | 全名 | 特性分析 |
|---|---|---|
| MP4A | AAC (Advanced Audio Coding) | 傳統標準,通常封裝在 M4A 容器中。相容性極佳 (特別是 Apple 設備)。但在同位元率下,音質略遜於 Opus。 |
| OPUS | Opus Audio | 現代標準,通常封裝在 WebM 容器中。專為網路串流設計,延遲低且在低位元率 (如 128kbps 以下) 下能保留更多高頻細節,音質通常優於 AAC。 |
以下是 AI 整理的壓縮率比較,以 H.264 (1080p 畫質) 作為基準:
| 編碼器 | 典型效率改善 (對比 H.264) | 預估位元率 (同畫質) | 檔案大小趨勢 |
|---|---|---|---|
| MPEG-2 | 較差 (約 -100% 效率) | 6000+ Kbps | 極大 |
| H.264 (AVC) | 基準 (100%) | 3000 Kbps | 基準 |
| H.265 (HEVC) | 改善約 40% - 50% | 1500 - 1800 Kbps | 大幅縮小 |
| VP9 | 改善約 30% - 50% | 1500 - 2100 Kbps | 大幅縮小 |
| AV1 | 改善約 50% - 65% | 1000 - 1500 Kbps | 最小 |
上面這些規格跟 .mp4, .avi 的關係?
AVC1、VP9、AV01 是視訊「編解碼器 (CODEC)」規格,MP4A 和 OPUS 是音訊 CODEC,而 .avi、.wmv、.mp4 則是「容器 (Container)」格式,兩者是不同層級的概念。容器像「信封」,負責打包視訊、音訊、字幕等多軌資料,並定義時間戳和同步;CODEC 則是「壓縮演算法」,決定畫質、檔案大小和解碼需求。
例如:.avi (AVI) 是 Microsoft 1992 年標準,主要使用舊 CODEC 如 MPEG-4 Part 2 或 DivX,AVI 也可容納新式 CODEC,但因不支援串流、容量偏大、不支援 HDR/多語字幕... 等缺陷不建議使用。.wmv 是微軟專有格式,使用 WMV CODEC。
.mp4 (MPEG-4 Part 14) 則為 ISO 標準,現代主流容器,支援 H.264/AVC1、HEVC 等現代 CODEC,非常靈活。
此外,有個值得注意的新格式 - .webm,WebM 是 Google 於 2010 年推出的開源媒體容器格式,專為網頁影片設計,使用 VP8/VP9/AV1 等開源視訊 CODE 和 Vorbis/Opus 音訊 CODEC。WebM 基於 Matroska (MKV) 容器結構,強調網路傳輸效率,強調開源不需專利費。同畫質下檔案比 MP4 小 20~50%,適合串流,且 Chrome、Firefox、Opera、Edge 內建支援,並支援 Alpha 通道,可產生透明背景與其他視覺元素組合,可用來製作網頁特效,是適合 HTML 應用的新格式。
H.265 看來很不錯,但為何 YouTube 不用?
目前 YouTube 僅在直播時用 H.265,主要原因是 H.265 採多專利池授權模式(MPEG-LA、HEVC Advanced...),而 H.264 只有 MPEG-LA。HEVC Advance 曾試圖向 Apple、Microsoft 等企業索取數億美元授權費,而 H.264 只要數百萬美元。
為了規避 HEVC 授權問題,Google、Microsoft、Mozilla、Netflix、Amazon、Cisco 等於 2015 年成立開放媒體聯盟(AOM),開發免版稅的 AV1 編碼器(BSD 授權),成為串流系統的首選。但 H.265 支援硬體編碼(NVIDIA NVENC、AMD VCE),能支援 AV1 硬體編碼的 GPU 跟手機還不多,YouTube 為了滿足 HDR 直播的即時性,仍使用 H.265。
YouTube 官方推薦大家上傳影片用 H.264 編碼,因為相容性最好。內部轉碼時,解析度 < 1440p 轉碼為 H.264,解析度 ≥ 2160p(4K) 優先轉碼為 VP9,AV1 視狀況處理。優先採用 VP9 的理由是伺服器端跟客戶端幾乎都支援 VP9 硬體加速,編碼與解碼效率較好。像 4K 影片轉 VP9 要一小時,轉 AV1 要 3~4 小時,客戶端播放時用軟體解碼又有耗電發熱問題。等未來硬體普遍支援後,應該會改為以 AV1 為主。
特殊標記
DRC (Dynamic Range Compression) 動態範圍壓縮,是一種將音訊「大聲變小、小聲變大」的處理技術,目的在求整體音量保持一致 (Loudness Normalization),適合在吵雜環境 (如通勤) 或使用手機喇叭時聆聽,避免聽不到細節或突然被爆音嚇到,YouTube 稱為 "Stable Volume" (穩定音量)。但對發燒友或講究音質的使用者,DRC 會破壞原始錄音動態對比,導致聲音扁平缺乏張力。我是木耳,我很需要。
【修訂記錄】
- 2025-01-04 18:19 更正壓縮率比較表、增加 1440p/2160p (感謝張恭華兄建議)、增加容器與編碼器概念說明 (感謝 HO Kin Chung、Mengchun Tsai 建議)
Comments
Be the first to post a comment