後知後覺之學習影音檔新格式 - MKV 與 MP4 家族
| | | 0 | |
前陣子關於 YouTube 影音編碼規格的留言,有個名詞一再出現 - MKV。出現頻率之高,讓我有「大家都上車走了,我還在車站傻等」的脫節感! 便花了點時間搞懂 MKV 是啥,順手寫篇筆記。
MKV 發展史
MKV 跟 AVI 一樣是影音容器檔的規格,但不同於傳統影音標準多來自主要廠商、科技巨頭組成聯盟合力制訂與推廣,MKV 走草根路線,由民間開源社群自主發展而成。
2002 年,Steve Lhonme 主張使用 EBML (可延伸二進位元中繼語言,一種二進位 XML) 作為影音容器底層資料結構,與開源專案 MCF (Multimedia Container Format)的主開發者意見相左,便自己另立門戶創立 Matroska 開源專案。
「Matroska」一詞源自俄羅斯語的 Matryoshka (Матрёшка),就是大家熟悉的俄羅斯套娃,象徵能在檔案裡層層嵌套無限數量的影片、音訊、字幕與中繼資料:
2003 年推出的 MKVToolNix 工具可以封裝、分割、合併 MKV 檔,讓 MKV 正式成為能實際應用的容器格式。
2010 年 Google 採用 MKV 子集做為資料結構推出 WebM 格式,MKV 開始由地下社群格式成為主流技術;2014 年 Windows 10 宣佈生支援 MKV 播放,MKV 全面走入商業作業系統。
之後 MKV 進入 IETF 標準化流程,於 2024 年 10 月成為 RFC 9559 國際標準,也漸漸成為專業檔案典藏 (如圖書館或博物館) 保存檔案的主要格式。
Matroska 家族有四個主要成員:
- .mkv:包含影像、音訊、字幕的標準影片
- .mka:純音訊檔案 (支援多聲道或無損音樂)
- .mks:純字幕檔
- .mk3d:3D 影片容器
另外,MKV 的興起,動漫字幕組也助了一臂之力。1992 推出的 AVI 格式跟不上時代,不支援 H.264,無法內嵌字幕得外掛 .srt 字幕檔;而 MP4 則卡在不支援特效字幕 (ASS/SSA),無法使用自訂字型、畫面遮蓋(把日文招牌換成中文)等進階字幕功能。相較之下,MKV 能內嵌字體檔(.ttf),使用者不用安裝字體就能看到字幕組苦心設計的精美字幕,並且單檔就包含中日英語配音外加評論音軌,還能像 DVD 一樣分章節(跳過片頭 OP、片尾 ED)。更重要的是,MKV 一切開源,不必擔心開發工具有專利授權問題。於是乎,MKV 很快成為字幕組發行影片時首選,反正 Windows 內建支援,但後來手機平板普及,考量相容性,MP4 也成為主流選項。現在的字幕組通常會提供兩個版本:MKV 版給追求畫質與特效的收藏者,MP4 版給要在手機或電視上看的人。
MKV 與 MP4 的差別
MKV 強調彈性與可擴充性,允許開發者重新定義格式,加入新的編解碼支援或功能,而它與 MP4 有個最最最大區別:
MP4 檔案有個關鍵資料叫做 Moov Atom (中繼資料),相當於影片「目錄」或「索引」,記錄每一秒畫面在檔案的位置、音訊與影像如何同步等資訊,而 MP4 會在所有影音資料寫入後才產生 Moov Atom 附在檔案結尾。這導致一個嚴重問題,若錄影或產生影片過程斷電或當機,來不及寫入 Moov Atom 的影片檔就報廢了,播放軟體將無法開啟當案或顯示檔案毀損。(註:有個 untrunc開源工具能嘗試修復斷尾 MP4)
MKV 採用不同的策略,更偏向串流概念,MKV 將影像和音訊分成區塊 (Clusters),每個小區塊都包含了自己的索引資訊,錄影時每寫完一部分就包成一個完整區塊。如此,即使傳輸或錄製出錯也只會損失最後一個區塊,前面的影片仍可播放無誤,不受絲毫影響。
也因此,OBS 等錄影直播軟體一直都是建議「先錄 MKV,再轉 MP4」,我沒接觸直播,不然應會更早認識這個格式。
| 特性 | MKV | MP4 |
|---|---|---|
| 編碼支援 | 幾乎無限制,任何編碼都能封裝 | 僅支援標準編碼 (H.264/H.265 + AAC) |
| 音訊/字幕軌道 | 可多軌,適合多語言、多版本 | 支援有限,通常單一音訊 + 字幕 |
| 章節/標籤 | 支援完整章節、標籤、封面 | 僅基本 Metadata |
| 錯誤容忍度 | 部分檔案損壞仍可播放 | 損壞常導致整個檔案無法播放 |
| 檔案大小 | 偏大,保留高品質 | 偏小,壓縮效率佳 |
| 相容性 | 不如 MP4 普及,部分裝置不支援 | 幾乎所有裝置與平台皆支援 |
MP4 衍生版本
為了克服 MP4 的限制,MP4 也衍生出一些適用特別情境的版本:
- fMP4 (Fragmented MP4)
被主流網路串流服務如 Netflix, YouTube, Twitch 大量採用,fMP4 可解決傳統 MP4 沒寫入 Moov Atom 檔案無法使用的致命傷,將影片拆成碎片(Fragment),每個碎片自帶中繼資料。如此不怕錄製或下載中斷,並能依網路狀況動態切換高低畫質,播放不中斷。 - M4A (MPEG-4 Audio) / M4B (Audiobook) / M4P (Protected)
Apple 體系常用的 MP4 衍生版,M4A 使用 AAC 或 Apple 無損(ALAC)編碼,在相同位元率下,品質遠優於 MP3;M4B 支援書籤,播放器可記住上次聽到哪一秒(很適合有聲書);M4P 則內嵌 DRM (數位版權管理),可防止未授權播放。 - MOV (QuickTime File Format)
不算衍生版本,因為 MP4 是從 MOV 演變而來的,MOV 支援 Alpha Channel 透明背景影片,在 Final Cut Pro 等剪輯軟體的反應速度比 MP4 快。 - HEIF / AVIF
強化版靜態影像,利用影片壓縮技術來儲存照片,在相同畫質下檔案大小只有 JPEG 的一半,並可儲存連拍與動態照片。
比較表:
| 變體名稱 | 主要用途 | 最核心的強化功能 |
|---|---|---|
| MP4 | 通用分享、社交媒體 | 相容性最高,通吃所有設備。 |
| fMP4 | 直播、串流影片 | 防毀損、支援適應性位元率串流。 |
| M4A | 音樂、Podcast | 高效率音訊封裝,音質優於 MP3。 |
| M4B | 有聲書 | 支援書籤定位,方便收聽長篇有聲書。 |
| MOV | 專業影音剪輯 | 支援 ProRes 與透明背景。 |
| HEIF (.heic) | 手機相片 | 支援動態照片(Live Photo),擁有高壓縮率。 |
學習完畢~

Comments
Be the first to post a comment