前陣子關於 YouTube 影音編碼規格的留言,有個名詞一再出現 - MKV。出現頻率之高,讓我有「大家都上車走了,我還在車站傻等」的脫節感! 便花了點時間搞懂 MKV 是啥,順手寫篇筆記。

MKV 發展史

MKV 跟 AVI 一樣是影音容器檔的規格,但不同於傳統影音標準多來自主要廠商、科技巨頭組成聯盟合力制訂與推廣,MKV 走草根路線,由民間開源社群自主發展而成。

2002 年,Steve Lhonme 主張使用 EBML (可延伸二進位元中繼語言,一種二進位 XML) 作為影音容器底層資料結構,與開源專案 MCF (Multimedia Container Format)的主開發者意見相左,便自己另立門戶創立 Matroska 開源專案。

「Matroska」一詞源自俄羅斯語的 Matryoshka (Матрёшка),就是大家熟悉的俄羅斯套娃,象徵能在檔案裡層層嵌套無限數量的影片、音訊、字幕與中繼資料:

thumbnail
照片來源

2003 年推出的 MKVToolNix 工具可以封裝、分割、合併 MKV 檔,讓 MKV 正式成為能實際應用的容器格式。

2010 年 Google 採用 MKV 子集做為資料結構推出 WebM 格式,MKV 開始由地下社群格式成為主流技術;2014 年 Windows 10 宣佈生支援 MKV 播放,MKV 全面走入商業作業系統。

之後 MKV 進入 IETF 標準化流程,於 2024 年 10 月成為 RFC 9559 國際標準,也漸漸成為專業檔案典藏 (如圖書館或博物館) 保存檔案的主要格式。

Matroska 家族有四個主要成員:

  • .mkv:包含影像、音訊、字幕的標準影片
  • .mka:純音訊檔案 (支援多聲道或無損音樂)
  • .mks:純字幕檔
  • .mk3d:3D 影片容器

另外,MKV 的興起,動漫字幕組也助了一臂之力。1992 推出的 AVI 格式跟不上時代,不支援 H.264,無法內嵌字幕得外掛 .srt 字幕檔;而 MP4 則卡在不支援特效字幕 (ASS/SSA),無法使用自訂字型、畫面遮蓋(把日文招牌換成中文)等進階字幕功能。相較之下,MKV 能內嵌字體檔(.ttf),使用者不用安裝字體就能看到字幕組苦心設計的精美字幕,並且單檔就包含中日英語配音外加評論音軌,還能像 DVD 一樣分章節(跳過片頭 OP、片尾 ED)。更重要的是,MKV 一切開源,不必擔心開發工具有專利授權問題。於是乎,MKV 很快成為字幕組發行影片時首選,反正 Windows 內建支援,但後來手機平板普及,考量相容性,MP4 也成為主流選項。現在的字幕組通常會提供兩個版本:MKV 版給追求畫質與特效的收藏者,MP4 版給要在手機或電視上看的人。

MKV 與 MP4 的差別

MKV 強調彈性與可擴充性,允許開發者重新定義格式,加入新的編解碼支援或功能,而它與 MP4 有個最最最大區別:

MP4 檔案有個關鍵資料叫做 Moov Atom (中繼資料),相當於影片「目錄」或「索引」,記錄每一秒畫面在檔案的位置、音訊與影像如何同步等資訊,而 MP4 會在所有影音資料寫入後才產生 Moov Atom 附在檔案結尾。這導致一個嚴重問題,若錄影或產生影片過程斷電或當機,來不及寫入 Moov Atom 的影片檔就報廢了,播放軟體將無法開啟當案或顯示檔案毀損。(註:有個 untrunc開源工具能嘗試修復斷尾 MP4)

MKV 採用不同的策略,更偏向串流概念,MKV 將影像和音訊分成區塊 (Clusters),每個小區塊都包含了自己的索引資訊,錄影時每寫完一部分就包成一個完整區塊。如此,即使傳輸或錄製出錯也只會損失最後一個區塊,前面的影片仍可播放無誤,不受絲毫影響。

也因此,OBS 等錄影直播軟體一直都是建議「先錄 MKV,再轉 MP4」,我沒接觸直播,不然應會更早認識這個格式。

特性MKVMP4
編碼支援幾乎無限制,任何編碼都能封裝僅支援標準編碼 (H.264/H.265 + AAC)
音訊/字幕軌道可多軌,適合多語言、多版本支援有限,通常單一音訊 + 字幕
章節/標籤支援完整章節、標籤、封面僅基本 Metadata
錯誤容忍度部分檔案損壞仍可播放損壞常導致整個檔案無法播放
檔案大小偏大,保留高品質偏小,壓縮效率佳
相容性不如 MP4 普及,部分裝置不支援幾乎所有裝置與平台皆支援

MP4 衍生版本

為了克服 MP4 的限制,MP4 也衍生出一些適用特別情境的版本:

  • fMP4 (Fragmented MP4)
    被主流網路串流服務如 Netflix, YouTube, Twitch 大量採用,fMP4 可解決傳統 MP4 沒寫入 Moov Atom 檔案無法使用的致命傷,將影片拆成碎片(Fragment),每個碎片自帶中繼資料。如此不怕錄製或下載中斷,並能依網路狀況動態切換高低畫質,播放不中斷。
  • M4A (MPEG-4 Audio) / M4B (Audiobook) / M4P (Protected)
    Apple 體系常用的 MP4 衍生版,M4A 使用 AAC 或 Apple 無損(ALAC)編碼,在相同位元率下,品質遠優於 MP3;M4B 支援書籤,播放器可記住上次聽到哪一秒(很適合有聲書);M4P 則內嵌 DRM (數位版權管理),可防止未授權播放。
  • MOV (QuickTime File Format)
    不算衍生版本,因為 MP4 是從 MOV 演變而來的,MOV 支援 Alpha Channel 透明背景影片,在 Final Cut Pro 等剪輯軟體的反應速度比 MP4 快。
  • HEIF / AVIF
    強化版靜態影像,利用影片壓縮技術來儲存照片,在相同畫質下檔案大小只有 JPEG 的一半,並可儲存連拍與動態照片。

比較表:

變體名稱主要用途最核心的強化功能
MP4通用分享、社交媒體相容性最高,通吃所有設備。
fMP4直播、串流影片防毀損、支援適應性位元率串流。
M4A音樂、Podcast高效率音訊封裝,音質優於 MP3。
M4B有聲書支援書籤定位,方便收聽長篇有聲書。
MOV專業影音剪輯支援 ProRes 與透明背景。
HEIF (.heic)手機相片支援動態照片(Live Photo),擁有高壓縮率。

學習完畢~


Comments

Be the first to post a comment

Post a comment