音声や画像ファイルの形式ってメジャーどころだけでもいくつかありますが、それぞれにどんな特徴があるのかいまいち自分で整理できていなかったので、自分への備忘録として、よく利用されている音声や画像ファイルの形式の特徴をまとめてみました。
特徴をざっくりとでも理解しておけば、どんな時にどんなファイル形式が適しているか判断しやすくなりますよ。
目次
音声ファイル形式
WAV
WAV(RIFF waveform Audio Format)は、MicrosoftとIBMが開発した非圧縮の音声形式で、Windows環境でよく利用されています。
音質やデータサイズは、WAV形式に変換する際のサンプリングレートや量子化ビットレートの設定にもよりますが、音質は、ほぼオリジナルを維持でき、データサイズは、1分当たり10MB~30MBで、下記に紹介している圧縮された音声形式と比較すると大きめです。
ちなみに、WAVファイル内には、アーティスト名・作成年・曲名等の情報や、ジャケット写真、歌詞をメタデータとして埋め込むことができ、以降で紹介しているすべての音声形式でも同じようにメタデータを埋め込むことができます。
AIFF
AIFF(Audio Interchange File Format)は、Appleが開発した非圧縮の音声形式で、Mac環境でよく利用されています。
音質やデータサイズは、AIFF形式に変換する際のサンプリングレートや量子化ビットレートの設定にもよりますが、音質は、ほぼオリジナルを維持でき、データサイズは、WAV形式と同程度の大きさです。
MP3
MP3(MPEG-1 Audio Layer-3)は、ドイツのフラウンホーファーIISで開発された非可逆圧縮の音声形式で、音楽CDなどの曲をデジタルデータとして取り込む用途で広く普及し、再生可能な機器も多く、最も汎用性の高い音声形式です。
音質やデータサイズは、利用するエンコーダーやビットレート(圧縮率)により大きく異なりますが、データサイズは、WAV形式などの非圧縮の音声形式と比較して約10分の1で、ビットレート256kbps/320kbpsならCD相当の音質を維持できます。
非可逆圧縮は、圧縮前のデータと圧縮・展開を経たデータが完全には一致しないデータ圧縮方式のことを指します。
逆に、可逆圧縮は、圧縮前のデータと圧縮・展開を経たデータが完全に一致するデータ圧縮方法のことを指し、 ロスレス圧縮とも呼ばれます。
AAC
AAC(Advanced Audio Coding)は、MP3の後継とされる非可逆圧縮の音声形式です。
音質は、低ビットレート(128kbps以下)では、MP3よりも音質が良いといわれていますが、高ビットレート(160kbps以上)では、MP3の方が高音質と言われています。
データサイズは、同程度のビットレートであればMP3より若干小さいようです。
FLAC
FLAC(Free Lossless Audio Codec)は、オープンフォーマットの可逆圧縮(ロスレス)の音声形式で、原音からの劣化が無く高音質なことから、現在主流の音声形式といわれています。
また、近年注目されているハイレゾ(高解像度)音源の提供でも利用されています。
データサイズは圧縮率により異なりますが、圧縮レベル5でおおむね非圧縮の音声ファイルの半分ほどです。
オープンフォーマットとは、通常、非営利の標準化団体が管理し、利用が自由で法的な制約もなく、公開されているファイルフォーマットを指しています。
一方、上述のMP3やAACなどは、プロプライエタリフォーマットと呼ばれ、特許権や著作権で保護されており、それらの音声ファイル形式のファイルを作成するようなソフトウェアを開発するメーカーなどは、ライセンス料を支払っています。(なお、MP3については、すでに特許保護期間が終了しています。)
ALAC
ALAC(Apple Lossless Audio Codec)は、Appleが開発した可逆圧縮(ロスレス)の音声形式で、当初はiTunesなどで利用されていましたが、2011年10月からオープンソースになりました。
音質は、原音からの劣化が無く高音質で、データサイズは、おおむね非圧縮の音声形式と比較して3分の2ほどです。
Opus
Opusは、IETF(インターネット技術特別調査委員会)が開発したオープンフォーマットの非可逆圧縮の音声形式です。
あまり聞き馴染みがありませんが、YouTubeやDiscordで採用されており、Windows 10の標準メディアプレイヤー「Grooveミュージック」でも再生できるようです。
音質やデータサイズは、ビットレートにより異なりますが、同一ビットレートならMP3よりも高音質で、特に低ビットレートで音質が高いと言われています。
WMA
WMA(Windows Media Audio)は、Microsoftが開発した非可逆圧縮の音声形式で、近年ではWMA Losslessという可逆圧縮形式も登場しています。
WMAは当初、MP3からの置き換えを目指していましたが、その夢はかなわず、現在はMP3などと比べて汎用性でも劣ることから、利用されるシーンはそれほど多くない印象です。
音質やデータサイズは、ビットレートにより大きく異なりますが、同一ビットレートならMP3よりもデータサイズを抑えることができ、低ビットレート(128kbps以下)なら、MP3よりも音質が良いといわれています。
画像ファイル形式
BMP
BMP(Microsoft Windows Bitmap Image)は、MicrosoftがWindows向けに開発した非圧縮の画像形式で、表現できる色数は一般的にはフルカラー1670万色に対応しています。
BMP形式では、画像データが圧縮されていないため、元画像の再現率が高いですが、データ容量が大きいという特徴があり、Webサイトやメール添付には不向きな画像です。
GIF
GIF(Graphics Interchange Format )は、可逆圧縮の画像形式で、表現できる色数は最大256色に対応しています。
GIF形式は、256色という限られた色にしか対応していないため、おもにアイコンややボタン画像など、使用色数の少ない画像への使用に適した形式で、背景を透明にしたり、動きをつけたアニメーション画像などを作成することもできます。
JPEG
JPEG(Joint Photographic Experts Group)は、非可逆圧縮の画像形式で、表現できる色数はフルカラー1670万色に対応しています。
JPEGは、主に色数の多い写真などの画像に適したファイル形式で、デジタルカメラなどではデフォルトの保存形式となっている場合が多いです。
なお、非可逆圧縮のため、画像の編集/保存を繰り返すと画質が劣化します。
PNG
PNG(Portable Network Graphics)は、可逆圧縮の画像形式で、表現できる色数はフルカラー1670万色に対応しています。
PNGは、GIF形式で実現できる「背景透過」の機能を持ちながら、GIFの「256色」という制限を解消した形式として開発され、イラストや図などを画像形式で保存する際によく利用されます。
なお、可逆圧縮のため、画像の編集/保存を繰り返しても、元の画質を維持できるメリットがありますが、JPEGやGIFに比べて若干データ容量が多いです。
TIFF
TIFF(Tagged Image File Format)は、可逆圧縮の画像形式で、表現できる色数はフルカラー1670万色に対応しています。
TIFFは、名前のとおり、「タグ」と呼ばれる識別子を付けて、複数パターンの画像表現をひとつのファイルとして保存でき、JPEG形式よりは滑らかな画質で撮影でき、高解像度が必要なプロ用のデジタルカメラや、スキャナーなどでの取り込み時に利用されることがあります。
なお、可逆圧縮のため、画像の編集/保存を繰り返しても、元の画質を維持できるメリットがありますが、データ容量はかなり大きくなります。
SVG
SVG(Scalable Vector Graphics)は、ベクター形式の画像で、画像や文字などの2次元情報が数値として記録されており、ブラウザなどがその場で描画しています。
そのため、拡大縮小で画質が劣化することがなく、アイコンや地図、平面的なイラスト用として使用されることが多いです。
また、SVG形式は、あとから色やサイズの変更が必要になったときに専用の画像ソフトで編集することなく、WebページならCSSでサイズや色を変更でき、アニメーションや透過といった処理も可能です。
WebP
WebPは、Webサイト上の画像をJPEGやPNGなどの従来の形式より高画質のままデータサイズを小さくするために、Googleが開発した画像形式で、可逆圧縮と非可逆圧縮のいずれかを選択できます。
Googleの開発者によると、可逆圧縮されたWebP形式画像のサイズは、PNG形式に比べて最大26%小さくなるということです。
また、WebP形式は、アニメーションや背景の透明化にも対応しています。
AVIF
AVIF(AV1 Image File Format)は、動画圧縮形式の「AV1」と同様の方法で画像を圧縮し、HEIF形式として保存する画像形式で、可逆圧縮と非可逆圧縮のいずれかを選択できます。
AVIFは、従来の画像形式と比較して高い圧縮率を誇っており、同等画質のJPEG形式の画像ファイルと比べて、約95%以上のサイズ削減が可能とも言われており、次世代の画像形式として期待されています。
また、AVIF形式は、アニメーションや背景の透明化、HDR(ハイダイナミックレンジ)カラーにも対応しています。
あとがき
音声ファイルでは、スマホなどの容量の小さいストレージに保存するなら、MP3などの圧縮データがおススメですが、保存領域に余裕があるなら、とりあえずは非圧縮のWAVやAIFFで保存しておいたほうが、高音質だし、あとから必要に応じて変換したりできるので便利です。
画像ファイルでは、WebPやAVIFといった新しい画像形式は、圧縮率も高くファイルサイズもコンパクトにできる反面、汎用性という面ではJPEGやPNGといった従来の形式に劣る部分もあるので、適材適所で使い分けるのが賢明でしょう。