音声ファイルの形式ってメジャーどころだけでもいくつかありますが、どんな特徴があるのかいまいち自分で整理できていなかったので、自分への備忘録として、よく利用されている音声形式の特徴を、ざっくりとですがまとめてみました。
特徴をざっくりとでも理解しておけば、どんな時にどんな音声形式が適しているか判断しやすくなりますよ。

目次
WAV (RIFF waveform Audio Format)
WAV(またはWAVE)は、MicrosoftとIBMが開発した非圧縮の音声形式で、Windows環境でよく利用されています。
音質やデータサイズは、WAV形式に変換する際のサンプリングレートや量子化ビットレートの設定にもよりますが、音質は、ほぼオリジナルを維持でき、データサイズは、1分当たり10MB~30MBで、下記に紹介している圧縮された音声形式と比較すると大きめです。
ちなみに、WAVファイル内には、アーティスト名・作成年・曲名等の情報や、ジャケット写真、歌詞をメタデータとして埋め込むことができ、以降で紹介しているすべての音声形式でも同じようにメタデータを埋め込むことができます。
AIFF (Audio Interchange File Format)
AIFFは、Appleが開発した非圧縮の音声形式で、Mac環境でよく利用されています。
音質やデータサイズは、AIFF形式に変換する際のサンプリングレートや量子化ビットレートの設定にもよりますが、音質は、ほぼオリジナルを維持でき、データサイズは、WAV形式と同程度の大きさです。
MP3 (MPEG-1 Audio Layer-3)
MP3は、ドイツのフラウンホーファーIISで開発された非可逆圧縮の音声形式で、音楽CDなどの曲をデジタルデータとして取り込む用途で広く普及し、再生可能な機器も多く、最も汎用性の高い音声形式です。
音質やデータサイズは、利用するエンコーダーやビットレート(圧縮率)により大きく異なりますが、データサイズは、WAV形式などの非圧縮の音声形式と比較して約10分の1で、ビットレート256kbps/320kbpsならCD相当の音質を維持できます。
非可逆圧縮は、圧縮前のデータと圧縮・展開を経たデータが完全には一致しないデータ圧縮方式のことを指します。
逆に、可逆圧縮は、圧縮前のデータと圧縮・展開を経たデータが完全に一致するデータ圧縮方法のことを指し、 ロスレス圧縮とも呼ばれます。
AAC (Advanced Audio Coding)
AACは、MP3の後継とされる非可逆圧縮の音声形式です。
音質は、低ビットレート(128kbps以下)では、MP3よりも音質が良いといわれていますが、高ビットレート(160kbps以上)では、MP3の方が高音質と言われています。
データサイズは、同程度のビットレートであればMP3より若干小さいようです。
FLAC (Free Lossless Audio Codec)
FLACは、オープンフォーマットの可逆圧縮(ロスレス)の音声形式で、原音からの劣化が無く高音質なことから、現在主流の音声形式といわれています。
また、近年注目されているハイレゾ(高解像度)音源の提供でも利用されています。
データサイズは圧縮率により異なりますが、圧縮レベル5でおおむね非圧縮の音声ファイルの半分ほどです。
オープンフォーマットとは、通常、非営利の標準化団体が管理し、利用が自由で法的な制約もなく、公開されているファイルフォーマットを指しています。
一方、上述のMP3やAACなどは、プロプライエタリフォーマットと呼ばれ、特許権や著作権で保護されており、それらの音声ファイル形式のファイルを作成するようなソフトウェアを開発するメーカーなどは、ライセンス料を支払っています。(なお、MP3については、すでに特許保護期間が終了しています。)
ALAC (Apple Lossless Audio Codec)
ALACは、Appleが開発した可逆圧縮(ロスレス)の音声形式で、当初はiTunesなどで利用されていましたが、2011年10月からオープンソースになりました。
音質は、原音からの劣化が無く高音質で、データサイズは、おおむね非圧縮の音声形式と比較して3分の2ほどです。
Opus
Opusは、IETF(インターネット技術特別調査委員会)が開発したオープンフォーマットの非可逆圧縮の音声形式です。
あまり聞き馴染みがありませんが、YouTubeやDiscordで採用されており、Windows 10の標準メディアプレイヤー「Grooveミュージック」でも再生できるようです。
音質やデータサイズは、ビットレートにより異なりますが、同一ビットレートならMP3よりも高音質で、特に低ビットレートで音質が高いと言われています。
WMA (Windows Media Audio)
WMAは、Microsoftが開発した非可逆圧縮の音声形式で、近年ではWMA Losslessという可逆圧縮形式も登場しています。
WMAは当初、MP3からの置き換えを目指していましたが、その夢はかなわず、現在はMP3などと比べて汎用性でも劣ることから、利用されるシーンはそれほど多くない印象です。
音質やデータサイズは、ビットレートにより大きく異なりますが、同一ビットレートならMP3よりもデータサイズを抑えることができ、低ビットレート(128kbps以下)なら、MP3よりも音質が良いといわれています。
あとがき
たくさんの音声ファイルを、スマホなどの容量の小さいストレージに保存するなら、MP3などの圧縮データがおススメですが、保存領域に余裕があるなら、とりあえずは非圧縮のWAVやAIFFで保存しておいたほうが、高音質だし、あとから必要に応じて変換したりできるので便利です。