音楽サブスクはどのように空間オーディオを提供しているのか

最終更新日

はじめに

最近、特に Amazon Music や Apple Music が空間オーディオを提供するようになってから、Dolby Atmos や 360 Reality Audio などを利用した楽曲が注目されている。

だが、それらはストリーミングサービスというクローズドな環境で提供される上に、Dolby Atmos に関しては Dolby のプロプライエタリなフォーマットを使用している。

そのため、それらのフォーマットで音楽制作する方法や再生する方法については様々なメディアで解説されているが、制作された音源がどのようにエンコードされ、視聴者のもとへ届けられ、そしてデコードされるかの「間」の部分に関しては、あまり知られていない。

この記事では、音楽サブスクを対象に、今まであまり触れられてこなかった空間オーディオの中間部分について解析し、解説していこうと思う。

サンレコのコラムで当記事が紹介されました。

配信システム

プロトコル

Apple Music では Apple が提唱する HLS (HTTP Live Streaming) が使用されている。一方 Amazon Music では MPEG-DASH (Dynamic Adaptive Streaming over HTTP) が用いられている。MPEG-DASH は単に DASH と呼ばれることも多いため、この記事でも以後 DASH と呼ぶことにする。HLS も DASH も、その名の通り HTTP を用いてメディアファイルをストリーミング配信する規格である。

両技術とも、メディアファイルは一定時間ごとに分割されており、分割された一つ一つのパーツをセグメント、あるいはチャンクと言う。分割することによってファイル全体のダウンロードが完了するのを待つことなく再生を開始することができるし、途中から再生する場合にファイルを冒頭から取得してくる必要もない (もちろんヘッダー情報等は必要ではあるが)。さらに、ネットワークの速度や安定性などに応じて再生中にシームレスにビットレートを切り替える「アダプティブビットレート」も行うことができる。

DASH は HLS よりも新しい規格であるが、DASH 登場以前は Apple の HLS の他にも Microsoft の SS (Smooth Streaming) や Adobe の HDS (HTTP Dynamic Streaming) など、同様のストリーミング規格がいくつか存在していた。DASH はこれらの独自規格をまとめるべく策定された規格であり、ISO/IEC 23009-1 として国際標準となっている。そのため、HLS と DASH は細かな違いはあるものの、大枠はほぼ同じである。

マニフェストファイル

Apple Music で使用される HLS では、1つのメディアにつき2つのマニフェストファイルを用いて再生を制御している。1つはマスタープレイリストやマスターマニフェストなどと呼ばれるもので、もう1つはインデックスファイルと呼ばれるものである。

マスタープレイリストは、名前に「マスター」とあるように、一つ一つのコンテンツ (作品) ごとの各メディアファイル (ステレオの低ビットレート版と高ビットレート版、Dolby Atmos の低ビットレート版と高ビットレート版などなど…) を取りまとめるものであり、「プレイリスト」とあるように各メディアファイルの情報 (コーデック、ビットレート、サンプリング周波数、量子化ビット数、インデックスファイルの URL など) が M3U プレイリスト形式で記述されている。

一方のインデックスファイルは各メディアファイルごとに存在し、メディアファイルの URL、セグメントの再生順、各セグメントの秒数などが記されている。

HLS の再生手順は以下の通り。

  1. クライアント側の再生ソフトが、再生するコンテンツのマスタープレイリストをサーバーから取得する。
  2. 再生機器 (あるいは再生ソフト) が対応しているコーデック、ユーザーの画質/音質設定、ネットワーク状況などをもとに、マスタープレイリストから最適なフォーマットを決定する。
  3. 再生したいメディアファイルのインデックスファイルの URL をマスタープレイリストから読み取り、インデックスファイルを取得する。
  4. インデックスファイルに従い、メディアファイルを取得して再生を行う。

一方 Amazon Music の DASH では、MPD (Media Presentation Description) というマニフェストファイルが使用される。MPD は HLS のマスタープレイリストとインデックスファイルを1つにまとめたようなもので、XML 形式で記述されている。

音源の仕様

マニフェストファイルに記載されているメディアファイルの情報を見やすい形にまとめた。基本的にマニフェストファイルの値そのままを記載しているが、一部の表記は分かりづらいため、分かりやすい表記に変えた上で、()内にオリジナルの値を載せている。

マニフェストファイルには載っていなかったものでも、別の方法で確認できたものも一緒に載せている。ロスレス音声のビットレートは、デコード後のリニア PCM のビットレートである。?が付いているものは、推測値である。

音源仕様に関しては、後で詳しく解説するため、今はすべて理解する必要はない。

ちなみに、Amazon Music では項目名が “audioSamplingRate” “bitDepth” といった一見奇妙な書き方がされているが、これは lowerCamelCase という記法である。

Apple Music の “SAMPLE-RATE” や “BIT-DEPTH” といった記法は、UPPER-KEBAB-CASE や SCREAMING-KEBAB-CASE などと呼ばれる。

Amazon Music – ステレオ

track
Type
AdaptationSet ファイル名
サフィックス
Representation ビット
レート
(kbps)
id selection
Priority
id quality
Ranking
codecs audio
Sampling
Rate
bit
Depth
SD 2 1000 Low 2 3 opus 48000 16 48
Medium 3 2 opus 48000 16 192
High 4 1 opus 48000 16 320
HD 1 2000 HD44 1 4 flac 44100 16 1441
HD48 2 3 flac 48000 16 1536
UHD44 2 0 flac 44100 24 2116
UHD48 2 3 flac 48000 24 2304
UHD96 3 2 flac 96000 24 4608
UHD192 4 1 flac 192000 24 9216

Apple Music – ステレオ

ファイル名
サフィックス
EXT-X-MEDIA:GROUP-ID
EXT-X-STREAM-INF:AUDIO
EXT-X-STREAM-INF EXT-X-MEDIA ビット
レート
(kbps)
CODECS SAMPLE
-RATE
BIT-
DEPTH
ロッシー 64 audio-HE-stereo-64 MPEG-4 HE-AAC v1
(mp4a.40.5)
44100 16 64
128 audio-stereo-128 MPEG-4 AAC LC
(mp4a.40.2)
44100 16 128
256 audio-stereo-256 MPEG-4 AAC LC
(mp4a.40.2)
44100 16 256
ロスレス 1441 audio-alac-stereo-44100-16 alac 44100 16 1441
1536 audio-alac-stereo-48000-16 alac 48000 16 1536
2116 audio-alac-stereo-44100-24 alac 44100 24 2116
2304 audio-alac-stereo-48000-24 alac 48000 24 2304
ハイレゾ
ロスレス
4233 audio-alac-stereo-88200-24 alac 88200 24 4233
4608 audio-alac-stereo-96000-24 alac 96000 24 4608
8467 audio-alac-stereo-176400-24 alac 176400 24 8467
9216 audio-alac-stereo-192000-24 alac 192000 24 9216

Amazon Music – Dolby Atmos

track
Type
AdaptationSet ファイル名
サフィックス
Representation トラック数 ビット
レート
(kbps)
id selection
Priority
id quality
Ranking
codecs audio
Sampling
Rate
bit
Depth
3D 12 3000 ? 0 3 Dolby Digital Plus
(ec-3)
48000 16? 5.1ch 256
? 1 2 Dolby Digital Plus JOC
(ec-3)
48000 16? 16 elements
(5.1ch + JOC)
448
? 2 1 Dolby Digital Plus JOC
(ec-3)
48000 16? 16 elements
(5.1ch + JOC)
768
13 2500 3D_Datmos_Low 0 2 Dolby AC-4 IMS
(ac-4.02.02.00)
48000 16? 2 112
3D_Datmos_Med 1 1 Dolby AC-4 IMS
(ac-4.02.02.00)
48000 16? 2 256

Apple Music – Dolby Audio / Dolby Atmos

ファイル名
サフィックス
EXT-X-MEDIA:GROUP-ID
EXT-X-STREAM-INF:AUDIO
EXT-X-STREAM-INF EXT-X-MEDIA ビット
レート
(kbps)
CODECS SAMPLE
-RATE
BIT-
DEPTH
CHANNELS
Dolby
Audio
448 audio-ac3-448 Dolby Digital
(ac-3)
48000 16 5.1ch
(6)
448
??? audio-ec3-???
audio-eac3-???
Dolby Digital Plus
(ec-3)
48000 16 7.1ch
(8)
???
Dolby
Atmos
2448 audio-atmos-2448 Dolby Digital Plus JOC
(ec-3)
48000 16 16 elements
(7.1ch + JOC)
(16/JOC)
448
2768 audio-atmos-2768 Dolby Digital Plus JOC
(ec-3)
48000 16 16 elements
(7.1ch + JOC)
(16/JOC)
768

Amazon Music – 360 Reality Audio

track
Type
AdaptationSet ファイル名
サフィックス
Representation オブジェクト数 ビット
レート
(kbps)
id selection
Priority
id quality
Ranking
codecs audio
Sampling
Rate
bit
Depth
3D 11 3000 3D_S360RA_L0 0 4 MPEG-H 3D Audio (Low Complexity Profile / Level 2)
(mha1.0x0c)
48000 24 5 320
3D_S360RA_L1 1 3 MPEG-H 3D Audio (Low Complexity Profile / Level 3)
(mha1.0x0d)
48000 24 10 640
3D_S360RA_L2 2 2 MPEG-H 3D Audio (Low Complexity Profile / Level 3)
(mha1.0x0d)
48000 24 16 1024
3D_S360RA_L3 3 1 MPEG-H 3D Audio (Low Complexity Profile / Level 4)
(mha1.0x0e)
48000 24 24 1536

Apple Music – 空間オーディオ共通

ファイル名
サフィックス
EXT-X-MEDIA:GROUP-ID
EXT-X-STREAM-INF:AUDIO
EXT-X-STREAM-INF EXT-X-MEDIA ビット
レート
(kbps)
CODECS SAMPLE
-RATE
BIT-
DEPTH
CHANNELS
バイ
ノーラル
64_bm audio-HE-stereo-64-binaural MPEG-4 HE-AAC v1
(mp4a.40.5)
44100? 16? 2.0ch
(2/-/BINAURAL)
64
128_bm audio-stereo-128-binaural MPEG-4 AAC LC
(mp4a.40.2)
44100? 16? 2.0ch
(2/-/BINAURAL)
128
256_bm audio-stereo-256-binaural MPEG-4 AAC LC
(mp4a.40.2)
44100? 16? 2.0ch
(2/-/BINAURAL)
256
ダウン
ミックス
64_dm audio-HE-stereo-64-downmix MPEG-4 HE-AAC v1
(mp4a.40.5)
44100? 16? 2.0ch
(2/-/DOWNMIX)
64
128_dm audio-stereo-128-downmix MPEG-4 AAC LC
(mp4a.40.2)
44100? 16? 2.0ch
(2/-/DOWNMIX)
128
256_dm audio-stereo-256-downmix MPEG-4 AAC LC
(mp4a.40.2)
44100? 16? 2.0ch
(2/-/DOWNMIX)
256

セグメントとコンテナ

インデックスファイルや MPD を見てみると、Apple Music のロスレスや空間オーディオの楽曲は約15秒ごと (ロッシーは不明)、Amazon Music の楽曲は約10秒ごとのセグメントに分割されているということが分かった。分割された音声は、両サービスとも単一のファイルでセグメント化されたデータを扱うことが可能な fMP4 (fragmented MP4) コンテナに格納されている。

15秒といえば、Apple Music がロスレスと空間オーディオでの配信を始めた辺りから「曲が15秒しか再生されないことがある」という不具合を目にするようになった。恐らく fMP4 のセグメント間の結合になにか不具合が生じていたのだろうと推測できる。最初の15秒のセグメントが再生されたあとに DRM 関係の処理が入っていることから、そこで問題が起きていたのかもしれない。

なお、現在この問題は iOS 14.7 / iPadOS 14.7 のアップデートで解消済みとしている。が、それでもまだ発生するという報告も上がっている。一旦は治ったものの、iOS 15 / iPadOS 15 で再発したという人もいる。

iOS 14.7には、iPhone用の以下の機能改善とバグ修正が含まれます:

・Apple Musicのロスレスオーディオとドルビーアトモスの再生が予期せず停止することがある問題

iOS 14 のアップデートについて – Apple サポート (日本)

iPadOS 14.7には、iPad用の以下の機能改善とバグ修正が含まれます:

・Apple Musicのロスレスオーディオとドルビーアトモスの再生が予期せず停止することがある問題

iPadOS 14 のアップデートについて – Apple サポート (日本)

DRM

Amazon Music の MPD には、DRM として Microsoft PlayReady を使用していることが明記されている。一方 Apple Music は何を使用しているのかは分からないが、Apple は独自で FairPlay という DRM 技術を持っているので、恐らくそれが使用されているものと思われる。

ステレオ

ステレオのロッシー音源は、Apple Music は 44.1kHz の AAC、Amazon Music は 48kHz の Opus となっている。

なぜ Amazon Music がわざわざ 44.1kHz の音源を 48kHz で配信しているのかというと、Opus が基本的に 48kHz のみの対応となっているためだ。

一般的に、ソースが 44.1kHz である場合でも、デコーダーは 48kHz で出力することが望ましいという点に注意してください。なぜなら多くのサウンドカードは 48 kHz の再生しかサポートしていないため、(エンコード時に 48kHz にリサンプリングしておくことで) 再生時にリサンプリングせずに済みます。その上、安価なオーディオインターフェイスの多くは 44.1kHz 出力の品質が低いです。

SoX、libspeexdsp、libsamplerate などの適切なリサンプラーによる音質の劣化は、圧縮効率が最も優れたロッシーコーデックを最高のビットレートで使用した時の劣化よりも、はるかに小さいです。優れた 44.1kHz ↔ 48kHz リサンプラーによる音質の劣化を許容できない場合は、そもそもロッシーコーデックを使用すべきではありません。

1つの内部サンプリング周波数のみをサポートする利点として、SILK を使用した効率的な音声圧縮やリアルタイムアプリケーションなど、Opus が多くの機能をサポートできる点が挙げられます。また、1つの構成にすべての品質チューニング作業を費やすことができるため、より高い音質を実現することもできます。

OpusFAQ – XiphWiki から抜粋、一部再構成、翻訳

両サービス共に 88.2kHz 以上の 16bit 音源が存在するのかは不明。Amazon Music においては、88.2kHz の音源は 48kHz へ、176.4kHz の音源は 96kHz へ、それぞれダウンコンバートして配信されている。これは FLAC の仕様ではなく、単に Amazon がそういった運用をしているだけである。

Amazon Music のリサンプリングをまとめると、以下のようになる。

  • ロッシー
    • 44.1kHz → 48kHz (Opus の仕様)
  • ロスレス
    • 88.2kHz → 48kHz (Amazon Music の仕様)
    • 176.4kHz → 96kHz (Amazon Music の仕様)

Apple Music においては、ハイレゾロスレス (88.2kHz / 24bit 以上) の音源は、48kHz / 24bit の (世間一般にはハイレゾだが Apple 的には) 非ハイレゾのロスレス音源と、44.1kHz / 16bit のロッシー音源も提供されている。

一方 Amazon Music においては、Ultra HD (44.1kHz / 24bit 以上) の音源は、その曲のスペック未満のフォーマットがほぼすべて用意されている。「ほぼ全て」と書いたのは、元が 44.1kHz / 24bit でない音源は、44.1kHz / 24bit の音源は用意されないためである。例えば元が 192kHz / 24bit 音源の場合、ロスレスの 192kHz / 24bit、96kHz / 24bit、48kHz / 24bit、44.1kHz / 16bit、及びロッシーの 48kHz / 16bit の音源が用意される。

Dolby Audio

Dolby Audio とは

Apple Music の空間オーディオと言えば Dolby Atmos だけだと思われがちだが、ごく少数ながらも 5.1ch や 7.1ch で配信されているものもある。「ドルビーオーディオ」と表示されている楽曲がそれである。

ドルビーオーディオは、ドルビー5.1および7.1を含むサラウンドサウンド形式です。

ただし、ステレオ版しか配信していないのになぜか Dolby Audio ロゴが表示されるものもあるため、注意が必要だ (詳細は後述)。

なお、Apple Music にて Dolby Audio で配信されている楽曲は、確認した限りAmazon Music ではステレオまたは 360 Reality Audio での配信となっていた。Amazon Music は Dolby Atmos の楽曲を 5.1ch ダウンミックスで配信していたりはするが、どうやらもともと 5.1ch の楽曲はステレオでしか配信していないようだ。

逆に、Apple Music はまだ 360 Reality Audio に対応していないので、Amazon Music には 360 Reality Audio を、Apple Music にはその 5.1ch ダウンミックスを納品する、という例もあるようだ。すべての 360 Reality Audio の楽曲がそうなっているというわけではなく、むしろ Amazon Music では 360 Reality Audio、Apple Music ではステレオのみ、という場合のほうが多い。


Dolby Audio とは、Dolby Atmos 関連や Dolby Voice 関連以外のほぼすべての Dolby の音響技術を総称したブランドである。

Dolby Audio に含まれる主な技術の例としては、

  • 音声符号化技術
    • Dolby Digital (AC-3)
    • Dolby Digital Plus (E-AC-3)
    • Dolby AC-4
    • Dolby TrueHD
  • マトリックスエンコード / デコード技術、アップミックス技術
    • Dolby Stereo
    • Dolby Stereo SR
    • Dolby Surround (旧)
    • Dolby Pro Logic
    • Dolby Pro Logic II
    • Dolby Pro Logic IIx
    • Dolby Pro Logic IIz
  • バーチャルサラウンド技術
    • Dolby Headphone
    • Dolby Virtual Speaker
  • ノイズリダクション技術
    • Dolby A
    • Dolby B
    • Dolby C
    • Dolby SR
    • Dolby S
  • PC やスマホ等の音質向上技術
    • Dolby PCEE
    • Dolby Mobile
    • Dolby Digital Plus (for mobile devices)
    • Dolby Audio (for mobile devices)

などがある。

このように Dolby の音響技術があまりにも多くなったので、Dolby Atmos に対応する製品には Dolby Atmos のロゴのみを、Dolby Atmos には対応しないが Dolby Audio に含まれる音響技術のいずれかに対応する場合は Dolby Audio のロゴのみを付与するように定められた。

Apple Music だけでなく、非 Dolby Atmos の Dolby Digital (Plus) や Dolby TrueHD を採用する BD (BDMV) や UHD BD 等においても、ロゴはそれぞれのコーデックのロゴではなく Dolby Audio ロゴを表示するよう定められた。

1. DTS-HD MA (96kHz/24bit) 2chステレオ
2. DTS-HD MA (48kHz/24bit) 5.1chサラウンド
3. Dolby ATMOS

ただし Dolby Atmos 採用作品の場合は、Dolby Atmos 非対応環境で視聴した場合は 5.1ch 〜 7.1ch ダウンミックスになってしまう (理由は後述) ためか、あるいは BDMV や UHD BD のDolby TrueHD には互換用の Dolby Digital (AC3 Core などと呼ばれる) が付属しているためか、Dolby Atmos ロゴと Dolby Audio ロゴの両方が表示されることもあるが、このあたりはメーカーによる。

Dolby Audio や Dolby Atmos というブランドには様々な分野の音響技術がまとめられている。Dolby Audio と Dolby Atmos の違いについて「Dolby Audio は 5.1ch や 7.1ch 等で、Dolby Atmos は天井からも音が鳴らせるもの」や「Dolby Audio はスマホや PC の高音質化技術で、Dolby Atmos は映画館等で使われるサラウンド技術」などと言われるが、それらはごく一部分に過ぎない。Dolby Atmos と Dolby Audio の違いは「Dolby Atmos 関連の音響技術か、そうでないか」である。

長々と書いたが、Apple Music に限って言えば、Dolby Audio は 5.1ch や 7.1ch のサラウンド音声という認識で構わない。

Dolby Audio のコーデック

Apple Music の Dolby Audio (抜粋)

Apple Music にて 5.1ch で配信されている楽曲は、マスタープレイリストを参照するとコーデックは ac-3 となっている。

ファイル名
サフィックス
EXT-X-MEDIA:GROUP-ID
EXT-X-STREAM-INF:AUDIO
EXT-X-STREAM-INF EXT-X-MEDIA ビット
レート
(kbps)
CODECS SAMPLE
-RATE
BIT-
DEPTH
CHANNELS
448 audio-ac3-448 Dolby Digital
(ac-3)
48000 16 5.1ch
(6)
448
??? audio-ec3-???
audio-eac3-???
Dolby Digital Plus
(ec-3)
48000 16 7.1ch
(8)
???

AC-3 とは Audio Code number 3 の略で、Dolby の3番目の音声符号化技術である Dolby Digital のことを指す。AC-3 は技術的な名称、Dolby Digital はマーケティング用の名称、という立ち位置になっている。

Dolby Digital はロッシー圧縮のコーデックで、最大 5.1ch、48kHz / 16bit、640kbps まで対応している。Apple Music の Dolby Digital は 448kbps となっているが、これはちょうど DVD-Video における Dolby Digital 音声の制限と一致している。

ディスクの物理的な容量やアプリケーションフォーマットの仕様に縛られる円盤メディアと違って、ネット配信では 448kbps に制限する理由も特になく、640kbps 程度なら問題なくストリーミングできるはずなのだが…。

Dolby Digital (AC-3) には後継規格の Dolby Digital Plus (Enhanced AC-3) が存在している。Dolby Digital Plus は、基本的には (*) Dolby Digital よりも圧縮効率がよく高音質なためか、Netflix や Amazon Prime Video などの大手動画ストリーミングサービスの 5.1ch 音声では専ら Dolby Digital Plus が用いられている。

補足

* 少なくともネット配信においては BDMV のように Dolby Digital Plus の Independent Substream を Dolby Digital にする理由も特に無く、5.1ch でもちゃんと Dolby Digital Plus になっているはずなので

てっきり Apple Music も 5.1ch は Dolby Digital Plus で配信しているものだと思っていたので、Dolby Digital だと分かったときは驚いた。

7.1ch で配信されている楽曲は存在が確認できてないが、Dolby Digital は規格上 5.1ch までしか対応していないこと、及び Dolby AC-4 や Dolby TrueHD は iPhone や iPad などが対応していないことから、おそらく Dolby Digital Plus で配信されるものと思われる。

Dolby Atmos and Dolby Audio playback supports Dolby Digital Plus JOC, Dolby Digital Plus, Dolby Digital.

Dolby Audio Apple iOS Device Support Dolby Developer | Dolby Developer

Dolby Digital は 48kHz / 16bit まで、Dolby Digital Plus は 48kHz / 20bit までしか対応してないため、Apple 基準のハイレゾ (88.2kHz 以上) には対応していない。そしてどちらもロッシーコーデックである。

Dolby TrueHD を使用すれば、Dolby Audio 音源を最大 192kHz / 24bit のハイレゾロスレスで提供できるのだが、現状 iPhone にも iPad にも Apple TV にも Android 端末にも Dolby TrueHD デコーダーは載っていないため、すぐには難しいだろう。

iPhone XR / XSシリーズがアップデートで Dolby Atmos に対応したときのように、Apple がその気になれば Apple 製品にはデコーダーが載ることがあるのかもしれないが…。


なお、Dolby Atmos に対応している Android 端末であれば Dolby Digital デコーダーや Dolby Digital Plus デコーダーは必ず載っているのだが、現在 Android 版 Apple Music は Dolby Atmos に対応した 3.6.0 以来、執筆時点で最新の 3.7.2 でも未だに Dolby Audio 非対応となっている。

Dolby Atmos のストリーミング設定やダウンロード設定をオンにしても、Dolby Audio で配信されている楽曲はステレオ版しか降ってこない。アルバム詳細ページ等に Dolby Audio のロゴも表示されない。今後のアップデートでの改善に期待したい。

Dolby Audio の謎

Apple Music の Dolby Audio には色々謎がある。Apple Music の Dolby Audio、特に 7.1ch 音源のコーデックやビットレートについて知りたいのだが、Apple Music にはただでさえ Dolby Audio コンテンツが少ない上に、偽 Dolby Audio も多く、混沌としている。

① Dolby Atmos で配信されているものの、一時的に Dolby Audio 表記になるパターン

再生直後は Dolby Audio 表記になり、何度か再生し直したり、時間をおいて再生し直しているうちに Dolby Atmos 表記になるパターン。現状 iOS / iPadOS 版でのみ確認している。

このパターンの奇妙な点は、マスタープレイリストを確認しても、Dolby Atmos で配信されている楽曲は Dolby Audio では配信されていないというところだ。にも関わらず、アプリ上では Dolby Audio のロゴが表示されている。

おそらくだが、これは状況的に考えて、Dolby Atmos 版の低ビットレート版という立ち位置のバイノーラル版を再生している際に表示されるものではないかと思われる。

バイノーラル版は、Apple Music の Dolby Atmos や Dolby Audio の音声にのみ存在しているオプションである。

ファイル名
サフィックス
EXT-X-MEDIA:GROUP-ID
EXT-X-STREAM-INF:AUDIO
EXT-X-STREAM-INF EXT-X-MEDIA ビット
レート
(kbps)
CODECS SAMPLE
-RATE
BIT-
DEPTH
CHANNELS
64_bm audio-HE-stereo-64-binaural MPEG-4 HE-AAC v1
(mp4a.40.5)
44100? 16? 2.0ch
(2/-/BINAURAL)
64
128_bm audio-stereo-128-binaural MPEG-4 AAC LC
(mp4a.40.2)
44100? 16? 2.0ch
(2/-/BINAURAL)
128
256_bm audio-stereo-256-binaural MPEG-4 AAC LC
(mp4a.40.2)
44100? 16? 2.0ch
(2/-/BINAURAL)
256

これは、デコード、レンダリング、バーチャライズといった、本来ユーザー側の機器で行うべき処理を Apple 側で事前処理しておき、処理済みの 2.0ch ステレオ音声を配信することでビットレートを抑えようというものだ。

最終的に耳に入るものだけを考えると、Apple 側で事前処理して配信するのと、再生時にユーザー側で処理するのは何が違うんだ、という気もする (ダイナミックヘッドトラッキングが行えない、AV アンプやサウンドバーと接続してもマルチチャンネル出力ができない、などの制約はあるにはあるが)。

しかし、Dolby Atmos 音声をもとにバイノーラル処理された AAC 音声を提供されて、それを Dolby Atmos と認めるか、と言われれば、Dolby のライセンス的に問題がありそうな気がしないでもない (ただの推測でしか無いが)。

それなら Dolby Audio を名乗っても良いのか、という疑問は残るが、Dolby Audio というブランドは Dolby の何らかの技術を使用していれば名乗れるブランドなので、可能性としてなくはない。

なお、このバイノーラル音声はただのステレオの AAC のため、Dolby Atmos や Dolby Audio に非対応な端末でも空間オーディオを体験することができるのだが、現状 Dolby Atmos / Dolby Audio 非対応端末にはバイノーラル音声も提供していないようである。


バイノーラル版というと、Apple Music では Dolby Atmos 版をダウンロードすると低ビットレート版 (バイノーラル版のことを言っている?) が降ってくるという情報がある。(ただし誤字で EAC3 でなく AC3 となっているが。)

ドルビーアトモスによる空間オーディオには、2種類のバージョンがあるようだ。ひとつはAC3で配信される “フル・アトモス” 版。配信ビットレートが768kbpsと高いため、主にApple TVやMac、iPhone/iPadの内蔵スピーカーを使って、Wi-Fi環境で楽しむことが想定されている。

もうひとつがiPhone/iPad、Apple TVなどのデバイスに、ワイヤレスヘッドホン/イヤホンをペアリングして聴くことを想定した低ビットレートバージョンだ。こちらのバージョンのドルビーアトモス空間オーディオコンテンツは、iPhoneやiPadにダウンロード(キャッシュ)し、オフライン再生も楽しめる。

Apple Musicの空間オーディオは2種類、サウンドバーでも再生可能。6月からの進化(後編) – PHILE WEB

しかし、iPhone 12 (iOS 14.6) でログを取得しながら Apple Music の Dolby Atmos 音声をダウンロードして AirPods Pro で再生してみたところ、この記事で言うところの「”フル・アトモス”版 (詳細は後述)」 が再生されていた。もちろんストリーミング再生でも、ネットワークが早くて安定していれば、これが再生される。

activeFormat:
  tier:     Spatial;
  bitrate:  768kbps;
  groupID:  audio-atmos-2768;
  codec:    ec+3;
  channels: 16;
  layout:   9.1.6;
  spatialized;
  multichannel;

Dolby Audio に関しても、ちゃんと 5.1ch で 448kbps の Dolby Digital だった。

activeFormat:
  tier:     Spatial;
  bitrate:  448kbps;
  groupID:  audio-ac3-448;
  codec:    ac-3;
  channels: 6;
  layout:   5.1;
  multichannel;

更に、Android 版 Apple Music 3.6.0 ~ 3.7.1 で Dolby Atmos 音源をダウンロードしても、やはり「”フル・アトモス”版」が落ちてきた。


② Dolby Audio 表記があるものの、実際にはステレオでしか再生されないパターン

アルバムには Dolby Audio 表記があるものの、再生時にはステレオ版でしか再生されないというパターン。こちらも現状 iOS / iPadOS 版でのみ確認している。サントラを中心に目撃例が増えている。

これは単に Dolby Audio よりもロスレスのほうが優先されてしまっている、という話ではなく、そもそもマスタープレイリストを見てもステレオ版しか存在していないといったもの。単なる表示バグなのではないかと思われる。

③ 海外では Dolby Audio で配信されているものの、日本ではステレオ版しか配信されていないパターン

https://twitter.com/KevinTruWhite/status/1425156764161429504

「この曲が Dolby Audio で配信されている」という情報の中には Dolby Atmos のことを Dolby Audio と表記していたり、パターン①の状態だったりすることもあるのだが、そもそも日本では Dolby Audio でも Dolby Atmos でも提供されておらず、マスタープレイリストにもステレオ版しか載っていない、といったもの。

特定の楽曲が一部の国では配信されていないということはたまにあるのだが、空間オーディオ版が一部の国に限られているのは謎である。

Dolby Atmos

ドルビーアトモスは、サウンドが頭上を含むあらゆる方向から流れ、臨場感あふれるオーディオ体験を実現します。

まずはじめに断っておくが、Dolby Atmos 自体はコーデックではない。Dolby Atmos は Dolby Digital / Digital Plus や Dolby TrueHD 等の進化版ではなく、5.1ch や 7.1ch の進化版のようなものだと捉えていただきたい。

Dolby Atmos は、7.1ch に天井スピーカーを2本追加した 7.1.2ch のベッドと呼ばれるチャンネルベースの音声トラックをベースに、最大118個の音声オブジェクトを配置することができる、イマーシブサウンドのフォーマットである。Dolby Atmos だけでなく DTS:X や 360 Reality Audio に関しても、これらはあくまでイマーシブサウンドのフォーマット名であり、コーデックの名称ではない。

*イマーシブサウンド: 音で前後左右を取り囲むサラウンドに加え、上下方向の音も再現できる没入型 (= immersive) の立体音響のこと。ただし Dolby Atmos は下方向の表現はできない。

補足

細かいことを言えば、チャンネルベースオーディオ自体スピーカー配置で定義される位置情報を持つ静的な音声オブジェクトの集合体であるとも言えるのだが、ここでは一般的な定義として、制作時には OAMD (Object Audio Metadata) を用いて音声オブジェクトの位置を規格の範囲内で (例: Dolby Atmos は水平方向と上方向の再現は可能だが下方向は不可) 自由に指定でき、再生時にはメタデータとスピーカー構成をもとに OAR (Object Audio Renderer) が音声オブジェクトのレンダリングを行うものを、オブジェクトオーディオと呼ぶことにしている。


Dolby Atmos でミキシングされた音声がどのコーデックで届けられるかは用途により異なる。

映画館のデジタル上映用の素材 (DCP) では非圧縮のリニア PCM で記録される。一方家庭用 Dolby Atmos においては、BD (BDMV) や UHD BD 等では主にロスレス圧縮の Dolby TrueHD が、ストリーミングでは主にロッシー圧縮の Dolby Digital Plus (Enhanced AC-3) や Dolby AC-4 が、テレビ放送等では主にロッシー圧縮の Dolby AC-4 が使用されている。

なお、Dolby Atmos Music は単なるブランドで、技術やコーデック自体は映画で用いられる Dolby Atmos をそのまま音楽に流用しているだけのため、音声の仕様は映画に使用する場合でも音楽に使用する場合でも変わらない。

Apple Music の Dolby Atmos は、コーデックとして Dolby Digital Plus (Enhanced AC-3) のみ使用されている。一方 Amazon Music では、Echo Studio やサウンドバー等では Dolby Digital Plus (Enhanced AC-3) が、スマホやタブレットではその後継の Dolby AC-4 が使用されている。

Dolby Atmos は Dolby TrueHD を使用することで、最大 48kHz / 24bit のロスレスで提供できる (96kHz 以上は不可なので Apple 基準でのハイレゾは現状非対応) のだが、Dolby TrueHD デコーダーを搭載した スマホやタブレットは現状存在してしない。

Dolby Atmos のマスターファイルは 96kHz で記録できますが、現在、Dolby Atmos を 96kHz で配信する方法はありません。Blu-ray 向けの Dolby TrueHD と、ストリーミング向けの Dolby Digital Plus は、どちらも 48kHz しか対応していないからです。
While you can record Dolby Atmos Master Files in 96K, there is currently no way to dritribute Dolby Atmos in 96k. Because both Dolby TrueHD (Blu Ray) and Dolby Digital Plus (Streaming) only support 48k.

96K を自分なりに翻訳

Dolby Atmos (Dolby Digital Plus JOC)

Dolby Digital Plus をコンテナにした Dolby Atmos は以下のようにいくつか呼称が存在している。

  • Dolby Atmos in Dolby Digital Plus (略称: Dolby Atmos in Digital Plus / Dolby Atmos in DD+ / Atmos in DD+)
  • Dolby Digital Plus with Dolby Atmos (略称: Dolby Digital Plus with Atmos / DD+ with Dolby Atmos / DD+ with Atmos)
  • Dolby Digital Plus JOC (略称: DD+ JOC / DD+JOC)
  • Enhanced AC-3 with Joint Object Coding (略称: E-AC-3 with JOC / E-AC-3 JOC / EAC3 JOC / EAC3-JOC / EAC3_JOC / EC3_JOC / ec+3 などなど…)

この記事では以降 Dolby Digital Plus JOC と呼ぶことにする。


Amazon Music の Dolby Atmos (Dolby Digital Plus JOC) (抜粋)

Echo Studio やサウンドバー等に対してのみ、このフォーマットで提供している。スマホやタブレットに対しては、後述する Dolby AC-4 IMS というフォーマットで提供している。

5.1ch にダウンミックスしたものも配信されているが、おそらくネットワークの品質が悪いときに利用されるのだろう。

track
Type
AdaptationSet ファイル名
サフィックス
Representation トラック数 ビット
レート
(kbps)
id selection
Priority
id quality
Ranking
codecs audio
Sampling
Rate
bit
Depth
3D 12 3000 ? 0 3 Dolby Digital Plus
(ec-3)
48000 16? 5.1ch 256
? 1 2 Dolby Digital Plus JOC
(ec-3)
48000 16? 16 elements
(5.1ch + JOC)
448
? 2 1 Dolby Digital Plus JOC
(ec-3)
48000 16? 16 elements
(5.1ch + JOC)
768

Apple Music の Dolby Atmos (Dolby Digital Plus JOC) (抜粋)

Dolby Atmos 音声を提供する全てのプラットフォーム (iOS、iPadOS、tvOS、Android) に対して、このフォーマットで提供している。

ファイル名
サフィックス
EXT-X-MEDIA:GROUP-ID
EXT-X-STREAM-INF:AUDIO
EXT-X-STREAM-INF EXT-X-MEDIA ビット
レート
(kbps)
CODECS SAMPLE
-RATE
BIT-
DEPTH
CHANNELS
2448 audio-atmos-2448 Dolby Digital Plus JOC
(ec-3)
48000 16 16 elements
(7.1ch + JOC)
(16/JOC)
448
2768 audio-atmos-2768 Dolby Digital Plus JOC
(ec-3)
48000 16 16 elements
(7.1ch + JOC)
(16/JOC)
768

Apple Music と Amazon Music のトラック数表記に共通で入っている “16” という数字は、家庭用 Dolby Atmos における “Spatial Coding” によるものである。なお Spatial Coding は Dolby の技術であり、Apple の Spatial Audio (空間オーディオ) との直接的な関係はない。

Dolby Atmos は 7.1.2ch のベッドと最大118個のオブジェクトの、合計128トラックを使用できる。DCP は基本的に HDD ごと映画館に納品されるため、容量に余裕がありリニア PCM で記録できている。一方、家庭だと Dolby TrueHD や Dolby Digital Plus 等で圧縮したとしても容量は 7.1ch 等に比べて数段跳ね上がるし、家庭用機器で128トラックの音声を処理するのも DSP 等の性能的に厳しいところがある。

そこで、Amazon Music や Apple Music で使用される Dolby Digital Plus JOC 及び、BD (BDMV) や UHD BD で使用される Dolby TrueHD with Dolby Atmos (MLP FBA 16-ch) では、Spatial Coding が行われる。後述する Amazon Music の Dolby AC-4 IMS では使用されない。

Spatial Coding は、空間的に近い位置にあるベッドとオブジェクトを 11 / 13 / 15 のいずれかのグループ (これを element と呼ぶ) にクラスタリングする技術である。element の数をいくつにするかは、音声にどれだけビットレートを割けるかによる。詳細は こちら

Spatial Coding によってクラスタリングされたベッドとオブジェクトを含むそれぞれの element もまた OAMD (Object Audio Metadata) を持つオブジェクトオーディオである。

Spatial Coding は端的に言うとオブジェクトベースのダウンミックスとも取れるが、Dolby 曰く「何も失われない」そうだ。この辺りは MQA の「ロスレス」のような若干の胡散臭さは正直感じられる。

家庭用のDolby Atmos Homeにおいても「失うものは何一つ無く、この128オブジェクトを再現できる」と説明。

立体音響の「Dolby Atmos」今秋ついに家庭へ。各社AVアンプを体験、モバイル展開も – AV Watch

11 / 13 / 15 の オブジェクト (element) にダウンミックス (?) された後、LFE (Low Frequency Effect) と呼ばれる 0.1ch としてカウントされる低音専用チャンネルを足し合わせ、最終的に12 / 14 / 16 トラックとなる。Amazon Music や Apple Music の “16” という数字は、ここに由来する。

Spatial Coding が施された Dolby Atmos 音源は、LFE を無視すれば完全なオブジェクトベースオーディオにも思えるが、後で紹介する Joint Object Coding により、結局はチャンネルベースオーディオとのハイブリッドとなっている。

element 数ごとに音声のビットレートの下限が定められている。両サービスともに Dolby Atmos (Dolby Digital Plus JOC) の下限が 448kbps となっているのは、16 elements の場合のビットレートの下限が 448kbps だからだ。

The number of elements used by spatial coding is determined by the bit rate of the encode. A bit rate of 384kbps uses 12 elements, while bit rates of 448kbps and above use 16 elements.

Appendix C – Dolby Atmos Delivery Codecs – Dolby Professional Support Learning

一方上限が両サービスとも 768kbps となっているのはあくまで Amazon や Apple による制約であり、Dolby Digital Plus JOC 自体は大元の Dolby Digital Plus の上限である 6144kbps まで使用できる。

The operating range has been increased by allowing data rates spanning 32 kbps – 6.144 Mbps.

[PDF] Introduction to Dolby Digital Plus, an Enhancement to the Dolby Digital Coding System

6144kbps もあれば、ロスレスの Dolby TrueHD による Dolby Atmos (約7000~9000kbps 程度) が見えてくるため、流石に上限まで使うサービスは出てこないとは思うが、Amazon Music や Apple Music より若干ではあるが高いビットレートで Dolby Digital Plus 音声 (それも Dolby Atmos ではなく 5.1ch) を配信するサービスは存在する。

業界最高峰音質『ドルビーデジタルプラス(E-AC3)』

AFLSは『ドルビーデジタルプラス(E-AC3)』を使用しています。 ビットレートを『960kbps』に設定し、音の臨場感をお届けします。

「生音」「音色」にこだわるクラシックアーティストが、あらゆる圧縮コーデックを聴き比べました。 「音の温もり」「音のクリアさ」を感じることができ「まるで真空管を通し、ヴィンテージスピーカーから流れているような」音空間を実感したのが『ドルビーデジタルプラス(E-AC3)』でした。 そしてビットレートを『960kbps』に設定することで、アーテストの「息遣い」「倍音」と生でも聴きとれない生きた音をリアルに感じることができます。

AFLSについて | AFLS

なお、Apple 製品で 2048kbps 以上の Dolby Digital Plus 音声を再生すると、挙動がおかしくなるという問題があったりする。


一方フォーマット名やトラック数表記にある “JOC” とは、Joint Object Coding の略である。

Dolby Digital Plus JOC では、Dolby Atmos 非対応の Dolby Digital Plus 対応機器とも互換性を保つため、Dolby Atmos を 5.1ch 〜 7.1ch にレンダリングしたものをコアとして持っている。そして、Dolby Digital Plus のビットストリームの拡張領域に、Dolby Atmos 用の差分データが記録されている。

コア部分のチャンネル数は 5.1ch にするか 7.1ch にするか、はたまた 6.1ch の Surround EX にするかは自由だが、Apple Music では検証した限りどれも 7.1ch で、Amazon Music ではどれも 5.1ch のようである。

Dolby Atmos 対応機器では、コアと差分データを合体させることで Dolby Atmos の音の再構築が可能となる。これが Joint Object Coding である。一方、Dolby Atmos 非対応の Dolby Digital Plus 対応機器では、差分データを無視しコア部分のみを再生することで、5.1ch ~ 7.1ch での再生が行える。

なお、コア音声にはベッドの天井成分や音声オブジェクトの音を 5.1ch 〜 7.1ch にレンダリング (ダウンミックス) したもの含まれているので、合体前に差分音声の逆相で打ち消す必要がある。逆相は予め差分データに含まれているのか、それとも再生時に差分データを 5.1ch 〜 7.1ch デコードして位相反転してるのかまでは情報がなく分からないが、後者は手間なのでおそらく前者だと思われる。

AVS Forum の The official Dolby Atmos thread (home theater version) ではコア音声はコア音声で、Dolby Atmos 音声はコア音声とは独立して、それぞれ個別に持っているのではないか、と主張する人もいるが、容量がもったいないし、そもそも “Joint” Object Coding という名称なので、恐らくそれはないと思われる。(真相不明)


Joint Object Coding などの詳細については、Dolby 公式サイトで詳しく解説されている。
Appendix C – Dolby Atmos Delivery Codecs – Dolby Professional Support Learning

上記の記事 (付録) を含む一連の解説記事を読むと、Dolby Atmos に対する理解が深まるかもしれない。
Dolby Atmos Music Training – Dolby Professional Support Learning

英語が苦手な方や、「Dolby なんちゃら」がどれだけあるのかを知りたい方にはこの本もおすすめである。個人的にはオブジェクトオーディオの説明が分かりやすく書かれているように感じられた。(ただし一部筆者の Dolby Japan と本国の Dolby Laboratories とで言ってることが違っていたりするので、あくまで入門時の参考程度に…)
ドルビーの魔法 カセットテープからDOLBY ATMOSまでの歩みをたどる | 電子書籍とプリントオンデマンド(POD) | NextPublishing(ネクストパブリッシング)

Joint Object Coding や Spatial Coding については、Dolby があまり情報を公開していない (ライセンスビジネスだしそれはそう) ので、正直まだ分かっていないことも多い。なので、現状はあまり深く考えずに「こんなものがあるんだなぁ」という認識で構わないと思う。

Dolby Atmos (Dolby AC-4 IMS)

一方 Amazon Music でスマホやタブレット向けに Dolby Atmos を提供する際には、Dolby AC-4 IMS というフォーマットが使用される。

Amazon Music の Dolby Atmos (Dolby AC-4 IMS) (抜粋)

track
Type
AdaptationSet ファイル名
サフィックス
Representation トラック数 ビット
レート
(kbps)
id selection
Priority
id quality
Ranking
codecs audio
Sampling
Rate
bit
Depth
3D 13 2500 3D_Datmos_Low 0 2 Dolby AC-4 IMS
(ac-4.02.02.00)
48000 16? 2 112
3D_Datmos_Med 1 1 Dolby AC-4 IMS
(ac-4.02.02.00)
48000 16? 2 256

Dolby AC-4 IMS は、Dolby Digital (AC-3) や Dolby Digital Plus (Enhanced AC-3) の後継となる Dolby AC-4 というコーデックにおける、IMS (Immersive Stereo) というフォーマットのことである。”AC-4 IMS” や “AC4-IMS” などと略されることもある。

主にスマホやタブレットのの内蔵ステレオスピーカーや、ステレオイヤホン / ヘッドホンなどで再生することを目的としている。

IMS では、5.1ch や Dolby Atmos などのマルチチャンネル音声を独自の処理 (詳細不明、マトリックスエンコードの亜種?) で専用の 2.0ch ステレオ音声に変換し、制御用のメタデータと一緒に伝送することにより、ビットレートを減らせるというものである。Dolby AC-4 IMS ではその仕組み上、Spatial Coding も Joint Object Coding も行われない。

The basic principle of IMS
[PDF] Dolby AC-4 Audio Delivery for Next Generation Entertainment Services

Dolby AC-4 IMS はDolby Digital Plus JOC と比較すると、以下のようなメリットがある。

  • ステレオ音声+メタデータなので、サイズが小さい
  • そもそも Dolby AC-4 自体、Dolby Digital Plus や MP3、AAC などと比べて圧縮効率が高い
  • ある程度事前処理されているので処理が軽い (Dolby 曰く Dolby Digital Plus JOC 比で3~4倍)
  • Dolby Atmos の制作ツールではヘッドホンでのバイノーラル再生用の調整が可能なのだが、Dolby AC-4 IMS ではこの調整を反映することができる。

もちろん、逆に Dolby Digital Plus JOC にもメリットもある。

  • 対応端末が多い (現状 iPhone や iPad は AC-4 IMSどころかそもそも AC-4 自体に対応していない。とは言え Android 端末は2018年以降に出た Dolby Atmos 対応機種なら AC-4 に対応しているので、Apple が怠慢なだけとも…)
  • AV アンプやサウンドバーなどに対し、HDMI 等で マルチチャンネル出力が可能 (そもそも今のほとんどの AV アンプやサウンドバーは AC-4 自体に対応していないし、対応したとしても IMS はホームシアター用ではない)
  • バイノーラル再生時に独自の音場エフェクトを掛けることが可能

このあたりは一長一短という感じだ。

特に、バイノーラル用の調整をサポートしたフォーマットは現状 Dolby AC-4 IMS しかないにも関わらず、Apple Music では Dolby Digital Plus JOC のみを使用している上、Apple は iPhone や iPad などで Dolby Digital Plus JOC を独自の “Spartial Audio” レンダラーでヘッドホン再生を行っているため、世界中のレコーディングエンジニアの間で「iPhone と AirPods で Apple Music の Dolby Atmos を聴いたら思ってたのと違う!」という騒ぎが起きている。(詳細 → Why Your Atmos Mix Will Sound Different On Apple Music | Production Expert)

勘違いされがちなのだが、Dolby Atmos のマスターファイルから Dolby AC-4 IMS にエンコードされる際にはバイノーラルのメタデータも使用されるが、ここで生成される 2.0ch 音声自体はまだいわゆるバイノーラル音声 (ヘッドホン用にバーチャライズした音声) ではない。再生機器にヘッドホンを接続した状態で、再生機器側の処理を経て、そこで初めてバイノーラル音声となる。

いわゆるバイノーラル音声や HPL (Head Phone Listening)、DTS Headphone:X、Dolby Headphone や THX Spatial Audio などでエンコードされた音声に関しては、エンコード時点ですでにヘッドホン用の処理が施されているため、スピーカー再生には向かないし、ヘッドトラッキングのような後処理も行えない。

一方、Dolby AC-4 IMS では、2.0ch 音声にも関わらず、Dolby Atmos からのエンコード段階では特定の再生環境向けの処理は行わず (といってもホームシアターで再生できるのかは疑問だが)、再生機器側にて、再生機器の状態に応じて (ヘッドホンが接続されているかどうか、そもそも Dolby Atmos で聴きたいのかステレオで聴きたいのか) 処理を変化させることができる上に、ヘッドトラッキングも行えるという点が、他のフォーマットに対する大きなアドバンテージとなっている。

Dolby AC-4 IMS には様々なメリットがあり、まさにスマホ向けといったフォーマットであるにも関わらず、Apple Music が頑なにそれを採用しない理由は、恐らく独自でバーチャライズの処理をしたいからではないだろうかと推察される。

謎のステレオダウンミックス

Apple Music の Dolby Atmos や Dolby Audio にはステレオダウンミックス版が存在しているのが気になる。

ファイル名
サフィックス
EXT-X-MEDIA:GROUP-ID
EXT-X-STREAM-INF:AUDIO
EXT-X-STREAM-INF EXT-X-MEDIA ビット
レート
(kbps)
CODECS SAMPLE
-RATE
BIT-
DEPTH
CHANNELS
64_dm audio-HE-stereo-64-downmix MPEG-4 HE-AAC v1
(mp4a.40.5)
44100? 16? 2.0ch
(2/-/DOWNMIX)
64
128_dm audio-stereo-128-downmix MPEG-4 AAC LC
(mp4a.40.2)
44100? 16? 2.0ch
(2/-/DOWNMIX)
128
256_dm audio-stereo-256-downmix MPEG-4 AAC LC
(mp4a.40.2)
44100? 16? 2.0ch
(2/-/DOWNMIX)
256

単純なダウンミックスはアーティストの意図とは異なることも多いため、5.1ch や Dolby Atmos で制作された音声でも、ステレオ版はステレオ用に調整されることが多い。

Apple Music においても、Dolby Atmos で提供されている楽曲はオリジナルのステレオミックスも提供されているのだが、なぜかそれとは別でステレオにダウンミックスしたものが含まれている。一体何のために用意されているのだろうか。謎でしかない。

360 Reality Audio

360 Reality Audio (サンロクマル・リアリティオーディオ / 360RA) は、ソニーのオブジェクトベースのイマーシブサウンドのフォーマット (というよりも制作から配信までのソリューション?) である。Dolby Atmos と比べると、「下方向からの音が表現できる」「チャンネルベースのベッドを使用しない、完全なオブジェクトベースオーディオ」といった特徴を持つ。

Amazon Music は 360 Reality Audio を採用しているが、Apple Music では今の所採用されていない。Apple Music は特に Dolby Atmos にこだわっているわけではなく、今後も対応フォーマットの拡充を進めていく予定らしい。

360 Reality Audio も Dolby Atmos 同様それ自体はコーデックではなく、コーデックとしては MPEG-H 3D Audio を使用している。

track
Type
AdaptationSet ファイル名
サフィックス
Representation オブジェクト数 ビット
レート
(kbps)
id selection
Priority
id quality
Ranking
codecs audio
Sampling
Rate
bit
Depth
3D 11 3000 3D_S360RA_L0 0 4 MPEG-H 3D Audio (Low Complexity Profile / Level 2)
(mha1.0x0c)
48000 24 5 320
3D_S360RA_L1 1 3 MPEG-H 3D Audio (Low Complexity Profile / Level 3)
(mha1.0x0d)
48000 24 10 640
3D_S360RA_L2 2 2 MPEG-H 3D Audio (Low Complexity Profile / Level 3)
(mha1.0x0d)
48000 24 16 1024
3D_S360RA_L3 3 1 MPEG-H 3D Audio (Low Complexity Profile / Level 4)
(mha1.0x0e)
48000 24 24 1536

MPEG-H 3D Audio でエンコードされた 360 Reality Audio 音源のことは、360 Reality Audio Music Format と呼ぶ。360 Reality Audio Music Format は3つのレベル (と規格外のレベル1つ) が定義されている。

最大オブジェクト数24個/平均ビット・レート1.5MbpsのLevel 3をはじめ、16個/1MbpsのLevel 2、10個/640kbpsのLevel 1、そして360 Reality Audio Music Format外だが5個/320kbpsのLevel 0.5。

360 Reality Audioの仕組みとコンテンツ制作の方法 – サンレコ 〜音楽制作と音響のすべてを届けるメディア

Amazon Music においては、360 Reality Audio Music Format のレベルはファイル名のサフィックス (接尾語) として記載されている。L0 とはオブジェクト数的に Level 0.5 のことを指しているのだろう。

なお、このレベルは 360 Reality Audio におけるグレードを表すためのものであり、MPEG-H 3D Audio のレベルとは異なる。

Amazon Music や Apple Music の空間オーディオを聴けるスマホやタブレット

Amazon Music では、端末が Dolby Atmos や 360 Reality Audio に対応しているかどうかに関わらずそれらの音源を提供している。そのため、Amazon Music アプリの最新バージョンさえインストールできれば、どんな機種でも空間オーディオを聴くことができる。

なお、2022年1月30日現在、Amazon アプリストアでは Amazon Music の最新版が配信されていないため、Amazon Fire タブレットでは Amazon Music の空間オーディオを聴くことができない。

一方 Apple Music では、Dolby Digital Plus JOC を端末の Dolby Atmos デコーダーに処理させているため、Dolby Atmos 非対応端末では Dolby Atmos の設定項目が現れない。

先程「Dolby Digital Plus JOC は、Dolby Atmos 非対応の Dolby Digital Plus 対応機器とも互換性がある」と述べたが、Apple Music は端末が Dolby Digital Plus JOC に対応しているかどうかを見て Dolby Atmos 音声の提供有無を決めているようだ。そのため、モバイル版 Dolby Audio 対応端末やモバイル版 Dolby Digital Plus 対応端末などでは、Apple Music において Dolby Atmos 音源を聴くことはできない。

実際、Dolby Audio に対応している arrows NX F-01J (Android 7.1.1) 及び arrows NX F-01K (Android 9) で検証したところ、Dolby Atmos の設定は現れなかった。なお、arrows NX F-01J は本来 Dolby Digital と Dolby Digital Plus にしか対応していないにもかかわらず、何故か最新ファームウェアでは Dolby Digital Plus JOC 対応を騙っているので、本体のアップデートを行うことで Apple Music の Dolby Atmos が聴けてしまう。

左: arrows NX F-01J (Dolby Audio 対応)
中: arrows NX F-01K (Dolby Audio 対応)
右: Xperia 1 II XQ-AT42 (Dolby Atmos 対応)

Dolby Atmos や Dolby Audio に対応しているスマホやタブレットについては、以下の記事でまとめてある。


井戸水

ガジェットやオーディオビジュアルが好きな人。

3件のフィードバック

コメントを残す…