音楽サブスクはどのように空間オーディオを提供しているのか
更新履歴
この記事は、一度書いたらそれで終わりではない。公開後も動向を追い続け、新情報があれば、その都度追記や修正を行っている。
主な更新履歴は下記の通り。下記以外にも、細かい修正や文章の見直し等は適宜行っている。
- 2021/08
- 記事公開
- 当初のタイトルは「Apple Music を解析する」
- 2021/08
- 全体的に加筆修正
- Dolby Atmos と Dolby Audio の違いに関する追記
- 2022/01
- Amazon Music について追記
- それに伴いタイトルや記事の構成を変更
- 2022/04
- 「音源の仕様」に Amazon Music と Apple Music の 48kHz / 16bit ロスレス音声について追記
- 2023/05
- 「Dolby AC-4 IMS」に Dolby AC-4 IMS の動作について追記
- 「Dolby AC-4 IMS」に Dolby AC-4 A-JOC / CBI の概要について追記
(現在は「Dolby AC-4 A-JOC と Dolby AC-4 CBI」に移動済み) - 「音源の仕様」「Apple Music の バイノーラル版とダウンミックス版」に Apple Music のダウンミックス版について追記
- 2024/03
- 「音源の仕様」に Apple Music Classical について追記
- 「音源の仕様」「Dolby Digital Plus JOC」「Dolby AC-4 IMS」「360 Reality Audio」に Amazon Music の URL の ql パラメーターについて追記
- 「音源の仕様」「360 Reality Audio」に Amazon Music の 360 Reality Audio の mhm1 について追記
- 「360 Reality Audio」に Amazon Music における 360 Reality Audio のオブジェクト数について追記
- 2024/07:
- 「サービス・プラットフォーム別の音声」の「配信サービスと採用コーデックの一覧」の表を更新
- 2024/09
- 「サービス・プラットフォーム別の音声」の「配信サービスと採用コーデックの一覧」の表において、「AV アンプ・サウンドバー」としていた部分を「Apple TV」「Android TV (Google TV)」「Amazon Fire TV」に分離し
- 「サービス・プラットフォーム別の音声」の「配信サービスと採用コーデックの一覧」の表において、Apple TV では Dolby MAT 2.0 変換出力になることを追記
- 2024/10
- 「サービス・プラットフォーム別の音声」の「配信サービスと採用コーデックの一覧」の表において、モバイル端末とストリーミング端末を分離
- 「サービス・プラットフォーム別の音声」の「配信サービスと採用コーデックの一覧」の表において、Amazon Fire TV でも Dolby MAT 2.0 変換出力になる機種があることを追記
- 「サービス・プラットフォーム別の音声」の「配信サービスと採用コーデックの一覧」の表において、E-AC-3 JOC 表記を DD+ JOC 表記に変更
- 「サービス・プラットフォーム別の音声」の「配信サービスと採用コーデックの一覧」の表において、使用されるバーチャライザー (Dolby / Apple) を明記
- 2024/11
- 「音源の仕様」「Dolby Audio」に Apple Music の Dolby Audio 7.1ch について追記
- 2025/08
- Dolby AC-4 A-JOC / CBI の解説を「Dolby AC-4 A-JOC と Dolby AC-4 CBI」に独立させて加筆修正
- 2025/09
- 「サービス・プラットフォーム別の音声」に、Apple Music の「ドルビーアトモス」設定における「自動」と「常にオン」の挙動について追記
- 上記に伴い、「サービス・プラットフォーム別の音声」の「配信サービスと採用コーデックの一覧」の表を更新
- 「音源の仕様」「Apple Music の バイノーラル版とダウンミックス版」に Apple Music の AAC LC 64kbps について追記
- 2026/02
- Dolby AC-4 Level 4 の普及に伴い、「Dolby AC-4 A-JOC と Dolby AC-4 CBI」を加筆修正
はじめに
最近、特に Amazon Music や Apple Music が空間オーディオを提供するようになってから、Dolby Atmos や 360 Reality Audio 等を利用した楽曲が注目されている。
だが、それらはストリーミングサービスというクローズドな環境で提供される上に、Dolby Atmos に関しては Dolby のプロプライエタリなフォーマットを使用している。
そのため、これらのフォーマットで音楽制作する方法や再生する方法については様々なメディアで解説されているが、制作された音源がどのようにエンコードされ、視聴者のもとへ届けられ、そしてデコードされるかの、「間」の部分に関しては、あまり知られていない。
この記事では、音楽サブスクを対象に、今まであまり触れられてこなかった空間オーディオの中間部分について解析し、解説していこうと思う。
サンレコのコラムで当記事が紹介されました。このコラムへの監修もしています。
なお、「配信サービスと採用コーデックの一覧」については、一部誤りや古い情報が含まれています。最新の表については、記事末尾の「サービス・プラットフォーム別の音声」をご参照ください。
配信システム
プロトコル
Apple Music では、Apple が提唱する HLS (HTTP Live Streaming) が使用されている。一方 Amazon Music では、MPEG-DASH (Dynamic Adaptive Streaming over HTTP) が用いられている。MPEG-DASH は単に DASH と呼ばれることも多いため、この記事でも以降 DASH と呼ぶ。
HLS も DASH も、その名の通り HTTP を用いてメディアファイルをストリーミング配信する規格である。両技術とも、各メディアファイルのビットストリームは一定時間ごとに分割 (フラグメント化) されており、分割された一つ一つのパーツをセグメント、あるいはチャンクと言う。
分割することによってファイル全体のダウンロード完了を待つことなく再生を開始することができ、また、途中から再生する場合にファイルを冒頭から取得してくる必要もない (もちろんヘッダー情報等は必要ではあるが)。
さらに、ネットワークの速度や安定性等に応じて、再生中にシームレスにビットレートを切り替える「アダプティブビットレート」も行うことができる。
DASH は HLS よりも新しい規格で、DASH 登場以前は Apple の HLS の他にも、Microsoft の SS (Smooth Streaming) や Adobe の HDS (HTTP Dynamic Streaming) 等、同様のストリーミング規格がいくつか存在していた。
DASH はこれらの独自規格をまとめるべく策定された規格であり、ISO/IEC 23009-1 として国際標準となっている。そのため、HLS と DASH は細かな違いはあるものの、大枠はほぼ同じである。
マニフェストファイル
Apple Music で使用される HLS では、1 つのメディアにつき、2 つの「マニフェストファイル」と呼ばれるファイルを用いて再生を制御している。1 つは「マスタープレイリスト」や「マスターマニフェスト」と呼ばれるファイルで、もう 1 つは「インデックスファイル」と呼ばれるファイルである。
マスタープレイリストは、名前に「マスター」とあるように、一つ一つのコンテンツ (作品) ごとの各ビットストリーム (ステレオの低ビットレート版と高ビットレート版、Dolby Atmos の低ビットレート版と高ビットレート版等) を取りまとめるもの。
「プレイリスト」とあるように、各ビットストリームの情報 (コーデック、ビットレート、サンプリング周波数、量子化ビット数、インデックスファイルの URL 等) が、M3U プレイリスト形式で記述されている。
インデックスファイルは各ビットストリームごとに存在し、ビットストリームの URL、セグメントの再生順、各セグメントの秒数等が記されている。
HLS の再生手順は以下の通り。
- クライアント側の再生ソフトが、再生するコンテンツのマスタープレイリストをサーバーから取得する。
- 再生機器 (あるいは再生ソフト) が対応しているコーデック、ユーザーの画質/音質設定、ネットワーク状況等をもとに、マスタープレイリストから最適なビットストリームを決定する。
- 再生したいビットストリームのインデックスファイルの URL をマスタープレイリストから読み取り、インデックスファイルを取得する。
- インデックスファイルに従い、ビットストリームを取得して再生を行う。
一方 Amazon Music の DASH では、MPD (Media Presentation Description) というマニフェストファイルが使用される。MPD は HLS のマスタープレイリストとインデックスファイルを 1 つにまとめたようなもので、XML 形式で記述されている。
音源の仕様
マニフェストファイルに記載されているビットストリームの情報を表にまとめた。詳細に関しては、後で詳しく解説するため、今はすべて理解する必要はない。
ファイル名サフィックス、オブジェクト数、ビットレート以外の項目は、マニフェストファイルの値そのままを記載しているため、一部わかりにくい表記が存在する。
Amazon Music では項目名が “audioSamplingRate” “bitDepth” といった一見奇妙な書き方がされているが、これは lowerCamelCase という記法である。Apple Music の “SAMPLE-RATE” や “BIT-DEPTH” といった記法は、UPPER-KEBAB-CASE や SCREAMING-KEBAB-CASE と呼ばれる。
なお、Apple Music Classical は、あくまで UI をクラシックに最適化したアプリであり、音源等は Apple Music のものをそのまま使用している。
Amazon Music – ステレオ
SD
| URL ql パラメーター |
ファイル名 サフィックス |
AdaptationSet | Representation | ビット レート (kbps) |
||
|---|---|---|---|---|---|---|
| selection Priority |
quality Ranking |
codecs | audio Sampling Rate |
|||
| SD_LOW | Low | 1000 | 3 | opus | 48000 | 48 |
| SD_MEDIUM | Medium | 1000 | 2 | opus | 48000 | 192 |
| SD_HIGH | High | 1000 | 1 | opus | 48000 | 320 |
44.1kHz ではなく 48kHz なのは Opus の仕様。
HD
| URL ql パラメーター |
ファイル名 サフィックス |
AdaptationSet | Representation | |||
|---|---|---|---|---|---|---|
| selection Priority |
quality Ranking |
codecs | audio Sampling Rate |
bit Depth |
||
| HD_44 | HD44 | 2000 | 4 | flac | 44100 | 16 |
| HD_48 | HD48 | 2000 | 3 | flac | 48000 | 16 |
| HD_96 | HD96 | 2000 | 2 | flac | 96000 | 16 |
ロスレスのうち、16bit のものはサンプリング周波数に関わらず HD 扱いされる。88.2kHz の音源は 48kHz へ、176.4kHz の音源は 96kHz へ、それぞれダウンコンバートされる。192kHz / 16bit は未発見。
ULTRA HD
| URL ql パラメーター |
ファイル名 サフィックス |
AdaptationSet | Representation | |||
|---|---|---|---|---|---|---|
| selection Priority |
quality Ranking |
codecs | audio Sampling Rate |
bit Depth |
||
| UHD_44 | UHD44 | 2000 | 0 | flac | 44100 | 24 |
| UHD_48 | UHD48 | 2000 | 3 | flac | 48000 | 24 |
| UHD_96 | UHD96 | 2000 | 2 | flac | 96000 | 24 |
| UHD_192 | UHD192 | 2000 | 1 | flac | 192000 | 24 |
ロスレスのうち、24bit のものはサンプリング周波数に関わらず ULTRA HD 扱いされる。88.2kHz の音源は 48kHz へ、176.4kHz の音源は 96kHz へ、それぞれダウンコンバートされる。
Apple Music – ステレオ
ロッシー
| EXT-X-STREAM-INF:AUDIO EXT-X-MEDIA:GROUP-ID |
EXT-X-STREAM-INF | ビット レート (kbps) |
|---|---|---|
| CODECS | ||
| audio-HE-stereo-64 | mp4a.40.5 | 64 |
| audio-stereo-64 | mp4a.40.2 | 64 |
| audio-stereo-128 | mp4a.40.2 | 128 |
| audio-stereo-256 | mp4a.40.2 | 256 |
- mp4a.40.5 = MPEG-4 HE-AAC v1
- mp4a.40.2 = MPEG-4 AAC LC
ロスレス
| EXT-X-STREAM-INF:AUDIO EXT-X-MEDIA:GROUP-ID |
EXT-X-STREAM-INF | EXT-X-MEDIA | |
|---|---|---|---|
| CODECS | SAMPLE -RATE |
BIT- DEPTH |
|
| audio-alac-stereo-44100-16 | alac | 44100 | 16 |
| audio-alac-stereo-44100-24 | alac | 44100 | 24 |
| audio-alac-stereo-48000-16 | alac | 48000 | 16 |
| audio-alac-stereo-48000-24 | alac | 48000 | 24 |
ロスレスのうち、48kHz 以下のものは量子化ビット数に関わらずハイレゾ扱いされない。
ハイレゾロスレス
| EXT-X-STREAM-INF:AUDIO EXT-X-MEDIA:GROUP-ID |
EXT-X-STREAM-INF | EXT-X-MEDIA | |
|---|---|---|---|
| CODECS | SAMPLE -RATE |
BIT- DEPTH |
|
| audio-alac-stereo-88200-24 | alac | 88200 | 24 |
| audio-alac-stereo-96000-16 | alac | 96000 | 16 |
| audio-alac-stereo-96000-24 | alac | 96000 | 24 |
| audio-alac-stereo-176400-24 | alac | 176400 | 24 |
| audio-alac-stereo-192000-24 | alac | 192000 | 24 |
ロスレスのうち、88.2kHz 以上のものは量子化ビット数に関わらずハイレゾ扱いされる。96kHz 以外の 16bit 音源は未発見。
Amazon Music – 空間オーディオ
Dolby Atmos (Dolby Digital Plus JOC / ホームシアター用)
| URL ql パラメーター | ファイル名 サフィックス |
AdaptationSet | Representation | Channel Configuration |
EC3_ Extension Complexity Index |
EC3_ Extension Type |
ビット レート (kbps) |
||
|---|---|---|---|---|---|---|---|---|---|
| selection Priority |
quality Ranking |
codecs | audio Sampling Rate |
||||||
| SPATIAL_ATMOS_LOW | (不明) | 3000 | 3 | ec-3 | 48000 | 6 | 256 | ||
| SPATIAL_ATMOS_MEDIUM | (不明) | 3000 | 2 | ec-3 | 48000 | 6 | 16 | JOC | 448 |
| SPATIAL_ATMOS_HIGH | (不明) | 3000 | 1 | ec-3 | 48000 | 6 | 16 | JOC | 768 |
ec-3 は Dolby Digital Plus (Enhanced AC-3) のこと。量子化ビット数の記載はないが、恐らくすべて 16bit だと思われる。一番上のものは 6ch (5.1ch 構成) ダウンミックス。
Dolby Atmos (Dolby AC-4 IMS / モバイル機器用)
| URL ql パラメーター | ファイル名 サフィックス |
AdaptationSet | Representation | Channel Configuration |
virtualized_ content |
ビット レート (kbps) |
||
|---|---|---|---|---|---|---|---|---|
| selection Priority |
quality Ranking |
codecs | audio Sampling Rate |
|||||
| SPATIAL_ATMOS_LOW | 3D_Datmos_Low | 2500 | 2 | ac-4.02.02.00 | 48000 | 2 | 1 | 112 |
| SPATIAL_ATMOS_MEDIUM | 3D_Datmos_Med | 2500 | 1 | ac-4.02.02.00 | 48000 | 2 | 1 | 256 |
ac-4.02.02.00 は、Dolby AC-4 というコーデックの、Immersive Stereo (IMS) というフォーマットのことを指す。
- ac-4.02.02.00
- ac-4: fourCC = ac-4 → Dolby AC-4
- 02: bitstream_version = 2 → AC-4 Part 2 (ETSI TS 103 190-2) 準拠のデコーダーが必要
- 02: presentation_version = 2 → IMS
- 00: md_compat = 0 → 2.0ch
360 Reality Audio
mha1
| URL ql パラメーター |
ファイル名 サフィックス |
AdaptationSet | Representation | オブジェクト数 | ビット レート (kbps) |
|||
|---|---|---|---|---|---|---|---|---|
| selection Priority |
quality Ranking |
codecs | audio Sampling Rate |
使用 | 最大 | |||
| SPATIAL_RA360_L0 | 3D_S360RA_L0 | 3000 | 4 | mha1.0x0c | 48000 | 5 | 5 | 320 |
| SPATIAL_RA360_L1 | 3D_S360RA_L1 | 3000 | 3 | mha1.0x0d | 48000 | 10 | 10 | 640 |
| SPATIAL_RA360_L2 | 3D_S360RA_L2 | 3000 | 2 | mha1.0x0d | 48000 | 13 | 16 | 1024 |
| SPATIAL_RA360_L3 | 3D_S360RA_L3 | 3000 | 1 | mha1.0x0e | 48000 | 17 | 24 | 1536 |
mhm1
| URL ql パラメーター |
ファイル名 サフィックス |
AdaptationSet | Representation | オブジェクト数 | ビット レート (kbps) |
|||
|---|---|---|---|---|---|---|---|---|
| selection Priority |
quality Ranking |
codecs | audio Sampling Rate |
使用 | 最大 | |||
| SPATIAL_RA360_L0 | 3D_S360RA_L0 | 3500 | 4 | mhm1.0x0c | 48000 | 5 | 5 | 320 |
| SPATIAL_RA360_L1 | 3D_S360RA_L1 | 3500 | 3 | mhm1.0x0d | 48000 | 10 | 10 | 640 |
| SPATIAL_RA360_L2 | 3D_S360RA_L2 | 3500 | 2 | mhm1.0x0d | 48000 | 13 | 16 | 1024 |
| SPATIAL_RA360_L3 | 3D_S360RA_L3 | 3500 | 1 | mhm1.0x0e | 48000 | 17 | 24 | 1536 |
量子化ビット数の記載はないが、360 Reality Audio の仕様的に、恐らくすべて 24bit だと思われる。
- mha1 = MPEG-H 3D Audio、単一ストリーム
- mhm1 = MPEG-H 3D Audio、単一ストリーム、MPEG-H Audio Stream (MHAS) でカプセル化
- 0x0c = Low Complexity Profile, Level 2
- 0x0d = Low Complexity Profile, Level 3
- 0x0e = Low Complexity Profile, Level 4
Apple Music – 空間オーディオ
Dolby Audio
字面が似ていて紛らわしいが、Dolby Atmos (ドルビーアトモス) ではなく Dolby Audio (ドルビーオーディオ)。Apple Music では 5.1ch (6ch 表記) や 7.1ch (8ch 表記) の音源のことを指している。
| EXT-X-STREAM-INF:AUDIO EXT-X-MEDIA:GROUP-ID |
EXT-X-STREAM-INF | EXT-X-MEDIA | ビット レート (kbps) |
|---|---|---|---|
| CODECS | CHANNELS |
||
| audio-ac3-448 | ac-3 | 6 | 448 |
| audio-ec3-1448 | ec-3 | 8 | 448 |
ac-3 は Dolby Digital (AC-3) 、ec-3 は Dolby Digital Plus (Enhanced AC-3) のこと。
Dolby Atmos (Dolby Digital Plus JOC)
| EXT-X-STREAM-INF:AUDIO EXT-X-MEDIA:GROUP-ID |
EXT-X-STREAM-INF | EXT-X-MEDIA | ビット レート (kbps) |
|---|---|---|---|
| CODECS | CHANNELS |
||
| audio-atmos-2448 | ec-3 | 16/JOC | 448 |
| audio-atmos-2768 | ec-3 | 16/JOC | 768 |
サンプリング周波数と量子化ビット数の記載はないが、恐らくすべて 48kHz / 16bit だと思われる。Apple Music は 現状 Dolby AC-4 IMS は非採用。
2.0ch ダウンミックス
| EXT-X-STREAM-INF:AUDIO EXT-X-MEDIA:GROUP-ID |
EXT-X-STREAM-INF | ビット レート (kbps) |
|---|---|---|
| CODECS | ||
| audio-HE-stereo-64 | mp4a.40.5 | 64 |
| audio-stereo-64 | mp4a.40.2 | 64 |
| audio-stereo-128 | mp4a.40.2 | 128 |
| audio-stereo-256 | mp4a.40.2 | 256 |
バイノーラル
| EXT-X-STREAM-INF:AUDIO EXT-X-MEDIA:GROUP-ID |
EXT-X-STREAM-INF | EXT-X-MEDIA | ビット レート (kbps) |
|---|---|---|---|
| CODECS | CHANNELS |
||
| audio-HE-stereo-64-binaural | mp4a.40.5 | 2/-/BINAURAL | 64 |
| audio-stereo-64-binaural | mp4a.40.2 | 2/-/BINAURAL | 64 |
| audio-stereo-128-binaural | mp4a.40.2 | 2/-/BINAURAL | 128 |
| audio-stereo-256-binaural | mp4a.40.2 | 2/-/BINAURAL | 256 |
セグメントとコンテナ
インデックスファイルや MPD を見てみると、Apple Music のロスレスや空間オーディオの楽曲は約 15 秒ごと (ロッシーは不明)、Amazon Music の楽曲は約 10 秒ごとのセグメントにフラグメント化されている。
フラグメント化された音声は、両サービスとも fMP4 (fragmented MP4) コンテナに格納されている。
DRM
Amazon Music の MPD には、DRM として Microsoft PlayReady を使用していることが明記されている。一方 Apple Music は何を使用しているのかは分からないが、Apple は独自で FairPlay という DRM 技術を持っているので、恐らくこれを使用しているものと思われる。
Dolby Audio
Dolby Audio とは
Apple Music の空間オーディオと言えば Dolby Atmos だけだと思われがちだが、僅かながら 5.1ch や 7.1ch で配信されているものもある。「ドルビーオーディオ」と表示されている楽曲がそれである。
ただし、ステレオ版しか配信されていないにも関わらず、なぜか Dolby Audio ロゴが表示される楽曲もあるため、注意が必要 (詳細は後述)。
Dolby Audio とは、Dolby Atmos 関連や Dolby Voice 関連以外のほぼすべての Dolby の音響技術を総称したブランドである。
Dolby の音響技術があまりにも多くなったので、Dolby Atmos に対応する製品には Dolby Atmos のロゴのみを、Dolby Atmos には対応しないが Dolby Audio に含まれる音響技術のいずれかに対応する場合は Dolby Audio のロゴのみを付与するように定められた。
Apple Music だけでなく、非 Dolby Atmos の Dolby Digital (Plus) や Dolby TrueHD を採用する BD (BDMV) や UHD BD 等においても、ロゴはそれぞれのコーデックのロゴではなく Dolby Audio ロゴを表示するよう定められている。

ただし、Dolby Atmos 採用作品の場合は、Dolby Atmos 非対応環境で視聴した場合は 5.1ch 〜 7.1ch ダウンミックスになってしまう (理由は後述) ためか、あるいは BDMV や UHD BD のDolby TrueHD (Dolby Atmos のコーデックとしても使用されている) には互換用の Dolby Digital (AC3 Core とも呼ばれる) が付属しているためか、Dolby Atmos ロゴと Dolby Audio ロゴの両方が表示される場合もある。
Dolby Audio と Dolby Atmos の違いについて調べると、「Dolby Audio は 5.1ch や 7.1ch 等で、Dolby Atmos は天井からも音が鳴らせるもの」や「Dolby Audio はスマホや PC の高音質化技術で、Dolby Atmos は映画館等で使われるサラウンド技術」と解説されていることもあるが、それらはごく一部分に過ぎない。
Dolby Atmos と Dolby Audio の違いは、「Dolby Atmos 関連の音響技術か、そうでないか」である。
長々と書いたが、Apple Music に限って言えば、Dolby Audio は 5.1ch や 7.1ch のサラウンド音声という認識で構わない。
Dolby Audio のコーデック
Apple Music の Dolby Audio
| EXT-X-STREAM-INF:AUDIO EXT-X-MEDIA:GROUP-ID |
EXT-X-STREAM-INF | EXT-X-MEDIA | ビット レート (kbps) |
|---|---|---|---|
| CODECS | CHANNELS |
||
| audio-ac3-448 | ac-3 | 6 | 448 |
| audio-ec3-1448 | ec-3 | 8 | 448 |
Apple Music のDolby Audio で使用されるコーデックは、5.1ch は ac-3、7.1ch は ec-3 となっている。
AC-3 は Audio Code number 3 の略で、Dolby の3番目の音声符号化技術である Dolby Digital のことを指す。AC-3 は技術的な名称、Dolby Digital はマーケティング用のブランドとなっている。ロッシー圧縮のコーデックで、最大 5.1ch、48kHz / 16bit、640kbps まで対応している。
EC-3 は Enhanced AC-3 (E-AC-3) の略で、マーケティング用のブランドは Dolby Digital Plus。Dolby Digital よりも圧縮効率が向上し、対応チャンネル数が増加したロッシー圧縮のコーデックで、最大 15.1ch、48kHz / 20bit、6144kbps まで対応している。後述の Joint Object Coding (JOC) を使用することで、Dolby Atmos にも対応可能。
Dolby Digital Plus は、 単体で再生可能な領域である Independent Substream (IS) と、IS と組み合わせて再生する拡張領域の Dependent Substream (DS) がある。IS は 5.1ch までの対応となっており、DS は 7.1ch や Dolby Atmos を格納する際の、追加データの格納用に使用される。
Dolby Digital Plus の 7.1ch 音声では、IS には 5.1ch ダウンミックス音声が、DS には 7.1ch 用のサラウンド Lss/Rss とサラウンドバック Lrs/Rrs の合計 4.0ch 分の音声が入っている。そのため、Dolby Digital Plus の 7.1ch は、実際のデータとしては IS 5.1ch + DS 4.0ch の、合計 9.1ch 分の音声が入っている。
5.1ch 出力時は、IS のL/R/C/Ls/Rs を全て使用し、DS は無視する。、7.1ch 出力時は、IS の L/R/C と DS の Lss/Rss/Lrs/Rrs を組み合わせ、IS の Ls/Rs は無視する。
このような仕様になっているのは、7.1ch 音声だけ格納して、5.1ch 再生時は係数で機械的にダウンミックスとするよりも、5.1ch は 5.1ch で用意したほうが、より製作者の意図を再現しやすいといった背景がある。
ちなみに、Dolby Digital Plus は EX フラグにも対応しているため、IS は Surround EX を利用したマトリックス 6.1ch 音声とすることも可能となっている。(実際、そのような音源も複数存在を確認している)
Dolby Digital は 48kHz / 16bit まで、Dolby Digital Plus は 48kHz / 20bit までしか対応してないため、Apple 基準のハイレゾ (88.2kHz 以上) には対応していない。そしてどちらもロッシーコーデックである。
(アルバムページに「ロスレス」と「Dolby Atmos」のロゴが共存している場合、それはステレオ版がロスレスで提供されているという意味である)
Dolby TrueHD を使用すれば、Dolby Audio 音源を最大 192kHz / 24bit のハイレゾロスレスで提供できるが、現状 iPhone にも iPad にも Apple TV にも Android 端末にも Dolby TrueHD デコーダーは載っていない。
なお、Dolby Atmos に対応している Android 端末であれば、Dolby Digital デコーダーや Dolby Digital Plus デコーダーは必ず載っているのだが、現在 Android 版 Apple Music は執筆時点で最新の 4.9.7.2 でも未だに Dolby Audio 非対応となっている。
Dolby Atmos のストリーミング設定やダウンロード設定をオンにしても、Dolby Audio で配信されている楽曲はステレオ版しか降ってこない。また、アルバム詳細ページ等に Dolby Audio のロゴも表示されない。
Dolby Audio の謎
Apple Music の Dolby Audio には、色々謎がある。
① Dolby Atmos で配信されているものの、一時的に Dolby Audio 表記になるパターン
再生直後は Dolby Audio 表記になり、何度か再生し直したり、時間をおいて再生し直しているうちに Dolby Atmos 表記になるパターン。現状 iOS / iPadOS 版でのみ確認している。
このパターンの奇妙な点は、マスタープレイリストを確認しても、Dolby Atmos で配信されている楽曲は Dolby Audio では配信されていないというところ。にも関わらず、アプリ上では Dolby Audio のロゴが表示されている。
状況的に考えて、これは後述する 2.0ch ダウンミックス版を 5.1ch アップミックスしているか、バイノーラル版を再生している際に表示されるものではないかと思われる。
ただし、iOS / iPadOS 16 以降では見かけなくなったので、iOS / iPadOS 15 時代の仕様の可能性がある。
② Dolby Audio 表記があるものの、実際にはステレオでしか再生されないパターン
アルバムには Dolby Audio 表記があるものの、再生時にはステレオ版でしか再生されないというパターン。こちらも現状 iOS / iPadOS 版でのみ確認している。サントラを中心に目撃例が増えている。
確認した限りでは、該当の音源のマスタープレイリストにはステレオ版しか存在していないため、単なる表示バグではないかと思われる。
③ 海外では Dolby Audio で配信されているものの、日本ではステレオ版しか配信されていないパターン
Excited to announce that my upcoming album, Parody: The Mixtape, will be available in immersive, high quality, Dolby Audio.
— Rey (@ReyGGTV) July 1, 2021
Experience songs such as Davey Boi, I Ship It (Lumity Remix), and the upcoming JOHANNA song in true immersion.
Coming soon. Only on Apple Music. pic.twitter.com/H2dfb9LJX6
@BrandonButch is dolby audio new?? pic.twitter.com/Yc5sl9ZMu8
— reece (coup de grâce) (@RIPBIGPROOF313) July 22, 2021
このパターンは、日本では Dolby Audio でも Dolby Atmos でも提供されておらず、マスタープレイリストにもステレオ版しか載っていない、といったもの。
特定の楽曲が一部の国では配信されていないということはたまにあるのだが、空間オーディオ版が一部の国に限られているのは謎である。
Dolby Atmos
まずはじめに断っておくが、Dolby Atmos 自体はコーデックではない。Dolby Atmos は Dolby Digital / Digital Plus や Dolby TrueHD 等の進化版ではなく、5.1ch や 7.1ch の進化版のようなものだと捉えていただきたい。
Dolby Atmos は、7.1ch (Dolby Surround 7.1 の配置) にトップ (天井) チャンネルをステレオで追加した、計 7.1.2ch のチャンネルベースの音声トラック (これをベッドと呼ぶ) をベースに、最大 118 個の音声オブジェクトを配置することができる、イマーシブサウンドのフォーマットである。
Dolby Atmos だけでなく DTS:X、360 Reality Audio、Auro-3D、Apple Spatial Audio Format (ASAF) 等に関しても、あくまでイマーシブサウンドのフォーマット名であり、コーデックの名称ではない。
*イマーシブサウンドの定義は様々だが、ここでは前後左右を取り囲むサラウンドに加え、上下方向の音も再現できるフォーマットのことを指す。ただし、Dolby Atmos は下方向の表現はできない。
補足
細かいことを言えば、チャンネルベースオーディオ自体スピーカー配置で定義される位置情報を持つ静的な音声オブジェクトの集合体であるとも言える。
しかし、ここでは一般的な定義として、制作時には OAMD (Object Audio Metadata) を用いてオブジェクトの位置を規格の範囲内で自由に指定でき、再生時にはメタデータとスピーカー構成をもとに OAR (Object Audio Renderer) がレンダリングを行うものを、オブジェクトベースオーディオと呼ぶことにしている。
Dolby Atmos の音声がどのコーデックで届けられるかは、用途により異なる。主に使用されるコーデックは、下記の通り。
- 映画館 (DCP): 非圧縮のリニア PCM
- BD (BDMV) や UHD BD: ロスレス圧縮の Dolby TrueHD
- ストリーミング: ロッシー圧縮の Dolby Digital Plus (JOC) や Dolby AC-4 (IMS)
- テレビ放送: ロッシー圧縮の Dolby AC-4 (A-JOC / CBI)
- ゲーム機: 非圧縮の Dolby MAT 2.0
なお、「Dolby Atmos Music」という用語もあるが、これは Dolby Atmos を使用した楽曲を指すブランドで、使用している技術自体はその他の Dolby Atmos と何も変わらない。
Apple Music の Dolby Atmos では Dolby Digital Plus (Enhanced AC-3) のみ使用されている。一方 Amazon Music では、Echo Studio やサウンドバー等では Dolby Digital Plus (Enhanced AC-3) が、スマホやタブレットでは Dolby AC-4 が使用されている。
Dolby Atmos は Dolby TrueHD を使用することで、最大 48kHz / 24bit のロスレスで提供できるが、上述の通り Dolby TrueHD デコーダーを搭載したスマホやタブレットは現状存在してしない。
なお、Dolby Audio とは違い、Dolby Atmos の場合は 96kHz 以上は不可のため、Apple 基準でのハイレゾは現状非対応。
Dolby Atmos のマスターファイルは 96kHz で記録できますが、現状 Dolby Atmos を 96kHz で提供する方法はありません。Blu-ray 向けの Dolby TrueHD と、ストリーミング向けの Dolby Digital Plus は、どちらも 48kHz しか対応していないからです。
While you can record Dolby Atmos Master Files in 96K, there is currently no way to dritribute Dolby Atmos in 96k. Because both Dolby TrueHD (Blu Ray) and Dolby Digital Plus (Streaming) only support 48k.
96K を Google 翻訳 + 微修正
Dolby Digital Plus JOC
Dolby Digital Plus をコンテナにした Dolby Atmos には、以下のような呼称が存在している。
- Dolby Atmos in Dolby Digital Plus (略称: Dolby Atmos in Digital Plus / Dolby Atmos in DD+ / Atmos in DD+)
- Dolby Digital Plus with Dolby Atmos (略称: Dolby Digital Plus with Atmos / DD+ with Dolby Atmos / DD+ with Atmos)
- Dolby Digital Plus JOC (略称: DD+ JOC / DD+JOC)
- Enhanced AC-3 with Joint Object Coding (略称: E-AC-3 with JOC / E-AC-3 JOC / EAC3 JOC / EAC3-JOC / EAC3_JOC / EC3_JOC / ec+3 等)
この記事では、以降 Dolby Digital Plus JOC と呼ぶことにする。
Amazon Music の Dolby Atmos (Dolby Digital Plus JOC)
Amazon Music では、Dolby Digital Plus JOC は Echo Studio やサウンドバー等に対してのみ提供している。スマホやタブレットに対しては、後述する Dolby AC-4 IMS というフォーマットで提供している。
5.1ch にダウンミックスしたものも配信されているが、おそらくネットワークの品質が悪いときに利用されるのだと考えられる。
| URL ql パラメーター | ファイル名 サフィックス |
AdaptationSet | Representation | Channel Configuration |
EC3_ Extension Complexity Index |
EC3_ Extension Type |
ビット レート (kbps) |
||
|---|---|---|---|---|---|---|---|---|---|
| selection Priority |
quality Ranking |
codecs | audio Sampling Rate |
||||||
| SPATIAL_ATMOS_LOW | (不明) | 3000 | 3 | ec-3 | 48000 | 6 | 256 | ||
| SPATIAL_ATMOS_MEDIUM | (不明) | 3000 | 2 | ec-3 | 48000 | 6 | 16 | JOC | 448 |
| SPATIAL_ATMOS_HIGH | (不明) | 3000 | 1 | ec-3 | 48000 | 6 | 16 | JOC | 768 |
Apple Music の Dolby Atmos (Dolby Digital Plus JOC)
Apple Music では、Dolby Atmos 音声を提供する全てのプラットフォーム (iOS、iPadOS、macOS、tvOS、Android) に対して、Dolby Digital Plus JOC を提供している。
| EXT-X-STREAM-INF:AUDIO EXT-X-MEDIA:GROUP-ID |
EXT-X-STREAM-INF | EXT-X-MEDIA | ビット レート (kbps) |
|---|---|---|---|
| CODECS | CHANNELS |
||
| audio-atmos-2448 | ec-3 | 16/JOC | 448 |
| audio-atmos-2768 | ec-3 | 16/JOC | 768 |
Spatial Coding
Apple Music と Amazon Music のトラック数表記に共通で入っている “16” という数字は、民生用 Dolby Atmos の一部フォーマットで使用されている、Spatial Coding という技術によるものである。
Dolby Atmos は 7.1.2ch のベッドと最大 118 個のオブジェクトの、合計 128 の音声トラックを使用できる。DCP は基本的に HDD ごと映画館に納品されるため、容量に余裕があり、リニア PCM で記録可能。
一方、民生用だと Dolby TrueHD や Dolby Digital Plus 等で圧縮したとしても、容量は 7.1ch 等に比べて数段跳ね上がるし、民生用機器で 128 トラックの音声を処理するのも DSP 等の性能的に厳しいところがある。
そこで、Dolby Digital Plus JOC、Dolby AC-4 A-JOC、Dolby TrueHD with Dolby Atmos (MLP FBA 16-ch) では、Spatial Coding という処理が行われる。なお、この処理は後述する Amazon Music の Dolby AC-4 IMSや、チャンネルベースの Dolby AC-4 CBI では使用されない。
Spatial Coding は、空間的に近い位置にあるベッドとオブジェクトを 11 / 13 / 15 のいずれかのグループ (これを element と呼ぶ) にクラスタリングする技術である。element の数をいくつにするかは、音声にどれだけビットレートを割けるかによる。詳細は こちら
Spatial Coding によってクラスタリングされた各 element もまた、OAMD (Object Audio Metadata) を持つオブジェクトベースオーディオである。
なお、LFE (Low Frequency Effect) と呼ばれる低音専用チャンネルだけはクラスタリングされず、チャンネルベースのまま保持されている。そのため、Spatial Coding 後のトラック数は、11 / 13 / 15obj (elements) + 1ch (LFE) で、合計 12 / 14 / 16 トラックとなる。Amazon Music や Apple Music の 16 という数字は、ここに由来する。
Spatial Coding は、端的に言うとオブジェクトベースのダウンミックスとも取れるが、Dolby 曰く「何も失われない」そうだ。正直この辺りは MQA の「ロスレス」のような若干の胡散臭さも感じられる。(位置情報はともかく、特定の音が完全に消えてしまうことはない、という意味…?)
民生用のDolby Atmos Homeにおいても「失うものは何一つ無く、この128オブジェクトを再現できる」と説明。
立体音響の「Dolby Atmos」今秋ついに家庭へ。各社AVアンプを体験、モバイル展開も – AV Watch
Spatial Coding が施された Dolby Atmos 音源は、LFE を無視すれば完全なオブジェクトベースにも思えるが、少なくとも Dolby Digital Plus JOC においては、後ほど紹介する Joint Object Coding により、結局はチャンネルベースとのハイブリッドとなっている。
element 数ごとに音声のビットレートの下限が定められている。両サービスともに Dolby Atmos (Dolby Digital Plus JOC) の下限が 448kbps となっているのは、16 elements の場合のビットレートの下限が 448kbps だからだ。
Spatial Coding で使用される elements の数は、エンコード時のビットレートによって決定されます。 384kbps では 12 elements、448kbps 以上では 16 elements が使用されます。
The number of elements used by spatial coding is determined by the bit rate of the encode. A bit rate of 384kbps uses 12 elements, while bit rates of 448kbps and above use 16 elements.
Appendix C – Dolby Atmos Delivery Codecs – Dolby Professional Support Learning を Google 翻訳 + 微修正
上記はあくまで下限値を示したものと思われ、実際には 448kbps 以上でも 12 / 14 elements の音源も存在する。
一方、上限が両サービスとも 768kbps となっているのは、あくまで Amazon や Apple による制約でしかない。Dolby Digital Plus JOC 自体は、Dolby Digital Plus の上限である 6144kbps まで使用できる。
The operating range has been increased by allowing data rates spanning 32 kbps – 6.144 Mbps.
[PDF] Introduction to Dolby Digital Plus, an Enhancement to the Dolby Digital Coding System
6144kbps もあれば、ロスレスの Dolby TrueHD による Dolby Atmos (7000 ~ 9000kbps 程度) が見えてくるため、流石に上限まで使うサービスは出てこないとは思うが、Amazon Music や Apple Music より高いビットレートで Dolby Digital Plus 音声を配信するサービスは存在する。
Live ExtremeでDolby Atmosを配信する場合の技術仕様は以下の通りです。
Dolby Atmos配信を徹底解説!(後編)|KORG Live Extreme
- コーデック: Dolby Digital Plus
- サンプルレート: 48kHz
- ビットレート: 384, 448, 576, 640, 768, 1024 kbps
- チャンネル数 : 最大16/JOC
- 配信方式: 疑似ライブ配信 (リニア配信), オンデマンド配信
画質・音質のスペック (規格)
画質・音質のスペック (規格) を教えてください – よくあるご質問 (FAQ)
- 音質 イマーシブオーディオ ドルビーアトモス 7.1.4 · 1.024 kbit/s · E-AC-3 JOC (ドルビーデジタルプラス)
AFLSは『ドルビーデジタルプラス(E-AC3)』を使用しています。
AFLSについて | AFLS
ビットレートを『960kbps』に設定し、音の臨場感をお届けします。
(AFLS は Dolby Atmos ではなく Dolby Audio 5.1ch)
ちなみに、Netflix の Dolby Atmos (Dolby Digital Plus JOC) は、Amazon Music や Apple Music と同じビットレートとなっている。
Netflixメンバーの視聴体験
ほとんどの5.1またはドルビーアトモス対応のテレビデバイスは、より良い音を受信できます。 デバイスと利用可能な帯域幅によって、受信ビットレートは異なります:
スタジオ音質のサウンドを、Netflixに – About Netflix
- 5.1: 192 kbps (良い) から640 kbps (鮮やか/知覚的に透明) まで
- ドルビーアトモス: 448 kbpsから768 kbpsまで (ドルビーアトモスはプレミアムプランに加入しているNetflixメンバーのみご利用いただけます)
なお、iPhone / iPad で 2048kbps 以上の Dolby Digital Plus 音声を再生すると、挙動が怪しくなるという問題があったりする。
Joint Object Coding
一方フォーマット名やトラック数表記にある “JOC” とは、Joint Object Coding の略である。
Dolby Digital Plus JOC では、Dolby Atmos 非対応の Dolby Digital Plus 対応機器とも互換性を保つため、Dolby Atmos を 5.1ch 〜 7.1ch にレンダリングしたものをコアとして持っている。そして、Dolby Digital Plus のビットストリームの拡張領域に、Dolby Atmos 用の差分データが記録されている。
コア部分のチャンネル数は 5.1ch にするか 7.1ch にするか、はたまた 6.1ch の Surround EX にするかは自由だが、Apple Music では検証した限りどれも 7.1ch で、Amazon Music ではどれも 5.1ch のようである。
Dolby Atmos 対応機器では、コアと差分データを合体させることで、Dolby Atmos の再構築が可能となる。これが Joint Object Coding である。
一方、Dolby Atmos 非対応の Dolby Digital Plus 対応機器では、差分データを無視し、コア部分のみを再生することで、5.1ch ~ 7.1ch での再生が行える。
なお、コア音声にはベッドの天井成分や音声オブジェクトの音を 5.1ch 〜 7.1ch にレンダリング (ダウンミックス) したもの含まれているので、合体前に差分音声の逆相で打ち消す必要がある。
AVS Forum の The official Dolby Atmos thread (home theater version) ではコア音声はコア音声で、Dolby Atmos 音声はコア音声とは独立して、それぞれ個別に持っているのではないか、と主張する人もいるが、容量がもったいないし、そもそも “Joint” Object Coding という名称なので、恐らくそれはないと思われる。(真相不明)
Joint Object Coding 等の詳細については、Dolby 公式サイトで詳しく解説されている。
Appendix C – Dolby Atmos Delivery Codecs – Dolby Professional Support Learning
上記の記事を含む一連の解説記事を読むと、Dolby Atmos に対する理解が深まるかもしれない。
Dolby Atmos Music Training – Dolby Professional Support Learning
上記のサイトは現在なぜか消されており、Wayback Machine には残っているが、全てのページが残っているかは不明。念のため、ほぼ同内容の解説記事 (こちらも公式サイトからは消えている) の Wayback Machine のリンクも貼っておく。
Dolby Atmos Post Production Learning – Dolby Professional Support Learning
英語が苦手な方や、「Dolby なんちゃら」がどれだけあるのかを知りたい方にはこの本もおすすめ。個人的にはオブジェクトベースオーディオの説明が分かりやすく書かれているように感じられた。(ただし筆者の Dolby Japan と本国の Dolby Laboratories とで言ってることが違っている箇所もあるので、あくまで入門時の参考程度に…)
ドルビーの魔法 カセットテープからDOLBY ATMOSまでの歩みをたどる | 電子書籍とプリントオンデマンド(POD) | NextPublishing(ネクストパブリッシング)
なお、Dolby Digital Plus JOC は、上記の他にもオブジェクトなしの 5.1.4ch の CBI (Channel-Based Immersive) 音声や、5.1ch + 1 element の 7 トラック音声等も対応しているようだが、これらは Dolby の テスト用音源 ぐらいでしか見かけず、詳細不明。
Dolby AC-4 IMS
Amazon Music では、スマホやタブレット向けに Dolby Atmos を提供する際には、Dolby AC-4 IMS というフォーマットを使用している。
Amazon Music の Dolby Atmos (Dolby AC-4 IMS)
| URL ql パラメーター | ファイル名 サフィックス |
AdaptationSet | Representation | Channel Configuration |
virtualized_ content |
ビット レート (kbps) |
||
|---|---|---|---|---|---|---|---|---|
| selection Priority |
quality Ranking |
codecs | audio Sampling Rate |
|||||
| SPATIAL_ATMOS_LOW | 3D_Datmos_Low | 2500 | 2 | ac-4.02.02.00 | 48000 | 2 | 1 | 112 |
| SPATIAL_ATMOS_MEDIUM | 3D_Datmos_Med | 2500 | 1 | ac-4.02.02.00 | 48000 | 2 | 1 | 256 |
TIDAL という日本未展開の音楽サブスクでも Dolby AC-4 IMS が提供されているが、現状調査はできていない。
Dolby AC-4 は、Dolby Digital (AC-3) や Dolby Digital Plus (Enhanced AC-3) の後継となるコーデック。Dolby Digital Plus (Enhanced AC-3) よりも圧縮効率が高く、ネイティブでオブジェクトベースオーディオに対応している。
Dolby AC-4 は、将来的な拡張も考慮されているため、最大チャンネル数や最大オブジェクト数は、現状未定。現在制定されている上限値については、後の「Dolby AC-4 A-JOC と Dolby AC-4 CBI」で解説する。
IMS (Immersive Stereo) は、Dolby AC-4 のフォーマットの一種で、5.1ch や Dolby Atmos 等のマルチチャンネル音声から、独自の処理 (詳細不明、マトリックスエンコードの亜種?) にて、専用の 2.0ch 音声と、制御用のメタデータを生成する。Spatial Coding や Joint Object Coding は使用されない。

Dolby AC-4 IMS の再生時は、メタデータを用いて 2.0ch 音声をバーチャライズすることで、ステレオイヤホン・ヘッドホンや、スマホ・タブレットの内蔵ステレオスピーカーで、Dolby Atmos 等を体験することが可能。メタデータを無視すれば、通常の 2.0ch 音声として聴くことも可能。
Dolby AC-4 IMS は、Dolby Digital Plus JOC と比較すると、以下のようなメリットがある。
- AC-4 は DD+ よりも圧縮効率が高い (DD+ 比で 2 倍)
- AC-4 IMS は 2.0ch 音声 + メタデータなので、DD+ JOC よりもサイズが小さい
- ある程度事前処理されているため、DD+ JOC よりも処理が軽い (DD+ JOC 比で 3 ~ 4 倍)
- バイノーラルレンダリングモード (Off / Near / Mid / Far) のメタデータが反映可能
逆に、Dolby Digital Plus JOC にもメリットはある。
- 対応端末が多い
- 現状 iPhone や iPad は AC-4 自体に対応していない (とは言え、Android 端末は 2018 年以降に出た Dolby Atmos 対応機種なら大抵対応している)
- AV アンプやサウンドバーでの再生に向いている
- AC-4 IMS は、あくまで 2.0ch 出力向けのフォーマット
このあたりは一長一短という感じだ。
バイノーラルメタデータをサポートしたコーデックは現状 Dolby AC-4 しかないが、Apple Music では Dolby Digital Plus JOC のみを使用している。その上、Apple は iPhone や iPad 等で Dolby Digital Plus JOC を独自の “Spartial Audio” レンダラーでヘッドホン再生を行っている。
そのため、世界中のミキシングエンジニアの間で「iPhone と AirPods で Apple Music の Dolby Atmos を聴いたら、思ってたのと違う」という騒ぎが起きている。(詳細 → Why Your Atmos Mix Will Sound Different On Apple Music | Production Expert)
Logic Pro のヘッドホン再生では、Dolby Renderer と Apple Renderer が用意されているが、このApple Renderer は Apple 製品の空間オーディオを再現するものである。Dolby Renderer はバイノーラルメタデータが使用される。
勘違いされがちなのだが、Dolby Atmos のマスターファイルから IMS にエンコードされる際にはバイノーラルメタデータも使用されるが、ここで生成される 2.0ch 音声自体はまだバイノーラル音声 (ヘッドホン用にバーチャライズした音声) ではない。IMS はあくまで中間フォーマットでしかない。
一般的なバイノーラル音声や Dolby Headphone、DTS Headphone:X、THX Spatial Audio 等で処理された音声に関しては、エンコード時点ですでにヘッドホン用の処理が施されているため、スピーカー再生には向かないし、ヘッドトラッキング等の処理も行えない。
一方、IMS は Dolby Atmos からのエンコード段階では特定の再生環境向けの処理は行わない。再生機器側で、再生機器の状態に応じて (ヘッドホンで再生するのか内蔵スピーカーで再生するのか、そもそも Dolby Atmos で聴きたいのかステレオで聴きたいのかによって) 処理を変化させることができる。
Dolby AC-4 IMS は、まさにモバイル機器向けといったフォーマットである。
Dolby AC-4 A-JOC と Dolby AC-4 CBI
Dolby AC-4 を使用した Dolby Atmos のフォーマットは、IMS だけではなく、A-JOC や CBI といったフォーマットも存在している。
これらは海外の TV 放送で使用されているフォーマットで、今の所ネット配信での使用例はないと思われるが、Dolby Atmos Renderer が対応 (Dolby AC-4 L4 の Music モードとして実装) するなど、今後活用が広がっていく可能性がある。
参考情報として、これらについても解説しておく。
Dolby AC-4 A-JOC
A-JOC は Advanced Joint Object Coding の略で、Dolby Digital Plus における JOC の進化版。Dolby Atmos の音声を Spatial Coding でクラスタリングするところまでは、JOC と同じ。
使用できる element の数は、後ほど解説を行う Dolby AC-4 の Level に依存する。Dolby Atmos Renderer の「Dolby AC-4 L4」は、「Dolby AC-4 Level 4 (の恐らく A-JOC)」を指している。
JOC と A-JOC の違いは、コアの生成方法にある。JOC のコアは、チャンネルベース (5.1ch ~ 7.1ch) へのレンダリングだった。一方、A-JOC では再度 Spatial Coding を行い、オブジェクトベースのコア (6 ~ 10 elements 程度) を生成している。
なお、1 回目の Spatial Coding 時点で既にオブジェクト数が少ない場合 (8 elements 等)、A-JOC による 2 回目の Spatial Coding は実施せず、そのまま記録される場合もある。そのため、Dolby AC-4 には、A-JOC ではないオブジェクトベースオーディオも存在している。
A-JOC は 後述の CBI (Channel-Based Immersive) に対して OBI (Object-Based Immersive) と呼ばれることもあるが、フォーマットの名称としては A-JOC と呼ばれることが多い印象がある。
Dolby AC-4 CBI
CBI は Channel-Based Immersive の略で、チャンネルベースのみを使用した、イマーシブサウンドのフォーマットの総称。5.1.4ch や 7.1.4ch 音声等を実現可能。
最大チャンネル数については、後ほど解説を行う Dolby AC-4 の Level に依存する。
コアと差分への分離方法としては、ビットレートに応じて S-CPL (Simple Coupling)、A-CPL (Advanced Coupling)、A-JCC (Advanced Joint Channel Coding) から選択可能。それぞれの違いについては、ホワイトペーパーや仕様書を参照。
フォーマットの名称としては、S-CPL / A-CPL / A-JCC が区別されることは少なく、総称の CBI で呼ばれることが多い印象がある。
Dolby AC-4 におけるコアと差分の分離
Dolby Digital Plus JOC におけるコアと差分の分離は、Dolby Atmos 非対応機器向けの、互換性確保が目的だった。一方、Dolby AC-4 A-JOC や CBI におけるコアと差分の分離は、再生機器の負荷軽減が目的となっている。
出力先が 5.1ch 等、入力トラック数がそれほど必要ない場合は、差分を無視してコアのみを再生する。これは「コアデコード (core decoding)」と呼ばれる。
出力先が 7.1.4ch 等、コアデコードでは不十分な場合は、コアと差分から元の音声を再構築して再生する。これは「フルデコード (full decoding)」と呼ばれる。
Dolby AC-4 のサブストリームについて
Dolby AC-4 の最大トラック数について解説するために、まずは「サブストリーム」と「プレゼンテーション」という概念について、解説を行う。
Dolby AC-4 では、下記のような音声データやメタデータを利用可能。これらは「サブストリーム」と呼ばれる。
- Main: セリフ・音楽・効果音等、全ての要素がミックスされた音声
- Music and Effects (M&E): 音楽と効果音のみがミックスされた音声
- Dialogue: セリフのみの音声
- Associated Audio (Associate): 解説やコメンタリー等のみの音声
- Dialogue Enhancement (DE): Main のセリフ音量を調整するためのメタデータ
サブストリームの構成は、用途に合わせて選択可能。利用可能な組み合わせは、下記の通り。
- Main
- Main + Associated Audio
- Main + Dialogue Enhancement
- Main + Dialogue Enhancement + Associated Audio
- Music and Effects + Dialogue
- Music and Effects + Dialogue + Associated Audio
ベースとなる音声は、Main または Music and Effects から選択可能。Main は単体で提供可能だが、Music and Effects と Dialogue はセットで提供する必要がある。Associated Audio と Dialogue Enhancement の使用は任意。
Dolby AC-4 のプレゼンテーションについて
サブストリームの組み合わせは、「プレゼンテーション」として管理される。
1つのビットストリーム内には、複数のプレゼンテーションを構成することができる。各サブストリームは、複数のプレゼンテーションに所属させることができる。これにより、音声の容量を抑えることが可能。
上記では分かりづらいと思うので、具体例を記載する。例えば、下記のような音声を提供したい場合、
- 英語版 (5.1ch)
- 英語版 コメンタリー付き (5.1ch)
- 日本語吹替版 (5.1ch)
下記のようなサブストリームを用意し、
- Music and Effects (5.1ch): 英語・日本語共通の音楽と効果音
- Dialogue (1ch または 1obj): 英語のセリフ
- Dialogue (1ch または 1obj): 日本語のセリフ
- Associated Audio (1ch または 1obj): コメンタリー
下記のようなプレゼンテーションを構成することで、
- Music and Effects + Dialogue (英語)
- Music and Effects + Dialogue (英語) + Associated Audio
- Music and Effects + Dialogue (日本語)
5.1ch 音声を3種類 (合計 18tr) 用意するよりも、少ないデータ量 (合計 9tr) で提供することが可能。
※ 厳密には、サブストリームはグループという単位でまとめられた状態でプレゼンテーションに組み込まれる。しかし、基本的には1つのグループには1つのサブストリームしか所属していないことが多いため、簡略化のために省略した。
プレゼンテーション内に含まれる各音声サブストリームは、ユーザー側で調整することが可能。
例えば、映像作品でセリフ (Dialogue) の音量のみを上げたり、スポーツ中継で実況・解説音声 (Dialogue) をオフにして、場内の音声 (Music and Effects) だけを聴く、といったことが可能となっている。
このようなパーソナライズ機能は、「Next Generation Audio (NGA)」の特徴の一つである。
Dolby AC-4 の Level について
Dolby AC-4 の最大トラック数は、Level (または md_compat とも呼ばれる) の値によって決定される。A-JOC の最大オブジェクト数 (element 数) や、CBI の最大チャンネル数も、使用する Level に依存する。
Dolby AC-4 の音声には、md_compat という値 (古めの仕様書では mdcompat と記載) が設定されている。この値はデコーダーの互換性を表しており、トラック数が増えるごとに、0 ~ 7 の範囲で増えていく。
md_compat はプレゼンテーションごとに設定されているため、ビットストリーム内には複数の md_compat の音声が共存している場合がある。
Dolby AC-4 デコーダーには、Level が設定されている。この値は、デコード可能な md_compat の最大値を表している。例えば、Level 3 のデコーダーは、md_compat が 0 〜 3 の音声をデコード可能。
md_compat は音声側の値、Level はデコーダー側の値ではあるが、音声側の値も Level と呼ばれることが多く、md_compat は仕様書等でしか見かけない。そのため、以後 md_compat のことも Level と呼ぶことにする。
以下、Dolby AC-4 の仕様書をもとに、Level ごとの最大トラック数・最大構成を掲載する。なお、下記の値はビットストリーム全体の上限ではなく、各プレゼンテーションごとの上限を示している。
チャンネルベースオーディオのみ使用可能な presentation_version = 0 の場合:
ETSI TS 103 190-1 V1.4.1 (2025-07) の「Table 86: md_compat」をもとに作成
| md_ compat (Level) |
最大 トラック数 |
最大構成 | ||
|---|---|---|---|---|
| チャンネル ベース オーディオ (LFE を含む) |
Main または Music and Effects |
Dialogue | Associated Audio |
|
| 0 | 2 | 2.0 | – | – |
| 1 | 6 | 5.1 | – | – |
| 2 | 9 | 5.1 | 3 | 2 |
| 3 | 11 | 5.1 | 3 | 2 |
| 4 | 13 | 7.1 | 3 | 2 |
| 5 | 予約済み | |||
| 6 | 予約済み | |||
| 7 | 無制限 | |||
チャンネルベースオーディオとオブジェクトベースオーディオの両方が使用可能な presentation_version = 1 の場合:
ETSI TS 103 190-2 V1.3.1 (2025-07) の「Table 55: md_compat for presentation_version = 1」をもとに作成
| md_ compat (Level) |
最大トラック数 | 最大構成 | ||
|---|---|---|---|---|
| チャンネル ベース オーディオ (LFE を含む) |
オブジェクト ベース オーディオ (LFE を除く) |
Main または Music and Effects |
||
| CBI | A-JOC (再構築後) |
|||
| 0 | 2 | – | – | – |
| 1 | 6 | 6 | – | 15.1 |
| 2 | 9 | 8 | 7.1.4 | 15.1 |
| 3 | 11 | 10 | 7.1.4 | 17.1 |
| 4 | 予約済み | |||
| 5 | 予約済み | |||
| 6 | 予約済み | |||
| 7 | 無制限 | |||
presentation_version = 1 の表には Dialogue と Associated Audio が記載されていないが、これらのサブストリームは presentation_version = 0 でないと利用できないというわけではない (最大トラック数は不明)。実際、Music and Effects が A-JOC となっている音声の存在も確認している。
なお、2.0ch 音声や 5.1ch 音声等、オブジェクトベースオーディオを使用しない場合であっても、presentation_version は 1 の場合が多く、この値が 0 となっている音声は見かけたことがない。
presentation_version に関わらず、Dialogue と Associated Audio のフォーマットは、基本的には Main または Music and Effects を超えることができない。ただし、Main または Music and Effects がモノラルの場合は、この限りではない。
上記の他、Dolby AC-4 IMS 用の presentation_version = 2 も用意されている。IMS の音声部分は 2.0ch であるためか、今まで確認した IMS の Level は全て 0 となっている。仕組み上、恐らく IMS は Main でのみ使用でき、かつ、Associated Audio は使用できないと考えられる (Dialogue Enhancement は不明)。
Dolby AC-4 Level 4 における CBI と A-JOC の仕様は、2025年7月に更新されたばかりの仕様書でも「Reserved (予約済み)」となっている。しかし、制作環境と再生環境の両面で Dolby AC-4 Level 4 の A-JOC への対応が進んでおり (CBI は不明)、既にその仕様の音声もいくつか公開されている。
そのため、Dolby AC-4 Level 4 の CBI と A-JOC については、仕様書側が追いついていない状況となっている。次回の仕様書更新がいつになるのかは不明だが、現状でもこれらの仕様に関するヒントはある。
総務省が公開している資料より、Dolby AC-4 Level 4 の CBI は、プロトタイプでは 22.2ch に対応している模様。
22.2chをそのまま符号化する必要がある場合、今後の議論で具体化される同時最大デコードチャンネル数などに適合する形で、現在のAC-4規格上で”Reserved”となっているLevel 4として規定する必要がある。
地上デジタル放送方式高度化の音声符号化方式に関する中間報告 概要
符号化方式: 4方式(MPEG-4 AAC, MPEG-H 3DA, AC-4*2, Enhanced AC-3)
*2:22.2chに対応したプロトタイプ(Level 4相当)と少ないエレメント数で対応するLevel 3により実施
地上デジタル放送方式高度化に関わる適用技術検討作業 音声符号化方式の比較検討 最終報告
後者の資料には、「同時再生可能な音声信号数 *括弧内はサービス例」として、Dolby AC-4 Level 3 は「18 (例 7.1.4 + 6obj)」、Dolby AC-4 Level 4 のプロトタイプは「28 (例 22.2ch + 4obj)」と記載されている。
「同時再生可能な音声信号数」の「18」や「28」という値は、Dolby AC-4 においては、1 つのプレゼンテーションで使用できる合計トラック数の最大値を指していると考えられる。
Dolby AC-4 Level 3 は、チャンネルベースが最大 11ch、オブジェクトベースが最大 10obj 使用できるが、合計 21tr 全てを同時使用できるわけではなく、18tr 以内に収める必要があるようだ。
Dolby AC-4 Level 4 は、チャンネルベースが最大 13ch 使用できることと、プロトタイプでは合計 28tr 使用できることから、オブジェクトベースは少なくとも 15obj は使用できると考えられる。
Dolby AC-4 Level 4 のプロトタイプでは、Main または Music and Effects で CBI 22.2ch に対応した上で、更に Dialogue や Associated Audio を合計 4tr 分再生することができる模様。
Android のメディア再生ライブラリである「ExoPlayer」の実装より、Dolby AC-4 Level 4 の A-JOC は、最大 21 elements まで対応していると考えられる。
AC-4 level 3 または level 4 の場合、フォーマットはオブジェクトベースの可能性があります。
For AC-4 level 3 or level 4, the format may be object based.チャネル数が 18 (level 3 17.1 OBI) または 21 (level 4 20.1 OBI) の場合、24 のリニアチャンネルにマッピングされます (一部のチャンネルはメタデータの転送に使用されます)。
media/libraries/exoplayer/src/main/java/androidx/media3/exoplayer/trackselection/DefaultTrackSelector.java at release · androidx/media を Google 翻訳 + 微修正
When the channel count is 18 (level 3 17.1 OBI) or 21 (level 4 20.1 OBI), it is mapped to 24 linear channels (some channels are used for metadata transfer).
上記の詳細については、今後公開予定の「Android の Dolby Atmos 解説記事」で解説予定。
実際、現状入手可能な Dolby AC-4 Level 4 の A-JOC 音声を MediaInfo で見てみると、いずれも 21 elements となっている。
上記 ExoPlayer の Dolby AC-4 Level 4 テスト用音声 (音量注意)
音声
一般名 : Dolby AC-4
ビットレート : 1,525 Kbps
Bitstream level : 4
Presentation #1 : Object Audio Main
Presentation level : 4
Dolby Atmos : Yes
Substream #1 : A-JOC 20.1 (9.1 object core)
Channel mode : A-JOC 20.1 (9.1 object core)Dolby Atmos トレーラー「Amaze」「Nature’s Fury」、ショートアニメーション「Escape」等、主に映像コンテンツ
音声
一般名 : Dolby AC-4
ビットレート : 448 Kbps
Bitstream level : 4
Presentation #1 : Object Audio Main
Presentation level : 4
Dolby Atmos : Yes
Dynamic Range Control : Yes
E-AC-3 DRC profile : Film standard
Home theater AVR : Film light
Flat panel TV : Film standard
Portable speakers : Film standard
Portable headphones : Film standard
Substream #1 : A-JOC 20.1 (7.1 object core)
Channel mode : A-JOC 20.1 (7.1 object core)Karmacoda – Paris や Ultra\Violet – Untie 等、主に音楽コンテツ
音声
一般名 : Dolby AC-4
ビットレート : 256 Kbps
Bitstream level : 4
Presentation #1 : Object Audio Main
Presentation level : 4
Dolby Atmos : Yes
Dynamic Range Control : Yes
E-AC-3 DRC profile : Music light
Home theater AVR : Music light
Flat panel TV : Music light
Portable speakers : Music light
Portable headphones : Music light
Substream #1 : A-JOC 20.1 (5.1 object core)
Channel mode : A-JOC 20.1 (5.1 object core)Dolby AC-4 Level 4 (の A-JOC?) への書き出しに対応している Dolby Atmos Renderer や Immersive Master Pro では、モードとして「Music」が利用可能だが、これは恐らく上記の Dynamic Range Control (DRC) 関連の設定だと考えられる。
Dolby Digital Plus を使用する場合、映画コンテンツに適した Film モードと、音楽コンテンツに適した Music モードから選択可能です。
When using Dolby Digital Plus, you can select between Film mode and Music mode, which are recommended for film and music content, respectively.AC-4 L4 を使用する場合は、Music モードのみ選択可能です。
Exporting a master as an MP4 master file | Dolby Atmos Renderer v5.4.0 | Dolby を Google 翻訳 + 微修正
When using AC-4 L4, only Music mode is available.
Immersive Master Pro 1.3 supports batch Dolby Atmos MP4 export in:
Batch Dolby Atmos MP4 Export now available in Immersive Master Pro 1.3 — Immersive Master Pro
- Dolby Digital Plus with Dolby Atmos (Film and Music modes)
- Dolby AC-4 L4 (Music mode)
ちなみに、Dolby AC-4 Level 4 に対応した Dolby Atmos Renderer v5.4 のリリースに伴い、Dolby から「What is AC-4」という記事が公開されている。
この記事によると、Dolby AC-4 Level 4 (の恐らく A-JOC) は、バイノーラルメタデータに対応しているとのこと。Dolby AC-4 は、IMS 以外のフォーマットでもバイノーラルメタデータを使用することが可能であるようだ。
なお、バイノーラルメタデータと共にメリットとして紹介されているヘッドトラッキングについては、Level 3 以下でも対応している。そのため、バイノーラルメタデータに関しても、Level 3 以下でも対応している可能性がある。
スマホやタブレットにおける Dolby AC-4
Dolby AC-4 デコーダーを搭載している Android 端末 (2018年以降に発売された Dolby Atmos 対応機種の大半) であれば、IMS だけでなく A-JOC や CBI も再生可能。以前の Android 端末は Dolby AC-4 Level 3 までの対応だったが、最近の一部機種は、Dolby AC-4 Level 4 にも対応している。
プレゼンテーションの切り替えや、セリフの音量調整等の機能を利用するには、再生アプリ側の対応が必要となる。しかし、現状は対応しているアプリが恐らくないため、デフォルトのプレゼンテーションを、デフォルト設定で再生することしかできない。
Android 端末における Dolby AC-4 の詳細については、今後公開予定の「Android の Dolby Atmos 解説記事」で解説予定。
ホームシアターにおける Dolby AC-4
Dolby AC-4 IMS と違い、A-JOC と CBI は、ホームシアターでの再生にも適している。ただし、Dolby AC-4 デコーダーは、現状 AV アンプやサウンドバー向けには提供されていない。
上述の通り、Dolby AC-4 はユーザー側でカスタマイズ可能なコーデックである。そのため、Dolby AC-4 のデコードは、再生機器 (TV、STB、ストリーミング端末等) 側で、ユーザーの設定に合わせて実施することになっている。AV アンプやサウンドバーには、Dolby MAT 2.0 を使用して HDMI 出力する。
上記仕様のため、Dolby AC-4 のローカルファイルを再生するには、Dolby AC-4 に対応した再生機器または再生ソフトが必要。
PC の場合、有償の Dolby Reference Player を使用すれば、Dolby AC-4 の Dolby MAT 2.0 変換出力が可能。Dolby Reference Player はプレゼンテーションの選択等、様々な設定も可能となっている。
実際に Dolby AC-4 Level 4 の A-JOC 版「Amaze」トレーラーを再生している様子:
現状、Dolby AC-4 対応のフリーソフトは存在しないと考えられる。
Apple Music の バイノーラル版とダウンミックス版
Apple Music の Dolby Atmos や Dolby Audio には、オリジナルのステレオミックス版とは別で、バイノーラル版と 2.0ch ダウンミックス版が存在している。
バイノーラル版は、空間オーディオ非対応のヘッドホンを使用している状況で空間オーディオをストリーミング再生した際に使用される。
| EXT-X-STREAM-INF:AUDIO EXT-X-MEDIA:GROUP-ID |
EXT-X-STREAM-INF | EXT-X-MEDIA | ビット レート (kbps) |
|---|---|---|---|
| CODECS | CHANNELS |
||
| audio-HE-stereo-64-binaural | mp4a.40.5 | 2/-/BINAURAL | 64 |
| audio-stereo-64-binaural | mp4a.40.2 | 2/-/BINAURAL | 64 |
| audio-stereo-128-binaural | mp4a.40.2 | 2/-/BINAURAL | 128 |
| audio-stereo-256-binaural | mp4a.40.2 | 2/-/BINAURAL | 256 |
2.0ch ダウンミックス版は、通信環境が悪い状況で空間オーディオをストリーミング再生した際に使用される。
| EXT-X-STREAM-INF:AUDIO EXT-X-MEDIA:GROUP-ID |
EXT-X-STREAM-INF | EXT-X-MEDIA | ビット レート (kbps) |
|---|---|---|---|
| CODECS | CHANNELS |
||
| audio-HE-stereo-64-downmix | mp4a.40.5 | 2/-/DOWNMIX | 64 |
| audio-stereo-64-downmix | mp4a.40.2 | 2/-/DOWNMIX | 64 |
| audio-stereo-128-downmix | mp4a.40.2 | 2/-/DOWNMIX | 128 |
| audio-stereo-256-downmix | mp4a.40.2 | 2/-/DOWNMIX | 256 |
ダウンミックス版を再生するときは、自動で「ステレオを空間化」機能が有効になり、5.1ch にアップミックスされて再生される。この時、iOS / iPadOS 16 では、再生画面には Dolby Atmos や Dolby Audio のロゴが表示されるが、コントロールセンターの AirPods の音声ステータスは「ステレオ」になっている。
「ステレオ」表示ではあるが、通常のステレオ音声再生時とは違って、右下のボタンは「ステレオを空間化」ではなく「空間オーディオ」になっている。
バイノーラル版を再生するのではなく、わざわざダウンミックス版をアップミックスしているのは、恐らくヘッドトラッキングや HRTF のパーソナライズのためだと考えられる。
この処理については Apple 自身が動画で説明しているので、日本語字幕を抜粋して引用しておく。(なお、筆者にて句読点を追加している)
ステレオソースをアップミックスして、5.1チャンネルを再現する技術も提供しています。
(略)
また、この処理を暗黙のうちに行うことで、空間音声の採用や提供をより魅力的なものにします。
今現在、マルチチャンネル音声を配信することで、メディアの映像品質が損なわれることを心配される方もいるでしょう。
マルチチャンネルオーディオは現在提供されているステレオのAACレンディションよりも、はるかに高ビットレートです。
ネットワークの帯域が限られている中で、この2つを両立させるにはどうすればいいのでしょうか。これは本当に困ったことです。
この問題を解決するために、ユーザーの帯域に合わせて空間的なオーディオ体験を実現しました。
帯域が不足して高品質な映像を提供できない場合、音声はシームレスに劣化し、アップミックスされたステレオ音声になりますが、空間処理は変わりません。移行前に提供されていたヘッドトラッキングは維持されます。
その後、帯域が確実に回復すると、フルマルチチャンネルの空間処理が復活します。
Immerse your app in Spatial Audio – WWDC21 – Videos – Apple Developer
ステレオを空間化の詳細については、以下の記事にて。
オリジナルのステレオ版とは別で、ダウンミックス版を用意している理由は、おそらく「ステレオを空間化」に最適化された、専用のマトリックスエンコードが行われているのだと考えられる。
正直、このような処理をするぐらいなら Dolby AC-4 IMS を使用してほしいものである。
なお、この処理は「ステレオを空間化」機能に依存しているため、Android 版では利用不可。空間オーディオを有効にしていても、通信環境が悪い場合はバイノーラル版にすらならず、ステレオミックス版が再生される。
360 Reality Audio
360 Reality Audio (サンロクマル・リアリティオーディオ / 360RA) は、ソニーによるオブジェクトベースのイマーシブサウンドのフォーマット (というよりも制作から配信までのソリューション?) である。
Dolby Atmos と比べると、「上方向だけでなく下方向からの音も表現できる」「チャンネルベースの音声トラックを使用しない (LFE もない)、完全なオブジェクトベースオーディオ」といった特徴を持つ。
Amazon Music は 360 Reality Audio を採用しているが、Apple Music では今の所採用されていない。Apple Music は特に Dolby Atmos にこだわっているわけではなく、今後も対応フォーマットの拡充を進めていく予定である模様。
360 Reality Audio のコーデックは、Amazon Music に限らず現状 MPEG-H 3D Audio のみ。MPEG-H 3D Audio は、MPEG-H Audio と呼ばれることもある。
MPEG-H 3D Audio を使用したフォーマットとしては、360 Reality Audio 以外にも THX Spatial Audio 等がある。
Amazon Music の 360 Reality Audio
mha1
| URL ql パラメーター |
ファイル名 サフィックス |
AdaptationSet | Representation | オブジェクト数 | ビット レート (kbps) |
|||
|---|---|---|---|---|---|---|---|---|
| selection Priority |
quality Ranking |
codecs | audio Sampling Rate |
使用 | 最大 | |||
| SPATIAL_RA360_L0 | 3D_S360RA_L0 | 3000 | 4 | mha1.0x0c | 48000 | 5 | 5 | 320 |
| SPATIAL_RA360_L1 | 3D_S360RA_L1 | 3000 | 3 | mha1.0x0d | 48000 | 10 | 10 | 640 |
| SPATIAL_RA360_L2 | 3D_S360RA_L2 | 3000 | 2 | mha1.0x0d | 48000 | 13 | 16 | 1024 |
| SPATIAL_RA360_L3 | 3D_S360RA_L3 | 3000 | 1 | mha1.0x0e | 48000 | 17 | 24 | 1536 |
mhm1
| URL ql パラメーター |
ファイル名 サフィックス |
AdaptationSet | Representation | オブジェクト数 | ビット レート (kbps) |
|||
|---|---|---|---|---|---|---|---|---|
| selection Priority |
quality Ranking |
codecs | audio Sampling Rate |
使用 | 最大 | |||
| SPATIAL_RA360_L0 | 3D_S360RA_L0 | 3500 | 4 | mhm1.0x0c | 48000 | 5 | 5 | 320 |
| SPATIAL_RA360_L1 | 3D_S360RA_L1 | 3500 | 3 | mhm1.0x0d | 48000 | 10 | 10 | 640 |
| SPATIAL_RA360_L2 | 3D_S360RA_L2 | 3500 | 2 | mhm1.0x0d | 48000 | 13 | 16 | 1024 |
| SPATIAL_RA360_L3 | 3D_S360RA_L3 | 3500 | 1 | mhm1.0x0e | 48000 | 17 | 24 | 1536 |
mha1 と mhm1 は単一ストリームの MPEG-H 3D Audio を指す。これらのうち、mhm1 は MPEG-H Audio Stream (MHAS) でカプセル化されている。
MIMETYPE_AUDIO_MPEGH_MHA1
MIME type for MPEG-H Audio single stream
Constant Value: “audio/mha1”MIMETYPE_AUDIO_MPEGH_MHM1
MediaFormat | Android Developers
MIME type for MPEG-H Audio single stream, encapsulated in MHAS
Constant Value: “audio/mhm1”
MPEG-H 3D Audio において、
- 0x0b = Low Complexity Profile Level 1
- 0x0c = Low Complexity Profile Level 2
- 0x0d = Low Complexity Profile Level 3
- 0x0e = Low Complexity Profile Level 4
を指す。頭の 0x は「これは 16 進数です」という意味。MPEG-H 3D Audio の Level は、Dolby AC-4 の Level と似た概念。
If the MHAConfigurationBox() is present, the MPEG-H Profile-Level Indicator
ATSC Standard: A/342:2021 Part 3, MPEG-H Systemmpegh3daProfileLevelIndicationin theMHADecoderConfigurationRecord()shall be set to “0x0B”, “0x0C”, or “0x0D” for MPEG-H Audio Low Complexity Profile Level 1, Level 2, or Level 3, respectively.
MIMETYPE_AUDIO_MPEGH_LC_L3
MIME type for MPEG-H Low Complexity (LC) L3 audio stream. Uses the scheme defined by RFC 6381 with mpegh3daProfileLevelIndication for LC profile/L3 (0xD) from ISO/IEC 23008-3.
Constant Value: “audio/mhm1.0d”
MIMETYPE_AUDIO_MPEGH_LC_L4
MIME type for MPEG-H Low Complexity (LC) L4 audio stream. Uses the scheme defined by RFC 6381 with mpegh3daProfileLevelIndication for LC profile/L4 (0xE) from ISO/IEC 23008-3.
Constant Value: “audio/mhm1.0e”
MediaFormat | Android Developers
MPEG-H 3D Audio でエンコードされた 360 Reality Audio 音源のことは、360 Reality Audio Music Format と呼ぶ。360 Reality Audio Music Format では、3 つの Level (と 1 つの規格外の Level) が定義されている。
360 Reality Audio Music Format の Level は、MPEG-H 3D Audio の Level とは異なる概念である。
最大オブジェクト数24個/平均ビット・レート1.5MbpsのLevel 3をはじめ、16個/1MbpsのLevel 2、10個/640kbpsのLevel 1、そして360 Reality Audio Music Format外だが5個/320kbpsのLevel 0.5。
360 Reality Audioの仕組みとコンテンツ制作の方法 – サンレコ 〜音楽制作と音響のすべてを届けるメディア
なお、Amazon Music の 360 Reality Audio の音声ファイルを MediaInfo で見てみると、Level 2 では 13 オブジェクト、Level 3 では 17 オブジェクトしか使っていないように見受けられる。が、あくまでファイルのメタデータ上の話で、実際のところは不明。
Level 0
音声
形式 : MPEG-H 3D Audio
形式のプロファイル : LC@L2, BL@L2
ビットレート : 335 Kbps
チャンネル : 8 チャンネル (7.1)
チャンネルの配置 : L R C LFE Ls Rs Lw Rw
サンプルレート : 48.0 KHz
Signal group #1 : 5 objectsLevel 1
音声
形式 : MPEG-H 3D Audio
形式のプロファイル : LC@L3, BL@L3
ビットレート : 669 Kbps
チャンネル : 12 チャンネル (7.1.4)
チャンネルの配置 : L R C LFE Lb Rb Lss Rss Tfl Tfr Tbl Tbr
サンプルレート : 48.0 KHz
Signal group #1 : 10 objectsLevel 2
音声
形式 : MPEG-H 3D Audio
形式のプロファイル : LC@L3, BL@L3
ビットレート : 1,070 Kbps
チャンネル : 12 チャンネル (7.1.4)
チャンネルの配置 : L R C LFE Lb Rb Lss Rss Tfl Tfr Tbl Tbr
サンプルレート : 48.0 KHz
Signal group #1 : 13 objectsLevel 3
音声
形式 : MPEG-H 3D Audio
形式のプロファイル : LC@L4, BL@L3
ビットレート : 1,604 Kbps
チャンネル : 24 チャンネル (22.2)
チャンネルの配置 : Lw Rw C LFE Lb Rb L R Cb LFE2 Lss Rss Tfl Tfr Tfc Tc Tbl Tbr Tsl Tsr Tbc Bfc Bfl Bfr
サンプルレート : 48.0 KHz
Signal group #1 : 17 objectsAmazon Music においては、360 Reality Audio Music Format の Level は、URL の ql パラメーターや、ファイル名のサフィックス (接尾語) として記載されている。L0 とはオブジェクト数的に Level 0.5 のことを指しているのだろう。
サービス・プラットフォーム別の音声
現状最新の「配信サービスと採用コーデックの一覧」を無理矢理表にまとめると、下記のようになる。
| プラット フォーム |
iPhone / iPad | ||||||
|---|---|---|---|---|---|---|---|
| DD+ JOC | 対応 | 非対応 | |||||
| 出力先 | 空間オーディオ対応の 内蔵スピーカー・ヘッドホン |
空間オーディオ非対応ヘッドホン | – | ||||
| 再生方法 | ストリーミング (通信速度:高) または ダウンロード |
ストリーミング (通信速度:低) |
ストリーミング (通信速度:問わず) |
ダウンロード | – | ||
| ドルビー アトモス (Apple Music) |
自動 または 常にオン |
自動 または 常にオン |
自動 | 常にオン | 自動 | 常にオン | – |
| Amazon Music |
AC-4 IMS Dolby Renderer (アプリ内) |
AC-4 IMS Dolby Renderer (アプリ内) |
AC-4 IMS Dolby Renderer (アプリ内) |
AC-4 IMS Dolby Renderer (アプリ内) |
AC-4 IMS Dolby Renderer (アプリ内) |
AC-4 IMS Dolby Renderer (アプリ内) |
AC-4 IMS Dolby Renderer (アプリ内) |
| Apple Music |
DD+ JOC Apple Renderer (端末側) |
AAC 2.0ch ダウンミックス を 5.1ch にアップミックス Apple Renderer (端末側) |
AAC or ALAC ステレオ または AAC バイノーラル Dolby Renderer? (サーバー側) |
AAC バイノーラル Dolby Renderer? (サーバー側) |
AAC ステレオ または DD+ JOC Dolby Renderer (端末側) |
DD+ JOC Dolby Renderer (端末側) |
– |
| TIDAL | AC-4 IMS Dolby Renderer (アプリ内) |
AC-4 IMS Dolby Renderer (アプリ内) |
AC-4 IMS Dolby Renderer (アプリ内) |
AC-4 IMS Dolby Renderer (アプリ内) |
AC-4 IMS Dolby Renderer (アプリ内) |
AC-4 IMS Dolby Renderer (アプリ内) |
AC-4 IMS Dolby Renderer (アプリ内) |
| プラット フォーム |
Android 端末 | ||
|---|---|---|---|
| DD+ JOC | 対応 | 対応 | 非対応 |
| AC-4 IMS | 対応 | 非対応 | 非対応 |
| Amazon Music |
AC-4 IMS Dolby Renderer (端末側) |
AC-4 IMS Dolby Renderer (アプリ内) |
AC-4 IMS Dolby Renderer (アプリ内) |
| Apple Music |
DD+ JOC Dolby Renderer (端末側) |
DD+ JOC Dolby Renderer (端末側) |
– |
| TIDAL | AC-4 IMS Dolby Renderer (端末側) |
不明 | 不明 |
| プラット フォーム |
Amazon Fire TV | Apple TV | Android TV Google TV |
|||
|---|---|---|---|---|---|---|
| DD+ JOC | 対応 | 対応 | 対応 | 対応 | ||
| Dolby MAT 2.0 | 対応 | 非対応 | 対応 | 非対応 | ||
| 出力先 | AV アンプ サウンドバー |
AV アンプ サウンドバー |
AV アンプ サウンドバー |
空間オーディオ 対応ヘッドホン |
AV アンプ サウンドバー |
|
| 出力設定 | サラウンド音響 「自動選択」 |
サラウンド音響 「Dolby Digital Plus」 |
サラウンド音響 「自動選択」または 「Dolby Digital Plus」 |
フォーマットを変更「オフ」 ドルビーアトモス「オン」 |
空間オーディオ 「固定」または 「ヘッドトラッキング」 |
形式の選択 「自動」または 「手動」にて 「ドルビー アトモス / ドルビー デジタル プラス」を有効化 |
| Amazon Music |
DD+ JOC Dolby MAT 2.0 |
DD+ JOC Bitstream |
DD+ JOC Bitstream |
– | – | – |
| Apple Music |
– | – | – | DD+ JOC Dolby MAT 2.0 |
DD+ JOC Apple Renderer (端末側) |
– |
| TIDAL | – | – | – | DD+ JOC Dolby MAT 2.0 |
不明 | DD+ JOC Bitstream |
Amazon Music
スマホやタブレットには Dolby AC-4 IMS を、ストリーミング端末には Dolby Digital Plus JOC を提供している。Dolby AC-4 非対応端末では、アプリ内でデコード・バーチャライズを行っている。
以前の Android 版 Amazon Music は、Dolby AC-4 対応端末でもアプリ内でデコード・バーチャライズする仕様だったが、2024年5月末リリースの 24.9.0 より、端末側で処理するようになった。
Android版Amazon Music、Dolby Atmos (DAX3)搭載機種では、Dolby Atmos (AC-4 IMS)音声を端末側でデコード&バーチャライズさせるようになった (今までは対応機種でも全部アプリ内で処理)
— 井戸水 (@idomizu_) June 15, 2024
Xperiaの「音質と画質のステータス」は、こういうのに気づきやすく検証に便利 pic.twitter.com/5LOrFF4u9A
要は、Amazon Music アプリの最新バージョンさえインストールできれば、どんな機種でも空間オーディオを聴くことができる。ただし、その仕様により、以下のような問題が発生している。
Apple Music
基本的にはすべてのプラットフォームに Dolby Digital Plus JOC を提供しているが、条件次第ではバイノーラル版やダウンミックス版を提供する場合がある。
特に iOS / iPadOS 版は複雑で、「ドルビーアトモス (Dolby Atmos)」の設定が「自動 (Automatic)」か「常にオン (Always On)」か、ストリーミング再生かダウンロード再生か、及び、機器の組み合わせ等によって、挙動が異なる。
現時点で把握している情報を表にまとめると、下記の通り。なお、下記はキャッシュの状況等によって、選択される音声が変わることがある。
| 再生方法 | 出力先 | Bluetooth デバイスタイプ |
ドルビー アトモス |
iPhone 16 Pro Max (iOS 18) |
iPad mini (第6世代) (iPadOS 18) |
iPad mini (第6世代) (iPadOS 17) |
|---|---|---|---|---|---|---|
| ストリーミング (通信速度:高) |
内蔵スピーカー | (設定なし) | 自動 | Dolby Digital Plus JOC | Dolby Digital Plus JOC | Dolby Digital Plus JOC |
| 常にオン | Dolby Digital Plus JOC | Dolby Digital Plus JOC | Dolby Digital Plus JOC | |||
| AirPods Pro 1 | (設定なし) | 自動 | Dolby Digital Plus JOC | Dolby Digital Plus JOC | Dolby Digital Plus JOC | |
| 常にオン | Dolby Digital Plus JOC | Dolby Digital Plus JOC | Dolby Digital Plus JOC | |||
| Walkman ZX300 (Bluetooth レシーバー機能) |
ヘッドフォン | 自動 | バイノーラル | バイノーラル | バイノーラル | |
| 常にオン | バイノーラル | バイノーラル | バイノーラル | |||
| ヘッドフォン以外 | 自動 | ステレオ | ステレオ | ステレオ | ||
| 常にオン | ステレオ | ステレオ | ステレオ | |||
| Pixel Buds Pro | ヘッドフォン | 自動 | ステレオ | バイノーラル | バイノーラル | |
| 常にオン | バイノーラル | バイノーラル | バイノーラル | |||
| ヘッドフォン以外 | 自動 | ステレオ | ステレオ | ステレオ | ||
| 常にオン | ステレオ | ステレオ | ステレオ | |||
| Galaxy Buds2 | ヘッドフォン | 自動 | ステレオ | バイノーラル | (未調査) | |
| 常にオン | バイノーラル | バイノーラル | (未調査) | |||
| ヘッドフォン以外 | 自動 | ステレオ | ステレオ | (未調査) | ||
| 常にオン | ステレオ | ステレオ | (未調査) | |||
| ストリーミング (通信速度:低) |
内蔵スピーカー | (設定なし) | 自動 | ダウンミックス | ダウンミックス | ダウンミックス |
| 常にオン | ダウンミックス | ダウンミックス | ダウンミックス | |||
| AirPods Pro 1 | (設定なし) | 自動 | ダウンミックス | ダウンミックス | ダウンミックス | |
| 常にオン | ダウンミックス | ダウンミックス | ダウンミックス | |||
| Walkman ZX300 (Bluetooth レシーバー機能) |
ヘッドフォン | 自動 | バイノーラル | バイノーラル | ダウンミックス | |
| 常にオン | バイノーラル | バイノーラル | ダウンミックス | |||
| ヘッドフォン以外 | 自動 | ステレオ | ステレオ | (未調査) | ||
| 常にオン | ステレオ | ステレオ | (未調査) | |||
| Pixel Buds Pro | ヘッドフォン | 自動 | ステレオ | バイノーラル | ダウンミックス | |
| 常にオン | バイノーラル | バイノーラル | ダウンミックス | |||
| ヘッドフォン以外 | 自動 | ステレオ | ステレオ | (未調査) | ||
| 常にオン | ステレオ | ステレオ | (未調査) | |||
| Galaxy Buds2 | ヘッドフォン | 自動 | ステレオ | バイノーラル | (未調査) | |
| 常にオン | バイノーラル | バイノーラル | (未調査) | |||
| ヘッドフォン以外 | 自動 | ステレオ | ステレオ | (未調査) | ||
| 常にオン | ステレオ | ステレオ | (未調査) | |||
| ダウンロード (オンライン・ オフライン 問わず) |
内蔵スピーカー | (設定なし) | 自動 | Dolby Digital Plus JOC | Dolby Digital Plus JOC | Dolby Digital Plus JOC |
| 常にオン | Dolby Digital Plus JOC | Dolby Digital Plus JOC | Dolby Digital Plus JOC | |||
| AirPods Pro 1 | (設定なし) | 自動 | Dolby Digital Plus JOC | Dolby Digital Plus JOC | Dolby Digital Plus JOC | |
| 常にオン | Dolby Digital Plus JOC | Dolby Digital Plus JOC | Dolby Digital Plus JOC | |||
| Walkman ZX300 (Bluetooth レシーバー機能) |
ヘッドフォン | 自動 | Dolby Digital Plus JOC | Dolby Digital Plus JOC | Dolby Digital Plus JOC | |
| 常にオン | Dolby Digital Plus JOC | Dolby Digital Plus JOC | Dolby Digital Plus JOC | |||
| ヘッドフォン以外 | 自動 | ステレオ | ステレオ | ステレオ | ||
| 常にオン | ステレオ | ステレオ | ステレオ | |||
| Pixel Buds Pro | ヘッドフォン | 自動 | ステレオ | Dolby Digital Plus JOC | Dolby Digital Plus JOC | |
| 常にオン | Dolby Digital Plus JOC | Dolby Digital Plus JOC | Dolby Digital Plus JOC | |||
| ヘッドフォン以外 | 自動 | ステレオ | ステレオ | ステレオ | ||
| 常にオン | ステレオ | ステレオ | ステレオ | |||
| Galaxy Buds2 | ヘッドフォン | 自動 | ステレオ | Dolby Digital Plus JOC | (未調査) | |
| 常にオン | Dolby Digital Plus JOC | Dolby Digital Plus JOC | (未調査) | |||
| ヘッドフォン以外 | 自動 | ステレオ | ステレオ | (未調査) | ||
| 常にオン | ステレオ | ステレオ | (未調査) |
Apple Music では、Dolby Digital Plus JOC を端末側でデコード・バーチャライズしているため、Dolby Digital Plus 非対応端末では Dolby Atmos の設定項目が現れない。
なお、先程「Dolby Digital Plus JOC は、Dolby Atmos 非対応の Dolby Digital Plus 対応機器とも互換性がある」と述べたが、この仕様を利用しているのは iOS / iPadOS 版のみで、Android 版は端末が Dolby Digital Plus JOC に対応していないと、Dolby Atmos / Dolby Audio 音声を聴くことはできない。
実際、以下に示す様々な Dolby Audio 対応 (= Dolby Digital / Dolby Digital Plus 対応だが Dolby Digital Plus JOC は非対応) 機種で検証したところ、空間オーディオの設定は現れなかった。
- arrows NX F-01K (Android 9)
- Lenovo Tab M8 HD (2nd Gen) (Android 10)
- Lenovo Tab K10 (Android 11 ~ 12)
- Pixel 6 (Android 13 ~ 14)
- Pixel 8 Pro (Android 14)
- Pixel 9 Pro XL (Android 14 ~ 15)
逆に、Dolby Atmos 対応の Android に対して Dolby Audio 音声は一応提供されているものの、なぜか 7.1ch 音声のみで、5.1ch 音声は提供されていない (2.0ch 音声の提供になる)。
なお、iOS / iPadOS 版は再生画面用に「Dolby Audio」のロゴも用意されているが、Android 版は Dolby Audio を再生しても、再生画面のロゴは「Dolby Atmos」となる。
Android版Apple MusicはDolby Audio音声が全く提供されないと思ってたけど、厳密にはDD 5.1chに非対応なだけで、DD+ 7.1chは対応してたらしい
— 井戸水 (@idomizu_) November 7, 2024
ただし再生画面のロゴはDolby Atmos (iOS/iPadOS版はDolby Audioロゴ) pic.twitter.com/tpa3Y97x3B













こんにちは、私は台湾のネチズンです。この文章は Google 翻訳を通じて日本語に翻訳されました。
空間オーディオに関する多くのコンテンツを企画・公開していただき、大変感謝しており、感心しております。
お聞きしたいのですが、Apple Music で Dolby Atmos の曲を再生するために SONY Xperia 5 IV を使用しているのですが、携帯電話自体の Dolby Sound 機能がオンになっていない場合、Dolby Atmos は正しくデコードできますか?
はい、正しく再生できます。 、しかし、私にはそれをオンにするのは違うように思えます。ドルビーアトモスという言葉はまだApple Musicに表示されていますが、ドルビーをオンにしない限り、携帯電話のステータス表示には「ドルビーアトモス」ではなく「通常」のみが表示されます。
私は Xperia 1 IV ユーザーですが、Xperia 5 IV も恐らく同じ挙動だと思われるので、その前提で解説します。
結論から言いますと、Android 13 の場合、Dolby Atmos 再生時に Dolby Sound をオンにする必要はありません。
Android 12 の頃は、Dolby Sound がオンでもオフでも、Dolby Atmos を再生すると「Dolby Atmos」と表示されていたと記憶していますが、Android 13 では Dolby Sound がオンのときのみ「Dolby Atmos」表示、オフのときは「ノーマル」表示になるよう変更されました。
ですが、この「ノーマル」表示になっているとき (Dolby Sound がオフのとき) でも、バーチャライザー (Dolby Surround Virtualizer) のような Dolby Atmos の再生に必要最低限な機能は暗黙的に適用され、ダウンミックスになることはありません。
Dolby Sound をオンにすることで有効になるのは、必ずしも必要ではない音質/音量改善機能です。
なお、この挙動はあくまで Xperia 1 IV の例であり、他の機種では異なる場合がありますのでご注意ください。