音楽サブスクはどのように空間オーディオを提供しているのか
更新履歴
この記事は、一度書いたらそれで終わりではない。公開後も動向を追い続け、新情報があれば、その都度追記や修正を行っている。
主な更新履歴は下記の通り。下記以外にも、細かい修正や文章の見直し等は適宜行っている。
- 2021/08: 記事公開、当初のタイトルは「Apple Music を解析する」
- 2022/01: Amazon Music について追記、それに伴いタイトルや記事の構成を変更
- 2022/05: Galaxy Buds Pro で Dolby AC-4 IMS のヘッドトラッキングができたことを追記
- 2023/05: Dolby AC-4 IMS の動作、Dolby AC-4 A-JOC / CBI の概要、Apple Music のダウンミックス版について追記
- 2024/03: Apple Music Classical、Amazon Music の新仕様 (URL の ql パラメーターと 360 Reality Audio の mhm1)、Amazon Music における 360 Reality Audio のオブジェクト数について追記
- 2024/07: 「配信サービスと採用コーデックの一覧」の表を修正
- 2024/09: 「配信サービスと採用コーデックの一覧」の表を修正
- 2024/10: 「配信サービスと採用コーデックの一覧」の表を修正
- 2024/11: Apple Music の Dolby Audio 7.1ch について追記
- 2025/08: Dolby AC-4 における A-JOC / CBI、Level、コアデコード / フルデコードの解説を追記
- 2025/09: Apple Music の「ドルビーアトモス」設定における「自動」と「常にオン」の挙動について追記、「配信サービスと採用コーデックの一覧」の表を修正、Apple Music の AAC LC 64kbps について追記
はじめに
最近、特に Amazon Music や Apple Music が空間オーディオを提供するようになってから、Dolby Atmos や 360 Reality Audio などを利用した楽曲が注目されている。
だが、それらはストリーミングサービスというクローズドな環境で提供される上に、Dolby Atmos に関しては Dolby のプロプライエタリなフォーマットを使用している。
そのため、これらのフォーマットで音楽制作する方法や再生する方法については様々なメディアで解説されているが、制作された音源がどのようにエンコードされ、視聴者のもとへ届けられ、そしてデコードされるかの、「間」の部分に関しては、あまり知られていない。
この記事では、音楽サブスクを対象に、今まであまり触れられてこなかった空間オーディオの中間部分について解析し、解説していこうと思う。
サンレコのコラムで当記事が紹介されました。このコラムへの監修もしています。
なお、「配信サービスと採用コーデックの一覧」については、一部誤りや古い情報が含まれています。最新の表については、記事末尾の「サービス・プラットフォーム別の音声」をご参照ください。
配信システム
プロトコル
Apple Music では、Apple が提唱する HLS (HTTP Live Streaming) が使用されている。一方 Amazon Music では、MPEG-DASH (Dynamic Adaptive Streaming over HTTP) が用いられている。MPEG-DASH は単に DASH と呼ばれることも多いため、この記事でも以降 DASH と呼ぶ。
HLS も DASH も、その名の通り HTTP を用いてメディアファイルをストリーミング配信する規格である。両技術とも、各メディアファイルのビットストリームは一定時間ごとに分割 (フラグメント化) されており、分割された一つ一つのパーツをセグメント、あるいはチャンクと言う。
分割することによってファイル全体のダウンロード完了を待つことなく再生を開始することができ、また、途中から再生する場合にファイルを冒頭から取得してくる必要もない (もちろんヘッダー情報等は必要ではあるが)。
さらに、ネットワークの速度や安定性などに応じて、再生中にシームレスにビットレートを切り替える「アダプティブビットレート」も行うことができる。
DASH は HLS よりも新しい規格で、DASH 登場以前は Apple の HLS の他にも、Microsoft の SS (Smooth Streaming) や Adobe の HDS (HTTP Dynamic Streaming) など、同様のストリーミング規格がいくつか存在していた。
DASH はこれらの独自規格をまとめるべく策定された規格であり、ISO/IEC 23009-1 として国際標準となっている。そのため、HLS と DASH は細かな違いはあるものの、大枠はほぼ同じである。
マニフェストファイル
Apple Music で使用される HLS では、1 つのメディアにつき、2 つの「マニフェストファイル」と呼ばれるファイルを用いて再生を制御している。1 つは「マスタープレイリスト」や「マスターマニフェスト」などと呼ばれるファイルで、もう 1 つは「インデックスファイル」と呼ばれるファイルである。
マスタープレイリストは、名前に「マスター」とあるように、一つ一つのコンテンツ (作品) ごとの各ビットストリーム (ステレオの低ビットレート版と高ビットレート版、Dolby Atmos の低ビットレート版と高ビットレート版などなど…) を取りまとめるもの。
「プレイリスト」とあるように、各ビットストリームの情報 (コーデック、ビットレート、サンプリング周波数、量子化ビット数、インデックスファイルの URL など) が、M3U プレイリスト形式で記述されている。
インデックスファイルは各ビットストリームごとに存在し、ビットストリームの URL、セグメントの再生順、各セグメントの秒数などが記されている。
HLS の再生手順は以下の通り。
- クライアント側の再生ソフトが、再生するコンテンツのマスタープレイリストをサーバーから取得する。
- 再生機器 (あるいは再生ソフト) が対応しているコーデック、ユーザーの画質/音質設定、ネットワーク状況などをもとに、マスタープレイリストから最適なビットストリームを決定する。
- 再生したいビットストリームのインデックスファイルの URL をマスタープレイリストから読み取り、インデックスファイルを取得する。
- インデックスファイルに従い、ビットストリームを取得して再生を行う。
一方 Amazon Music の DASH では、MPD (Media Presentation Description) というマニフェストファイルが使用される。MPD は HLS のマスタープレイリストとインデックスファイルを 1 つにまとめたようなもので、XML 形式で記述されている。
音源の仕様
マニフェストファイルに記載されているビットストリームの情報を表にまとめた。詳細に関しては、後で詳しく解説するため、今はすべて理解する必要はない。
ファイル名サフィックス、オブジェクト数、ビットレート以外の項目は、マニフェストファイルの値そのままを記載しているため、一部わかりにくい表記が存在する。
Amazon Music では項目名が “audioSamplingRate” “bitDepth” といった一見奇妙な書き方がされているが、これは lowerCamelCase という記法である。Apple Music の “SAMPLE-RATE” や “BIT-DEPTH” といった記法は、UPPER-KEBAB-CASE や SCREAMING-KEBAB-CASE などと呼ばれる。
なお、Apple Music Classical は、あくまで UI をクラシックに最適化したアプリであり、音源などは Apple Music のものをそのまま使用している。
Amazon Music – ステレオ
SD
URL ql パラメーター |
ファイル名 サフィックス |
AdaptationSet | Representation | ビット レート (kbps) |
||
---|---|---|---|---|---|---|
selection Priority |
quality Ranking |
codecs | audio Sampling Rate |
|||
SD_LOW | Low | 1000 | 3 | opus | 48000 | 48 |
SD_MEDIUM | Medium | 1000 | 2 | opus | 48000 | 192 |
SD_HIGH | High | 1000 | 1 | opus | 48000 | 320 |
44.1kHz ではなく 48kHz なのは Opus の仕様。
HD
URL ql パラメーター |
ファイル名 サフィックス |
AdaptationSet | Representation | |||
---|---|---|---|---|---|---|
selection Priority |
quality Ranking |
codecs | audio Sampling Rate |
bit Depth |
||
HD_44 | HD44 | 2000 | 4 | flac | 44100 | 16 |
HD_48 | HD48 | 2000 | 3 | flac | 48000 | 16 |
HD_96 | HD96 | 2000 | 2 | flac | 96000 | 16 |
ロスレスのうち、16bit のものはサンプリング周波数に関わらず HD 扱いされる。88.2kHz の音源は 48kHz へ、176.4kHz の音源は 96kHz へ、それぞれダウンコンバートされる。192kHz / 16bit は未発見。
ULTRA HD
URL ql パラメーター |
ファイル名 サフィックス |
AdaptationSet | Representation | |||
---|---|---|---|---|---|---|
selection Priority |
quality Ranking |
codecs | audio Sampling Rate |
bit Depth |
||
UHD_44 | UHD44 | 2000 | 0 | flac | 44100 | 24 |
UHD_48 | UHD48 | 2000 | 3 | flac | 48000 | 24 |
UHD_96 | UHD96 | 2000 | 2 | flac | 96000 | 24 |
UHD_192 | UHD192 | 2000 | 1 | flac | 192000 | 24 |
ロスレスのうち、24bit のものはサンプリング周波数に関わらず ULTRA HD 扱いされる。88.2kHz の音源は 48kHz へ、176.4kHz の音源は 96kHz へ、それぞれダウンコンバートされる。
Apple Music – ステレオ
ロッシー
EXT-X-STREAM-INF:AUDIO EXT-X-MEDIA:GROUP-ID |
EXT-X-STREAM-INF | ビット レート (kbps) |
---|---|---|
CODECS | ||
audio-HE-stereo-64 | mp4a.40.5 | 64 |
audio-stereo-64 | mp4a.40.2 | 64 |
audio-stereo-128 | mp4a.40.2 | 128 |
audio-stereo-256 | mp4a.40.2 | 256 |
- mp4a.40.5 = MPEG-4 HE-AAC v1
- mp4a.40.2 = MPEG-4 AAC LC
ロスレス
EXT-X-STREAM-INF:AUDIO EXT-X-MEDIA:GROUP-ID |
EXT-X-STREAM-INF | EXT-X-MEDIA | |
---|---|---|---|
CODECS | SAMPLE -RATE |
BIT- DEPTH |
|
audio-alac-stereo-44100-16 | alac | 44100 | 16 |
audio-alac-stereo-44100-24 | alac | 44100 | 24 |
audio-alac-stereo-48000-16 | alac | 48000 | 16 |
audio-alac-stereo-48000-24 | alac | 48000 | 24 |
ロスレスのうち、48kHz 以下のものは量子化ビット数に関わらずハイレゾ扱いされない。
ハイレゾロスレス
EXT-X-STREAM-INF:AUDIO EXT-X-MEDIA:GROUP-ID |
EXT-X-STREAM-INF | EXT-X-MEDIA | |
---|---|---|---|
CODECS | SAMPLE -RATE |
BIT- DEPTH |
|
audio-alac-stereo-88200-24 | alac | 88200 | 24 |
audio-alac-stereo-96000-16 | alac | 96000 | 16 |
audio-alac-stereo-96000-24 | alac | 96000 | 24 |
audio-alac-stereo-176400-24 | alac | 176400 | 24 |
audio-alac-stereo-192000-24 | alac | 192000 | 24 |
ロスレスのうち、88.2kHz 以上のものは量子化ビット数に関わらずハイレゾ扱いされる。96kHz 以外の 16bit 音源は未発見。
Amazon Music – 空間オーディオ
Dolby Atmos (Dolby Digital Plus JOC / ホームシアター用)
URL ql パラメーター | ファイル名 サフィックス |
AdaptationSet | Representation | Channel Configuration |
EC3_ Extension Complexity Index |
EC3_ Extension Type |
ビット レート (kbps) |
||
---|---|---|---|---|---|---|---|---|---|
selection Priority |
quality Ranking |
codecs | audio Sampling Rate |
||||||
SPATIAL_ATMOS_LOW | (不明) | 3000 | 3 | ec-3 | 48000 | 6 | 256 | ||
SPATIAL_ATMOS_MEDIUM | (不明) | 3000 | 2 | ec-3 | 48000 | 6 | 16 | JOC | 448 |
SPATIAL_ATMOS_HIGH | (不明) | 3000 | 1 | ec-3 | 48000 | 6 | 16 | JOC | 768 |
ec-3 は Dolby Digital Plus (Enhanced AC-3) のこと。量子化ビット数の記載はないが、恐らくすべて 16bit だと思われる。一番上のものは 6ch (5.1ch 構成) ダウンミックス。
Dolby Atmos (Dolby AC-4 IMS / モバイル機器用)
URL ql パラメーター | ファイル名 サフィックス |
AdaptationSet | Representation | Channel Configuration |
virtualized_ content |
ビット レート (kbps) |
||
---|---|---|---|---|---|---|---|---|
selection Priority |
quality Ranking |
codecs | audio Sampling Rate |
|||||
SPATIAL_ATMOS_LOW | 3D_Datmos_Low | 2500 | 2 | ac-4.02.02.00 | 48000 | 2 | 1 | 112 |
SPATIAL_ATMOS_MEDIUM | 3D_Datmos_Med | 2500 | 1 | ac-4.02.02.00 | 48000 | 2 | 1 | 256 |
ac-4.02.02.00 は、Dolby AC-4 というコーデックの、Immersive Stereo (IMS) というフォーマットのことを指す。
- ac-4.02.02.00
- ac-4: fourCC = ac-4 → Dolby AC-4
- 02: bitstream_version = 2 → AC-4 Part 2 (ETSI TS 103 190-2) 準拠のデコーダーが必要
- 02: presentation_version = 2 → IMS
- 00: mdcompat = 0 → 2.0ch
360 Reality Audio
mha1
URL ql パラメーター |
ファイル名 サフィックス |
AdaptationSet | Representation | オブジェクト数 | ビット レート (kbps) |
|||
---|---|---|---|---|---|---|---|---|
selection Priority |
quality Ranking |
codecs | audio Sampling Rate |
使用 | 最大 | |||
SPATIAL_RA360_L0 | 3D_S360RA_L0 | 3000 | 4 | mha1.0x0c | 48000 | 5 | 5 | 320 |
SPATIAL_RA360_L1 | 3D_S360RA_L1 | 3000 | 3 | mha1.0x0d | 48000 | 10 | 10 | 640 |
SPATIAL_RA360_L2 | 3D_S360RA_L2 | 3000 | 2 | mha1.0x0d | 48000 | 13 | 16 | 1024 |
SPATIAL_RA360_L3 | 3D_S360RA_L3 | 3000 | 1 | mha1.0x0e | 48000 | 17 | 24 | 1536 |
mhm1
URL ql パラメーター |
ファイル名 サフィックス |
AdaptationSet | Representation | オブジェクト数 | ビット レート (kbps) |
|||
---|---|---|---|---|---|---|---|---|
selection Priority |
quality Ranking |
codecs | audio Sampling Rate |
使用 | 最大 | |||
SPATIAL_RA360_L0 | 3D_S360RA_L0 | 3500 | 4 | mhm1.0x0c | 48000 | 5 | 5 | 320 |
SPATIAL_RA360_L1 | 3D_S360RA_L1 | 3500 | 3 | mhm1.0x0d | 48000 | 10 | 10 | 640 |
SPATIAL_RA360_L2 | 3D_S360RA_L2 | 3500 | 2 | mhm1.0x0d | 48000 | 13 | 16 | 1024 |
SPATIAL_RA360_L3 | 3D_S360RA_L3 | 3500 | 1 | mhm1.0x0e | 48000 | 17 | 24 | 1536 |
量子化ビット数の記載はないが、360 Reality Audio の仕様的に、恐らくすべて 24bit だと思われる。
- mha1 = MPEG-H 3D Audio、単一ストリーム
- mhm1 = MPEG-H 3D Audio、単一ストリーム、MPEG-H Audio Stream (MHAS) でカプセル化
- 0x0c = Low Complexity Profile, Level 2
- 0x0d = Low Complexity Profile, Level 3
- 0x0e = Low Complexity Profile, Level 4
Apple Music – 空間オーディオ
Dolby Audio
字面が似ていて紛らわしいが、Dolby Atmos (ドルビーアトモス) ではなく Dolby Audio (ドルビーオーディオ)。Apple Music では 5.1ch (6ch 表記) や 7.1ch (8ch 表記) の音源のことを指している。
EXT-X-STREAM-INF:AUDIO EXT-X-MEDIA:GROUP-ID |
EXT-X-STREAM-INF | EXT-X-MEDIA | ビット レート (kbps) |
---|---|---|---|
CODECS | CHANNELS |
||
audio-ac3-448 | ac-3 | 6 | 448 |
audio-ec3-1448 | ec-3 | 8 | 448 |
ac-3 は Dolby Digital (AC-3) 、ec-3 は Dolby Digital Plus (Enhanced AC-3) のこと。
Dolby Atmos (Dolby Digital Plus JOC)
EXT-X-STREAM-INF:AUDIO EXT-X-MEDIA:GROUP-ID |
EXT-X-STREAM-INF | EXT-X-MEDIA | ビット レート (kbps) |
---|---|---|---|
CODECS | CHANNELS |
||
audio-atmos-2448 | ec-3 | 16/JOC | 448 |
audio-atmos-2768 | ec-3 | 16/JOC | 768 |
サンプリング周波数と量子化ビット数の記載はないが、恐らくすべて 48kHz / 16bit だと思われる。Apple Music は 現状 Dolby AC-4 IMS は非採用。
2.0ch ダウンミックス
EXT-X-STREAM-INF:AUDIO EXT-X-MEDIA:GROUP-ID |
EXT-X-STREAM-INF | EXT-X-MEDIA | ビット レート (kbps) |
---|---|---|---|
CODECS | CHANNELS |
||
audio-HE-stereo-64-downmix | mp4a.40.5 | 2/-/DOWNMIX | 64 |
audio-stereo-64-downmix | mp4a.40.2 | 2/-/DOWNMIX | 64 |
audio-stereo-128-downmix | mp4a.40.2 | 2/-/DOWNMIX | 128 |
audio-stereo-256-downmix | mp4a.40.2 | 2/-/DOWNMIX | 256 |
バイノーラル
EXT-X-STREAM-INF:AUDIO EXT-X-MEDIA:GROUP-ID |
EXT-X-STREAM-INF | EXT-X-MEDIA | ビット レート (kbps) |
---|---|---|---|
CODECS | CHANNELS |
||
audio-HE-stereo-64-binaural | mp4a.40.5 | 2/-/BINAURAL | 64 |
audio-stereo-64-binaural | mp4a.40.2 | 2/-/BINAURAL | 64 |
audio-stereo-128-binaural | mp4a.40.2 | 2/-/BINAURAL | 128 |
audio-stereo-256-binaural | mp4a.40.2 | 2/-/BINAURAL | 256 |
セグメントとコンテナ
インデックスファイルや MPD を見てみると、Apple Music のロスレスや空間オーディオの楽曲は約 15 秒ごと (ロッシーは不明)、Amazon Music の楽曲は約 10 秒ごとのセグメントにフラグメント化されている。
フラグメント化された音声は、両サービスとも fMP4 (fragmented MP4) コンテナに格納されている。
DRM
Amazon Music の MPD には、DRM として Microsoft PlayReady を使用していることが明記されている。一方 Apple Music は何を使用しているのかは分からないが、Apple は独自で FairPlay という DRM 技術を持っているので、恐らくこれを使用しているものと思われる。
Dolby Audio
Dolby Audio とは
Apple Music の空間オーディオと言えば Dolby Atmos だけだと思われがちだが、僅かながら 5.1ch や 7.1ch で配信されているものもある。「ドルビーオーディオ」と表示されている楽曲がそれである。
ただし、ステレオ版しか配信されていないにも関わらず、なぜか Dolby Audio ロゴが表示される楽曲もあるため、注意が必要 (詳細は後述)。
Dolby Audio とは、Dolby Atmos 関連や Dolby Voice 関連以外のほぼすべての Dolby の音響技術を総称したブランドである。
Dolby の音響技術があまりにも多くなったので、Dolby Atmos に対応する製品には Dolby Atmos のロゴのみを、Dolby Atmos には対応しないが Dolby Audio に含まれる音響技術のいずれかに対応する場合は Dolby Audio のロゴのみを付与するように定められた。
Apple Music だけでなく、非 Dolby Atmos の Dolby Digital (Plus) や Dolby TrueHD を採用する BD (BDMV) や UHD BD 等においても、ロゴはそれぞれのコーデックのロゴではなく Dolby Audio ロゴを表示するよう定められている。

ただし、Dolby Atmos 採用作品の場合は、Dolby Atmos 非対応環境で視聴した場合は 5.1ch 〜 7.1ch ダウンミックスになってしまう (理由は後述) ためか、あるいは BDMV や UHD BD のDolby TrueHD (Dolby Atmos のコーデックとしても使用されている) には互換用の Dolby Digital (AC3 Core などと呼ばれる) が付属しているためか、Dolby Atmos ロゴと Dolby Audio ロゴの両方が表示される場合もある。
Dolby Audio と Dolby Atmos の違いについて調べると、「Dolby Audio は 5.1ch や 7.1ch 等で、Dolby Atmos は天井からも音が鳴らせるもの」や「Dolby Audio はスマホや PC の高音質化技術で、Dolby Atmos は映画館等で使われるサラウンド技術」などと解説されていることもあるが、それらはごく一部分に過ぎない。
Dolby Atmos と Dolby Audio の違いは、「Dolby Atmos 関連の音響技術か、そうでないか」である。
長々と書いたが、Apple Music に限って言えば、Dolby Audio は 5.1ch や 7.1ch のサラウンド音声という認識で構わない。
Dolby Audio のコーデック
Apple Music の Dolby Audio
EXT-X-STREAM-INF:AUDIO EXT-X-MEDIA:GROUP-ID |
EXT-X-STREAM-INF | EXT-X-MEDIA | ビット レート (kbps) |
---|---|---|---|
CODECS | CHANNELS |
||
audio-ac3-448 | ac-3 | 6 | 448 |
audio-ec3-1448 | ec-3 | 8 | 448 |
Apple Music のDolby Audio で使用されるコーデックは、5.1ch は ac-3
、7.1ch は ec-3
となっている。
AC-3 は Audio Code number 3 の略で、Dolby の3番目の音声符号化技術である Dolby Digital のことを指す。AC-3 は技術的な名称、Dolby Digital はマーケティング用のブランドとなっている。ロッシー圧縮のコーデックで、最大 5.1ch、48kHz / 16bit、640kbps まで対応している。
EC-3 は Enhanced AC-3 (E-AC-3) の略で、マーケティング用のブランドは Dolby Digital Plus。Dolby Digital よりも圧縮効率が向上し、対応チャンネル数が増加したロッシー圧縮のコーデックで、最大 15.1ch、48kHz / 20bit、6144kbps まで対応している。後述の Joint Object Coding (JOC) を使用することで、Dolby Atmos にも対応可能。
Dolby Digital Plus は、 単体で再生可能な領域である Independent Substream (IS) と、IS と組み合わせて再生する拡張領域の Dependent Substream (DS) がある。IS は 5.1ch までの対応となっており、DS は 7.1ch や Dolby Atmos を格納する際の、追加データの格納用に使用される。
Dolby Digital Plus の 7.1ch 音声では、IS には 5.1ch ダウンミックス音声が、DS には 7.1ch 用のサラウンド Lss/Rss とサラウンドバック Lrs/Rrs の合計 4.0ch 分の音声が入っている。そのため、Dolby Digital Plus の 7.1ch は、実際のデータとしては IS 5.1ch + DS 4.0ch の、合計 9.1ch 分の音声が入っている。
5.1ch 出力時は、IS のL/R/C/Ls/Rs を全て使用し、DS は無視する。、7.1ch 出力時は、IS の L/R/C と DS の Lss/Rss/Lrs/Rrs を組み合わせ、IS の Ls/Rs は無視する。
このような仕様になっているのは、7.1ch 音声だけ格納して、5.1ch 再生時は係数で機械的にダウンミックスとするよりも、5.1ch は 5.1ch で用意したほうが、より製作者の意図を再現しやすいといった背景がある。
ちなみに、Dolby Digital Plus は EX フラグにも対応しているため、IS は Surround EX を利用したマトリックス 6.1ch 音声とすることも可能となっている。(実際、そのような音源も複数存在を確認している)
Dolby Digital は 48kHz / 16bit まで、Dolby Digital Plus は 48kHz / 20bit までしか対応してないため、Apple 基準のハイレゾ (88.2kHz 以上) には対応していない。そしてどちらもロッシーコーデックである。
(アルバムページに「ロスレス」と「Dolby Atmos」のロゴが共存している場合、それはステレオ版がロスレスで提供されているという意味である)
Dolby TrueHD を使用すれば、Dolby Audio 音源を最大 192kHz / 24bit のハイレゾロスレスで提供できるが、現状 iPhone にも iPad にも Apple TV にも Android 端末にも Dolby TrueHD デコーダーは載っていない。
なお、Dolby Atmos に対応している Android 端末であれば、Dolby Digital デコーダーや Dolby Digital Plus デコーダーは必ず載っているのだが、現在 Android 版 Apple Music は執筆時点で最新の 4.9.7.2 でも未だに Dolby Audio 非対応となっている。
Dolby Atmos のストリーミング設定やダウンロード設定をオンにしても、Dolby Audio で配信されている楽曲はステレオ版しか降ってこない。また、アルバム詳細ページ等に Dolby Audio のロゴも表示されない。
Dolby Audio の謎
Apple Music の Dolby Audio には、色々謎がある。
① Dolby Atmos で配信されているものの、一時的に Dolby Audio 表記になるパターン
再生直後は Dolby Audio 表記になり、何度か再生し直したり、時間をおいて再生し直しているうちに Dolby Atmos 表記になるパターン。現状 iOS / iPadOS 版でのみ確認している。
このパターンの奇妙な点は、マスタープレイリストを確認しても、Dolby Atmos で配信されている楽曲は Dolby Audio では配信されていないというところ。にも関わらず、アプリ上では Dolby Audio のロゴが表示されている。
状況的に考えて、これは後述する 2.0ch ダウンミックス版を 5.1ch アップミックスしているか、バイノーラル版を再生している際に表示されるものではないかと思われる。
ただし、iOS / iPadOS 16 以降では見かけなくなったので、iOS / iPadOS 15 時代の仕様の可能性がある。
② Dolby Audio 表記があるものの、実際にはステレオでしか再生されないパターン
アルバムには Dolby Audio 表記があるものの、再生時にはステレオ版でしか再生されないというパターン。こちらも現状 iOS / iPadOS 版でのみ確認している。サントラを中心に目撃例が増えている。
確認した限りでは、該当の音源のマスタープレイリストにはステレオ版しか存在していないため、単なる表示バグではないかと思われる。
③ 海外では Dolby Audio で配信されているものの、日本ではステレオ版しか配信されていないパターン
Excited to announce that my upcoming album, Parody: The Mixtape, will be available in immersive, high quality, Dolby Audio.
— Rey (@ReyGGTV) July 1, 2021
Experience songs such as Davey Boi, I Ship It (Lumity Remix), and the upcoming JOHANNA song in true immersion.
Coming soon. Only on Apple Music. pic.twitter.com/H2dfb9LJX6
@BrandonButch is dolby audio new?? pic.twitter.com/Yc5sl9ZMu8
— reece (coup de grâce) (@RIPBIGPROOF313) July 22, 2021
このパターンは、日本では Dolby Audio でも Dolby Atmos でも提供されておらず、マスタープレイリストにもステレオ版しか載っていない、といったもの。
特定の楽曲が一部の国では配信されていないということはたまにあるのだが、空間オーディオ版が一部の国に限られているのは謎である。
Dolby Atmos
まずはじめに断っておくが、Dolby Atmos 自体はコーデックではない。Dolby Atmos は Dolby Digital / Digital Plus や Dolby TrueHD 等の進化版ではなく、5.1ch や 7.1ch の進化版のようなものだと捉えていただきたい。
Dolby Atmos は、7.1ch (Dolby Surround 7.1 の配置) にトップ (天井) チャンネルをステレオで追加した、計 7.1.2ch のチャンネルベースの音声トラック (これをベッドと呼ぶ) をベースに、最大 118 個の音声オブジェクトを配置することができる、イマーシブサウンドのフォーマットである。
Dolby Atmos だけでなく DTS:X、360 Reality Audio、Auro-3D、Apple Spatial Audio Format (ASAF) 等に関しても、あくまでイマーシブサウンドのフォーマット名であり、コーデックの名称ではない。
*イマーシブサウンドの定義は様々だが、ここでは前後左右を取り囲むサラウンドに加え、上下方向の音も再現できる没入型 (= immersive) の立体音響のことを指す。ただし、Dolby Atmos は下方向の表現はできない。
補足
細かいことを言えば、チャンネルベースオーディオ自体スピーカー配置で定義される位置情報を持つ静的な音声オブジェクトの集合体であるとも言える。
しかし、ここでは一般的な定義として、制作時には OAMD (Object Audio Metadata) を用いてオブジェクトの位置を規格の範囲内で自由に指定でき、再生時にはメタデータとスピーカー構成をもとに OAR (Object Audio Renderer) がレンダリングを行うものを、オブジェクトオーディオと呼ぶことにしている。
Dolby Atmos の音声がどのコーデックで届けられるかは、用途により異なる。主に使用されるコーデックは、下記の通り。
- 映画館 (DCP): 非圧縮のリニア PCM
- BD (BDMV) や UHD BD: ロスレス圧縮の Dolby TrueHD
- ストリーミング: ロッシー圧縮の Dolby Digital Plus (JOC) や Dolby AC-4 (IMS)
- テレビ放送: ロッシー圧縮の Dolby AC-4 (A-JOC / CBI)
- ゲーム機: 非圧縮の Dolby MAT 2.0
なお、「Dolby Atmos Music」という用語もあるが、これは Dolby Atmos を使用した楽曲を指すブランドで、使用している技術自体はその他の Dolby Atmos と何も変わらない。
Apple Music の Dolby Atmos では Dolby Digital Plus (Enhanced AC-3) のみ使用されている。一方 Amazon Music では、Echo Studio やサウンドバー等では Dolby Digital Plus (Enhanced AC-3) が、スマホやタブレットでは Dolby AC-4 が使用されている。
Dolby Atmos は Dolby TrueHD を使用することで、最大 48kHz / 24bit のロスレスで提供できるが、上述の通り Dolby TrueHD デコーダーを搭載したスマホやタブレットは現状存在してしない。
なお、Dolby Audio とは違い、Dolby Atmos の場合は 96kHz 以上は不可のため、Apple 基準でのハイレゾは現状非対応。
Dolby Atmos のマスターファイルは 96kHz で記録できますが、現状 Dolby Atmos を 96kHz で提供する方法はありません。Blu-ray 向けの Dolby TrueHD と、ストリーミング向けの Dolby Digital Plus は、どちらも 48kHz しか対応していないからです。
While you can record Dolby Atmos Master Files in 96K, there is currently no way to dritribute Dolby Atmos in 96k. Because both Dolby TrueHD (Blu Ray) and Dolby Digital Plus (Streaming) only support 48k.
96K を自分なりに翻訳
Dolby Digital Plus JOC
Dolby Digital Plus をコンテナにした Dolby Atmos には、以下のような呼称が存在している。
- Dolby Atmos in Dolby Digital Plus (略称: Dolby Atmos in Digital Plus / Dolby Atmos in DD+ / Atmos in DD+)
- Dolby Digital Plus with Dolby Atmos (略称: Dolby Digital Plus with Atmos / DD+ with Dolby Atmos / DD+ with Atmos)
- Dolby Digital Plus JOC (略称: DD+ JOC / DD+JOC)
- Enhanced AC-3 with Joint Object Coding (略称: E-AC-3 with JOC / E-AC-3 JOC / EAC3 JOC / EAC3-JOC / EAC3_JOC / EC3_JOC / ec+3 などなど…)
この記事では、以降 Dolby Digital Plus JOC と呼ぶことにする。
Amazon Music の Dolby Atmos (Dolby Digital Plus JOC)
Amazon Music では、Dolby Digital Plus JOC は Echo Studio やサウンドバー等に対してのみ提供している。スマホやタブレットに対しては、後述する Dolby AC-4 IMS というフォーマットで提供している。
5.1ch にダウンミックスしたものも配信されているが、おそらくネットワークの品質が悪いときに利用されるのだと考えられる。
URL ql パラメーター | ファイル名 サフィックス |
AdaptationSet | Representation | Channel Configuration |
EC3_ Extension Complexity Index |
EC3_ Extension Type |
ビット レート (kbps) |
||
---|---|---|---|---|---|---|---|---|---|
selection Priority |
quality Ranking |
codecs | audio Sampling Rate |
||||||
SPATIAL_ATMOS_LOW | (不明) | 3000 | 3 | ec-3 | 48000 | 6 | 256 | ||
SPATIAL_ATMOS_MEDIUM | (不明) | 3000 | 2 | ec-3 | 48000 | 6 | 16 | JOC | 448 |
SPATIAL_ATMOS_HIGH | (不明) | 3000 | 1 | ec-3 | 48000 | 6 | 16 | JOC | 768 |
Apple Music の Dolby Atmos (Dolby Digital Plus JOC)
Apple Music では、Dolby Atmos 音声を提供する全てのプラットフォーム (iOS、iPadOS、macOS、tvOS、Android) に対して、Dolby Digital Plus JOC を提供している。
EXT-X-STREAM-INF:AUDIO EXT-X-MEDIA:GROUP-ID |
EXT-X-STREAM-INF | EXT-X-MEDIA | ビット レート (kbps) |
---|---|---|---|
CODECS | CHANNELS |
||
audio-atmos-2448 | ec-3 | 16/JOC | 448 |
audio-atmos-2768 | ec-3 | 16/JOC | 768 |
Spatial Coding
Apple Music と Amazon Music のトラック数表記に共通で入っている “16” という数字は、家庭用 Dolby Atmos の一部フォーマットで使用されている、Spatial Coding という技術によるものである。
Dolby Atmos は 7.1.2ch のベッドと最大 118 個のオブジェクトの、合計 128 の音声トラックを使用できる。DCP は基本的に HDD ごと映画館に納品されるため、容量に余裕があり、リニア PCM で記録可能。
一方、家庭だと Dolby TrueHD や Dolby Digital Plus 等で圧縮したとしても、容量は 7.1ch 等に比べて数段跳ね上がるし、家庭用機器で 128 トラックの音声を処理するのも DSP 等の性能的に厳しいところがある。
そこで、Dolby Digital Plus JOC、Dolby AC-4 A-JOC、Dolby TrueHD with Dolby Atmos (MLP FBA 16-ch) では、Spatial Coding という処理が行われる。なお、この処理は後述する Amazon Music の Dolby AC-4 IMSや、チャンネルベースの Dolby AC-4 CBI では使用されない。
Spatial Coding は、空間的に近い位置にあるベッドとオブジェクトを 11 / 13 / 15 のいずれかのグループ (これを element と呼ぶ) にクラスタリングする技術である。element の数をいくつにするかは、音声にどれだけビットレートを割けるかによる。詳細は こちら
Spatial Coding によってクラスタリングされた各 element もまた、OAMD (Object Audio Metadata) を持つオブジェクトオーディオである。
なお、LFE (Low Frequency Effect) と呼ばれる低音専用チャンネルだけはクラスタリングされず、チャンネルベースのまま保持されている。そのため、Spatial Coding 後のトラック数は、11 / 13 / 15obj (elements) + 1ch (LFE) で、合計 12 / 14 / 16 トラックとなる。Amazon Music や Apple Music の 16 という数字は、ここに由来する。
Spatial Coding は、端的に言うとオブジェクトベースのダウンミックスとも取れるが、Dolby 曰く「何も失われない」そうだ。正直この辺りは MQA の「ロスレス」のような若干の胡散臭さも感じられる。(位置情報はともかく、特定の音が完全に消えてしまうことはない、という意味…?)
家庭用のDolby Atmos Homeにおいても「失うものは何一つ無く、この128オブジェクトを再現できる」と説明。
立体音響の「Dolby Atmos」今秋ついに家庭へ。各社AVアンプを体験、モバイル展開も – AV Watch
Spatial Coding が施された Dolby Atmos 音源は、LFE を無視すれば完全なオブジェクトベースにも思えるが、少なくとも Dolby Digital Plus JOC においては、後ほど紹介する Joint Object Coding により、結局はチャンネルベースとのハイブリッドとなっている。
element 数ごとに音声のビットレートの下限が定められている。両サービスともに Dolby Atmos (Dolby Digital Plus JOC) の下限が 448kbps となっているのは、16 elements の場合のビットレートの下限が 448kbps だからだ。
Spatial Coding で使用される elements の数は、エンコード時のビットレートによって決定されます。 384kbps では 12 elements、448kbps 以上では 16 elements が使用されます。
The number of elements used by spatial coding is determined by the bit rate of the encode. A bit rate of 384kbps uses 12 elements, while bit rates of 448kbps and above use 16 elements.
Appendix C – Dolby Atmos Delivery Codecs – Dolby Professional Support Learning を自分なりに翻訳
上記はあくまで下限値を示したものと思われ、実際には 448kbps 以上でも 12 / 14 elements の音源も存在する。
一方、上限が両サービスとも 768kbps となっているのは、あくまで Amazon や Apple による制約でしかない。Dolby Digital Plus JOC 自体は、Dolby Digital Plus の上限である 6144kbps まで使用できる。
The operating range has been increased by allowing data rates spanning 32 kbps – 6.144 Mbps.
[PDF] Introduction to Dolby Digital Plus, an Enhancement to the Dolby Digital Coding System
6144kbps もあれば、ロスレスの Dolby TrueHD による Dolby Atmos (7000 ~ 9000kbps 程度) が見えてくるため、流石に上限まで使うサービスは出てこないとは思うが、Amazon Music や Apple Music より高いビットレートで Dolby Digital Plus 音声を配信するサービスは存在する。
Live ExtremeでDolby Atmosを配信する場合の技術仕様は以下の通りです。
Dolby Atmos配信を徹底解説!(後編)|KORG Live Extreme
- コーデック: Dolby Digital Plus
- サンプルレート: 48kHz
- ビットレート: 384, 448, 576, 640, 768, 1024 kbps
- チャンネル数 : 最大16/JOC
- 配信方式: 疑似ライブ配信 (リニア配信), オンデマンド配信
画質・音質のスペック (規格)
画質・音質のスペック (規格) を教えてください – よくあるご質問 (FAQ)
- 音質 イマーシブオーディオ ドルビーアトモス 7.1.4 · 1.024 kbit/s · E-AC-3 JOC (ドルビーデジタルプラス)
AFLSは『ドルビーデジタルプラス(E-AC3)』を使用しています。
AFLSについて | AFLS
ビットレートを『960kbps』に設定し、音の臨場感をお届けします。
(AFLS は Dolby Atmos ではなく Dolby Audio 5.1ch)
ちなみに、Netflix の Dolby Atmos (Dolby Digital Plus JOC) は、Amazon Music や Apple Music と同じビットレートとなっている。
Netflixメンバーの視聴体験
ほとんどの5.1またはドルビーアトモス対応のテレビデバイスは、より良い音を受信できます。 デバイスと利用可能な帯域幅によって、受信ビットレートは異なります:
スタジオ音質のサウンドを、Netflixに – About Netflix
- 5.1: 192 kbps (良い) から640 kbps (鮮やか/知覚的に透明) まで
- ドルビーアトモス: 448 kbpsから768 kbpsまで (ドルビーアトモスはプレミアムプランに加入しているNetflixメンバーのみご利用いただけます)
なお、iPhone / iPad で 2048kbps 以上の Dolby Digital Plus 音声を再生すると、挙動が怪しくなるという問題があったりする。
Joint Object Coding
一方フォーマット名やトラック数表記にある “JOC” とは、Joint Object Coding の略である。
Dolby Digital Plus JOC では、Dolby Atmos 非対応の Dolby Digital Plus 対応機器とも互換性を保つため、Dolby Atmos を 5.1ch 〜 7.1ch にレンダリングしたものをコアとして持っている。そして、Dolby Digital Plus のビットストリームの拡張領域に、Dolby Atmos 用の差分データが記録されている。
コア部分のチャンネル数は 5.1ch にするか 7.1ch にするか、はたまた 6.1ch の Surround EX にするかは自由だが、Apple Music では検証した限りどれも 7.1ch で、Amazon Music ではどれも 5.1ch のようである。
Dolby Atmos 対応機器では、コアと差分データを合体させることで、Dolby Atmos の再構築が可能となる。これが Joint Object Coding である。
一方、Dolby Atmos 非対応の Dolby Digital Plus 対応機器では、差分データを無視し、コア部分のみを再生することで、5.1ch ~ 7.1ch での再生が行える。
なお、コア音声にはベッドの天井成分や音声オブジェクトの音を 5.1ch 〜 7.1ch にレンダリング (ダウンミックス) したもの含まれているので、合体前に差分音声の逆相で打ち消す必要がある。
AVS Forum の The official Dolby Atmos thread (home theater version) ではコア音声はコア音声で、Dolby Atmos 音声はコア音声とは独立して、それぞれ個別に持っているのではないか、と主張する人もいるが、容量がもったいないし、そもそも “Joint” Object Coding という名称なので、恐らくそれはないと思われる。(真相不明)
Joint Object Coding などの詳細については、Dolby 公式サイトで詳しく解説されている。
Appendix C – Dolby Atmos Delivery Codecs – Dolby Professional Support Learning
上記の記事を含む一連の解説記事を読むと、Dolby Atmos に対する理解が深まるかもしれない。
Dolby Atmos Music Training – Dolby Professional Support Learning
上記のサイトは現在なぜか消されており、Wayback Machine には残っているが、全てのページが残っているかは不明。念のため、ほぼ同内容の解説記事 (こちらも公式サイトからは消えている) の Wayback Machine のリンクも貼っておく。
Dolby Atmos Post Production Learning – Dolby Professional Support Learning
英語が苦手な方や、「Dolby なんちゃら」がどれだけあるのかを知りたい方にはこの本もおすすめ。個人的にはオブジェクトオーディオの説明が分かりやすく書かれているように感じられた。(ただし筆者の Dolby Japan と本国の Dolby Laboratories とで言ってることが違っている箇所もあるので、あくまで入門時の参考程度に…)
ドルビーの魔法 カセットテープからDOLBY ATMOSまでの歩みをたどる | 電子書籍とプリントオンデマンド(POD) | NextPublishing(ネクストパブリッシング)
なお、Dolby Digital Plus JOC は、上記の他にもオブジェクトなしの 5.1.4ch の CBI (Channel-Based Immersive) 音声や、5.1ch + 1 element の 7 トラック音声なども対応しているようだが、これらは Dolby の テスト用音源 ぐらいでしか見かけず、詳細不明。(後者は Dolby 自身 “specially-designed Dolby Atmos content” と呼んでいる)
Dolby AC-4 IMS
Amazon Music では、スマホやタブレット向けに Dolby Atmos を提供する際には、Dolby AC-4 IMS というフォーマットを使用している。
Amazon Music の Dolby Atmos (Dolby AC-4 IMS)
URL ql パラメーター | ファイル名 サフィックス |
AdaptationSet | Representation | Channel Configuration |
virtualized_ content |
ビット レート (kbps) |
||
---|---|---|---|---|---|---|---|---|
selection Priority |
quality Ranking |
codecs | audio Sampling Rate |
|||||
SPATIAL_ATMOS_LOW | 3D_Datmos_Low | 2500 | 2 | ac-4.02.02.00 | 48000 | 2 | 1 | 112 |
SPATIAL_ATMOS_MEDIUM | 3D_Datmos_Med | 2500 | 1 | ac-4.02.02.00 | 48000 | 2 | 1 | 256 |
TIDAL という日本未展開の音楽サブスクでも Dolby AC-4 IMS が提供されているが、現状調査はできていない。
Dolby AC-4 IMS は、Dolby Digital (AC-3) や Dolby Digital Plus (Enhanced AC-3) の後継となる Dolby AC-4 というコーデックにおける、IMS (Immersive Stereo) というフォーマットのことである。主にスマホやタブレットの内蔵ステレオスピーカーや、ステレオイヤホン / ヘッドホンで再生することを目的としている。
IMS では、5.1ch や Dolby Atmos などのマルチチャンネル音声を独自の処理 (詳細不明、マトリックスエンコードの亜種?) にて、専用の 2.0ch 音声と、制御用のメタデータが生成される。IMS の仕組み上、Spatial Coding も Joint Object Coding も行われない。

Dolby AC-4 IMS は、Dolby Digital Plus JOC と比較すると、以下のようなメリットがある。
- ステレオ音声+メタデータなので、サイズが小さい
- そもそも Dolby AC-4 自体、Dolby Digital Plus や MP3、AAC などと比べて圧縮効率が高い
- ある程度事前処理されているため、処理が軽い (Dolby 曰く Dolby Digital Plus JOC 比で 3 ~ 4 倍)
- 制作時に設定されたバイノーラル再生用のメタデータが反映可能
もちろん、逆に Dolby Digital Plus JOC にもメリットはある。
- 対応端末が多い (現状 iPhone や iPad は AC-4 IMS どころか、そもそも AC-4 自体に対応していない。とは言え Android 端末は 2018 年以降に出た Dolby Atmos 対応機種なら大抵 AC-4 に対応しているので、Apple が怠慢なだけとも…)
- AV アンプやサウンドバーなどに対し、HDMI 等で マルチチャンネル出力が可能 (そもそも今のほとんどの AV アンプやサウンドバーは AC-4 自体に対応していないし、対応したとしても IMS はホームシアター用ではない)
バイノーラル再生時に独自の音場エフェクトを掛けることが可能(→ 実は可能かもしれない。詳細は後ほど。)
このあたりは一長一短という感じだ。
特に、バイノーラルメタデータをサポートしたフォーマットは現状 Dolby AC-4 IMS しかないにも関わらず、Apple Music では Dolby Digital Plus JOC のみを使用している上、Apple は iPhone や iPad などで Dolby Digital Plus JOC を独自の “Spartial Audio” レンダラーでヘッドホン再生を行っている。
そのため、世界中のミキシングエンジニアの間で「iPhone と AirPods で Apple Music の Dolby Atmos を聴いたら、思ってたのと違う」という騒ぎが起きている。(詳細 → Why Your Atmos Mix Will Sound Different On Apple Music | Production Expert)
Logic Pro のヘッドホン再生では、Dolby Renderer と Apple Renderer が用意されているが、このApple Renderer は Apple 製品の空間オーディオを再現するものである。Dolby Renderer は IMS のヘッドホンモード同様、バイノーラルのメタデータが活かされる。
勘違いされがちなのだが、Dolby Atmos のマスターファイルから IMS にエンコードされる際にはバイノーラルメタデータも使用されるが、ここで生成される 2.0ch 音声自体はまだバイノーラル音声 (ヘッドホン用にバーチャライズした音声) ではない。IMS はあくまで中間フォーマットでしかない。
一般的なバイノーラル音声や HPL (Head Phone Listening)、DTS Headphone:X、Dolby Headphone、THX Spatial Audio 等で処理された音声に関しては、エンコード時点ですでにヘッドホン用の処理が施されているため、スピーカー再生には向かないし、HRTF のパーソナライズやヘッドトラッキングといった処理も行えない。
一方、IMS は Dolby Atmos からのエンコード段階では特定の再生環境向けの処理は行わない。再生機器側で、再生機器の状態に応じて (ヘッドホンで再生するのか内蔵スピーカーで再生するのか、そもそも Dolby Atmos で聴きたいのかステレオで聴きたいのか、によって) 処理を変化させることができる。
更に、IMS はヘッドトラッキングも行える上に、おそらく 2.0ch 以上の構成にも展開可能となっている点が、他の事前にバーチャライズを行うフォーマットに対するアドバンテージとなっている。(HRTF のパーソナライズができるかは不明)
Galaxy Buds Pro 及び Galaxy Buds2 にて、360 Audio (with Dolby Head Tracking) 機能を使用することによって、Dolby AC-4 IMS の音声をヘッドトラッキングができることを確認済み。
やっぱGalaxy Buds2でもAC-4 IMSのヘッドトラッキングできますね https://t.co/HCPxeh1g0j pic.twitter.com/Xln6OxP0EV
— 井戸水 (@idomizu_) June 17, 2022
また、Dolby AC-4 IMS の 2.0ch 以上の構成への展開に関しては、Lenovo Tab P11 Pro (2nd Gen) にて確認済み。
そういえばということでLenovo Tab P11 Pro (2nd Gen)でDolby AC-4 IMSのテスト音源を再生してみたけど、ちゃんと4スピーカーで役割分担された https://t.co/THuoqLKpjL pic.twitter.com/cGgXGxEtdH
— 井戸水 (@idomizu_) February 21, 2023
このタブレットは 4 つのスピーカーを搭載しているが、その構成はよくある 2way ではなく、音の方向によって使用するスピーカーを制御している。タブレットの向きに基づき、フロントは下側、フロントワイドは上下両方でやや下寄り、サラウンド ~ サラウンドバックとトップは上から、LFEは両方、といった調子だ。
(そのためか、スピーカー使用時は常時 Dolby の好音質化機能が働いており、2.0ch 音声はアップミックスされた上でスピーカーの割り振りがなされていている。)
そして、このタブレットで Dolby AC-4 IMS の音源を再生すると、上側のスピーカーと下側のスピーカーとで、それぞれ別の音が鳴っていることが確認できた。
ということは、Lenovo Tab P11 Pro (2nd Gen) が Dolby AC-4 IMS のスピーカー用処理済みの音声を誤ってアップミックスでもしていない限り、このフォーマットはただのバーチャライズ前提のものではなく、2.0ch 以上の環境にも展開可能なものということになる。
恐らく Dolby AC-4 IMS は、かつての Dolby Stereo / Dolby Surround や Dolby Pro Logic II 等のような、マトリックスエンコード / デコードの仕組みの延長線上にあるものだと思われる。
Dolby AC-4 IMS には様々なメリットがあり、まさにモバイル機器向けといったフォーマットであるにも関わらず、Apple Music が頑なにそれを採用しない理由は、恐らく独自でバーチャライズの処理をしたいからではないだろうかと推察される。
→ 以前はそう考えていたが、Dolby AC-4 IMS はヘッドトラッキング可能な上に、2.0ch 以上の構成にも展開可能なことが分かった今、独自のバーチャライズ処理もある程度は可能なのではないかと考えられる。そのため、なぜ採用しないのかよく分からない (制御用メタデータがある分、自由度は低いかもしれないが…)。
(参考) Dolby AC-4 A-JOC と Dolby AC-4 CBI
Dolby AC-4 を使用した Dolby Atmos のフォーマットは、IMS だけではない。今のところ音楽サブスクでの使用例はないと思われるが、A-JOC や CBI といったフォーマットも存在している。参考情報として、これらについても解説しておく。
参考資料:
- ホワイトペーパー (簡易的な内容)
- 仕様書 (詳細な内容)
- Dolby AC-4 Level 4 について
(前提) Level について
Dolby AC-4 における Level とは、デコーダーの互換性に関する値。音声側・デコーダー側ともに、Level が高いほど、扱うことができるトラック数が増える。Level は 0 ~ 7 まであるが、現状使用されているのは 0 ~ 4 で、5 ~ 6 は予約済み、7 は無制限となっている。
Dolby AC-4 デコーダーは、音声のビットストリーム内の mdcompat という値 (最近の仕様書では md_compat と記載) を確認し、自身の Level 以下の値であるかどうか (= デコード可能かどうか) を判定する。例えば、Level 3 のデコーダーは、mdcompat が 0 〜 3 の音声をデコード可能。
(前提) コアデコードとフルデコードについて
Dolby AC-4 の A-JOC や CBI では、Dolby Digital Plus の JOC のように、コアと差分への分離が行われる。コアのみを再生することを「コアデコード (core decoding)」と呼び、コアと差分から元の音声を再構築して再生することを「フルデコード (full decoding)」と呼ぶ。
JOC におけるコアと差分の分離は、Dolby Atmos 非対応機器向けの、互換性確保が目的だった。一方、A-JOC や CBI では、2.0ch や 5.1ch 出力の場合はコアデコードを行い、コアデコードでは不十分な場合にのみフルデコードを行うことによる、負荷軽減が目的となっている。
Dolby AC-4 A-JOC
A-JOC は Advanced Joint Object Coding の略で、Dolby Digital Plus における JOC の進化版。
A-JOC は、事前に Dolby Atmos の音声を Spatial Coding でクラスタリングするところまでは、JOC と同じ。Level 1 ~ 2 では最大 16 elements、Level 3 では最大 18 elements、Level 4 では最大 21 elements まで対応している。(Level 0 では非対応)
JOC と A-JOC の違いは、コアの生成方法にある。JOC のコアは、チャンネルベースへのレンダリングだった。一方、A-JOC では再度 Spatial Coding を行い、オブジェクトベースのコアを生成している。(例: 16 elements → 8 elements + 差分)。
A-JOC は 後述の CBI (Channel-Based Immersive) に対し、OBI (Object-Based Immersive) とも呼ばれる。ただし、フォーマットの名称としては、OBI ではなく A-JOC と呼ばれることが多い印象がある。
Dolby AC-4 CBI
CBI は Channel-Based Immersive の略で、チャンネルベースのみを使用した、イマーシブサウンドのフォーマットの総称。Level 2 ~ 3 では最大 7.1.4ch、Level 4 のプロトタイプでは最大 22.2ch まで対応している。(Level 0 ~ 1 では非対応)
コアと差分への分離方法としては、ビットレートに応じて S-CPL (Simple Coupling)、A-CPL (Advanced Coupling)、A-JCC (Advanced Joint Channel Coding) から選択可能。それぞれの違いについては、ホワイトペーパーや仕様書を参照。
フォーマットの名称としては、S-CPL / A-CPL / A-JCC が区別されることは少なく、総称の CBI で呼ばれることが多い印象がある。
Apple Music の バイノーラル版とダウンミックス版
Apple Music の Dolby Atmos や Dolby Audio には、オリジナルのステレオミックス版とは別で、バイノーラル版と 2.0ch ダウンミックス版が存在している。
バイノーラル版は、空間オーディオ非対応のヘッドホンを使用している状況で空間オーディオをストリーミング再生した際に使用される。
EXT-X-STREAM-INF:AUDIO EXT-X-MEDIA:GROUP-ID |
EXT-X-STREAM-INF | EXT-X-MEDIA | ビット レート (kbps) |
---|---|---|---|
CODECS | CHANNELS |
||
audio-HE-stereo-64-binaural | mp4a.40.5 | 2/-/BINAURAL | 64 |
audio-stereo-64-binaural | mp4a.40.2 | 2/-/BINAURAL | 64 |
audio-stereo-128-binaural | mp4a.40.2 | 2/-/BINAURAL | 128 |
audio-stereo-256-binaural | mp4a.40.2 | 2/-/BINAURAL | 256 |
2.0ch ダウンミックス版は、通信環境が悪い状況で空間オーディオをストリーミング再生した際に使用される。
EXT-X-STREAM-INF:AUDIO EXT-X-MEDIA:GROUP-ID |
EXT-X-STREAM-INF | EXT-X-MEDIA | ビット レート (kbps) |
---|---|---|---|
CODECS | CHANNELS |
||
audio-HE-stereo-64-downmix | mp4a.40.5 | 2/-/DOWNMIX | 64 |
audio-stereo-64-downmix | mp4a.40.2 | 2/-/DOWNMIX | 64 |
audio-stereo-128-downmix | mp4a.40.2 | 2/-/DOWNMIX | 128 |
audio-stereo-256-downmix | mp4a.40.2 | 2/-/DOWNMIX | 256 |
ダウンミックス版を再生するときは、自動で「ステレオを空間化」機能が有効になり、5.1ch にアップミックスされて再生される。この時、iOS / iPadOS 16 では、再生画面には Dolby Atmos や Dolby Audio のロゴが表示されるが、コントロールセンターの AirPods の音声ステータスは「ステレオ」になっている。
「ステレオ」表示ではあるが、通常のステレオ音声再生時とは違って、右下のボタンは「ステレオを空間化」ではなく「空間オーディオ」になっている。
バイノーラル版を再生するのではなく、わざわざダウンミックス版をアップミックスしているのは、恐らくヘッドトラッキングや HRTF のパーソナライズのためだと考えられる。
この処理については Apple 自身が動画で説明しているので、日本語字幕を抜粋して引用しておく。(なお、筆者にて句読点を追加している)
ステレオソースをアップミックスして、5.1チャンネルを再現する技術も提供しています。
(略)
また、この処理を暗黙のうちに行うことで、空間音声の採用や提供をより魅力的なものにします。
今現在、マルチチャンネル音声を配信することで、メディアの映像品質が損なわれることを心配される方もいるでしょう。
マルチチャンネルオーディオは現在提供されているステレオのAACレンディションよりも、はるかに高ビットレートです。
ネットワークの帯域が限られている中で、この2つを両立させるにはどうすればいいのでしょうか。これは本当に困ったことです。
この問題を解決するために、ユーザーの帯域に合わせて空間的なオーディオ体験を実現しました。
帯域が不足して高品質な映像を提供できない場合、音声はシームレスに劣化し、アップミックスされたステレオ音声になりますが、空間処理は変わりません。移行前に提供されていたヘッドトラッキングは維持されます。
その後、帯域が確実に回復すると、フルマルチチャンネルの空間処理が復活します。
Immerse your app in Spatial Audio – WWDC21 – Videos – Apple Developer
ステレオを空間化の詳細については、以下の記事にて。
オリジナルのステレオ版とは別で、ダウンミックス版を用意している理由は、おそらく「ステレオを空間化」に最適化された、専用のマトリックスエンコードが行われているのだと考えられる。
正直、このような処理をするぐらいなら Dolby AC-4 IMS を使用してほしいものである。
なお、この処理は「ステレオを空間化」機能に依存しているため、Android 版では利用不可。空間オーディオを有効にしていても、通信環境が悪い場合はバイノーラル版にすらならず、ステレオミックス版が再生される。
360 Reality Audio
360 Reality Audio (サンロクマル・リアリティオーディオ / 360RA) は、ソニーによるオブジェクトベースのイマーシブサウンドのフォーマット (というよりも制作から配信までのソリューション?) である。
Dolby Atmos と比べると、「上方向だけでなく下方向からの音も表現できる」「チャンネルベースの音声トラックを使用しない (LFE もない)、完全なオブジェクトベースオーディオ」といった特徴を持つ。
Amazon Music は 360 Reality Audio を採用しているが、Apple Music では今の所採用されていない。Apple Music は特に Dolby Atmos にこだわっているわけではなく、今後も対応フォーマットの拡充を進めていく予定である模様。
360 Reality Audio のコーデックは、Amazon Music に限らず現状 MPEG-H 3D Audio のみ。MPEG-H 3D Audio は、MPEG-H Audio と呼ばれることもある。
MPEG-H 3D Audio を使用したフォーマットとしては、360 Reality Audio 以外にも THX Spatial Audio などがある。
Amazon Music の 360 Reality Audio
mha1
URL ql パラメーター |
ファイル名 サフィックス |
AdaptationSet | Representation | オブジェクト数 | ビット レート (kbps) |
|||
---|---|---|---|---|---|---|---|---|
selection Priority |
quality Ranking |
codecs | audio Sampling Rate |
使用 | 最大 | |||
SPATIAL_RA360_L0 | 3D_S360RA_L0 | 3000 | 4 | mha1.0x0c | 48000 | 5 | 5 | 320 |
SPATIAL_RA360_L1 | 3D_S360RA_L1 | 3000 | 3 | mha1.0x0d | 48000 | 10 | 10 | 640 |
SPATIAL_RA360_L2 | 3D_S360RA_L2 | 3000 | 2 | mha1.0x0d | 48000 | 13 | 16 | 1024 |
SPATIAL_RA360_L3 | 3D_S360RA_L3 | 3000 | 1 | mha1.0x0e | 48000 | 17 | 24 | 1536 |
mhm1
URL ql パラメーター |
ファイル名 サフィックス |
AdaptationSet | Representation | オブジェクト数 | ビット レート (kbps) |
|||
---|---|---|---|---|---|---|---|---|
selection Priority |
quality Ranking |
codecs | audio Sampling Rate |
使用 | 最大 | |||
SPATIAL_RA360_L0 | 3D_S360RA_L0 | 3500 | 4 | mhm1.0x0c | 48000 | 5 | 5 | 320 |
SPATIAL_RA360_L1 | 3D_S360RA_L1 | 3500 | 3 | mhm1.0x0d | 48000 | 10 | 10 | 640 |
SPATIAL_RA360_L2 | 3D_S360RA_L2 | 3500 | 2 | mhm1.0x0d | 48000 | 13 | 16 | 1024 |
SPATIAL_RA360_L3 | 3D_S360RA_L3 | 3500 | 1 | mhm1.0x0e | 48000 | 17 | 24 | 1536 |
mha1 と mhm1 は単一ストリームの MPEG-H 3D Audio を指す。これらのうち、mhm1 は MPEG-H Audio Stream (MHAS) でカプセル化されている。
MIMETYPE_AUDIO_MPEGH_MHA1
MIME type for MPEG-H Audio single stream
Constant Value: “audio/mha1”MIMETYPE_AUDIO_MPEGH_MHM1
MediaFormat | Android Developers
MIME type for MPEG-H Audio single stream, encapsulated in MHAS
Constant Value: “audio/mhm1”
MPEG-H 3D Audio において、
- 0x0b = Low Complexity Profile Level 1
- 0x0c = Low Complexity Profile Level 2
- 0x0d = Low Complexity Profile Level 3
- 0x0e = Low Complexity Profile Level 4
を指す。(頭の 0x は「これは 16 進数です」という意味)
If the MHAConfigurationBox() is present, the MPEG-H Profile-Level Indicator
ATSC Standard: A/342:2021 Part 3, MPEG-H Systemmpegh3daProfileLevelIndication
in theMHADecoderConfigurationRecord()
shall be set to “0x0B”, “0x0C”, or “0x0D” for MPEG-H Audio Low Complexity Profile Level 1, Level 2, or Level 3, respectively.
MIMETYPE_AUDIO_MPEGH_LC_L3
MIME type for MPEG-H Low Complexity (LC) L3 audio stream. Uses the scheme defined by RFC 6381 with mpegh3daProfileLevelIndication for LC profile/L3 (0xD) from ISO/IEC 23008-3.
Constant Value: “audio/mhm1.0d”
MIMETYPE_AUDIO_MPEGH_LC_L4
MIME type for MPEG-H Low Complexity (LC) L4 audio stream. Uses the scheme defined by RFC 6381 with mpegh3daProfileLevelIndication for LC profile/L4 (0xE) from ISO/IEC 23008-3.
Constant Value: “audio/mhm1.0e”
MediaFormat | Android Developers
MPEG-H 3D Audio でエンコードされた 360 Reality Audio 音源のことは、360 Reality Audio Music Format と呼ぶ。360 Reality Audio Music Format は 3 つのレベル (と規格外のレベル 1 つ) が定義されている。
最大オブジェクト数24個/平均ビット・レート1.5MbpsのLevel 3をはじめ、16個/1MbpsのLevel 2、10個/640kbpsのLevel 1、そして360 Reality Audio Music Format外だが5個/320kbpsのLevel 0.5。
360 Reality Audioの仕組みとコンテンツ制作の方法 – サンレコ 〜音楽制作と音響のすべてを届けるメディア
なお、Amazon Music の 360 Reality Audio の音声ファイルを MediaInfo で見てみると、Level 2 では 13 オブジェクト、Level 3 では 17 オブジェクトしか使っていないように見受けられる。が、あくまでファイルのメタデータ上の話で、実際のところは不明。
Level 0
音声
ID : 1
形式 : MPEG-H 3D Audio
形式のプロファイル : LC@L2, BL@L2
コーデック ID : enca / mhm1
長さ : 5分 5秒
ビットレート : 335 Kbps
チャンネル : 8 チャンネル (7.1)
チャンネルの配置 : L R C LFE Ls Rs Lw Rw
サンプルレート : 48.0 KHz
フレームレート : 46.875 fps (1024 SPF)
ストリームのサイズ : 12.2 MiB (98%)
エンコード日 : 2022-10-23 20:59:59 UTC
タグ付け日 : 2022-10-23 20:59:59 UTC
Encryption : Encrypted
プログラム ラウドネス : -9.00 LKFS
Signal group #1 : 5 objects
種類 : Object
Number of objects : 5 objects
コーデック構成ボックス : mhaC
Level 1
音声
ID : 1
形式 : MPEG-H 3D Audio
形式のプロファイル : LC@L3, BL@L3
コーデック ID : enca / mhm1
長さ : 5分 5秒
ビットレート : 669 Kbps
チャンネル : 12 チャンネル (7.1.4)
チャンネルの配置 : L R C LFE Lb Rb Lss Rss Tfl Tfr Tbl Tbr
サンプルレート : 48.0 KHz
フレームレート : 46.875 fps (1024 SPF)
ストリームのサイズ : 24.4 MiB (99%)
エンコード日 : 2022-10-23 20:59:59 UTC
タグ付け日 : 2022-10-23 20:59:59 UTC
Encryption : Encrypted
プログラム ラウドネス : -8.25 LKFS
Signal group #1 : 10 objects
種類 : Object
Number of objects : 10 objects
コーデック構成ボックス : mhaC
Level 2
音声
ID : 1
形式 : MPEG-H 3D Audio
形式のプロファイル : LC@L3, BL@L3
コーデック ID : enca / mhm1
長さ : 5分 5秒
ビットレート : 1,070 Kbps
チャンネル : 12 チャンネル (7.1.4)
チャンネルの配置 : L R C LFE Lb Rb Lss Rss Tfl Tfr Tbl Tbr
サンプルレート : 48.0 KHz
フレームレート : 46.875 fps (1024 SPF)
ストリームのサイズ : 39.0 MiB (99%)
エンコード日 : 2022-10-23 20:59:59 UTC
タグ付け日 : 2022-10-23 20:59:59 UTC
Encryption : Encrypted
プログラム ラウドネス : -8.25 LKFS
Signal group #1 : 13 objects
種類 : Object
Number of objects : 13 objects
コーデック構成ボックス : mhaC
Level 3
音声
ID : 1
形式 : MPEG-H 3D Audio
形式のプロファイル : LC@L4, BL@L3
コーデック ID : enca / mhm1
長さ : 5分 5秒
ビットレート : 1,604 Kbps
チャンネル : 24 チャンネル (22.2)
チャンネルの配置 : Lw Rw C LFE Lb Rb L R Cb LFE2 Lss Rss Tfl Tfr Tfc Tc Tbl Tbr Tsl Tsr Tbc Bfc Bfl Bfr
サンプルレート : 48.0 KHz
フレームレート : 46.875 fps (1024 SPF)
ストリームのサイズ : 58.5 MiB (100%)
エンコード日 : 2022-10-23 20:59:59 UTC
タグ付け日 : 2022-10-23 20:59:59 UTC
Encryption : Encrypted
プログラム ラウドネス : -8.75 LKFS
Signal group #1 : 17 objects
種類 : Object
Number of objects : 17 objects
コーデック構成ボックス : mhaC
Amazon Music においては、360 Reality Audio Music Format のレベルは、URL の ql パラメーターや、ファイル名のサフィックス (接尾語) として記載されている。L0 とはオブジェクト数的に Level 0.5 のことを指しているのだろう。
なお、このレベルは 360 Reality Audio におけるグレードを表すためのものであり、MPEG-H 3D Audio のレベルとは異なる。
サービス・プラットフォーム別の音声
現状最新の「配信サービスと採用コーデックの一覧」を無理矢理表にまとめると、下記のようになる。
プラット フォーム |
iPhone / iPad | ||||||
---|---|---|---|---|---|---|---|
DD+ JOC | 対応 | 非対応 | |||||
出力先 | 空間オーディオ対応の 内蔵スピーカー・ヘッドホン |
空間オーディオ非対応ヘッドホン | – | ||||
再生方法 | ストリーミング (通信速度:高) または ダウンロード |
ストリーミング (通信速度:低) |
ストリーミング (通信速度:問わず) |
ダウンロード | – | ||
ドルビー アトモス (Apple Music) |
自動 または 常にオン |
自動 または 常にオン |
自動 | 常にオン | 自動 | 常にオン | – |
Amazon Music |
AC-4 IMS Dolby Renderer (アプリ内) |
AC-4 IMS Dolby Renderer (アプリ内) |
AC-4 IMS Dolby Renderer (アプリ内) |
AC-4 IMS Dolby Renderer (アプリ内) |
AC-4 IMS Dolby Renderer (アプリ内) |
AC-4 IMS Dolby Renderer (アプリ内) |
AC-4 IMS Dolby Renderer (アプリ内) |
Apple Music |
DD+ JOC Apple Renderer (端末側) |
AAC 2.0ch ダウンミックス を 5.1ch にアップミックス Apple Renderer (端末側) |
AAC or ALAC ステレオ または AAC バイノーラル Dolby Renderer? (サーバー側) |
AAC バイノーラル Dolby Renderer? (サーバー側) |
AAC ステレオ または DD+ JOC Dolby Renderer (端末側) |
DD+ JOC Dolby Renderer (端末側) |
– |
TIDAL | AC-4 IMS Dolby Renderer (アプリ内) |
AC-4 IMS Dolby Renderer (アプリ内) |
AC-4 IMS Dolby Renderer (アプリ内) |
AC-4 IMS Dolby Renderer (アプリ内) |
AC-4 IMS Dolby Renderer (アプリ内) |
AC-4 IMS Dolby Renderer (アプリ内) |
AC-4 IMS Dolby Renderer (アプリ内) |
プラット フォーム |
Android 端末 | ||
---|---|---|---|
DD+ JOC | 対応 | 対応 | 非対応 |
AC-4 IMS | 対応 | 非対応 | 非対応 |
Amazon Music |
AC-4 IMS Dolby Renderer (端末側) |
AC-4 IMS Dolby Renderer (アプリ内) |
AC-4 IMS Dolby Renderer (アプリ内) |
Apple Music |
DD+ JOC Dolby Renderer (端末側) |
DD+ JOC Dolby Renderer (端末側) |
– |
TIDAL | AC-4 IMS Dolby Renderer (端末側) |
不明 | 不明 |
プラット フォーム |
Amazon Fire TV | Apple TV | Android TV Google TV |
|||
---|---|---|---|---|---|---|
DD+ JOC | 対応 | 対応 | 対応 | 対応 | ||
Dolby MAT 2.0 | 対応 | 非対応 | 対応 | 非対応 | ||
出力先 | AV アンプ サウンドバー |
AV アンプ サウンドバー |
AV アンプ サウンドバー |
空間オーディオ 対応ヘッドホン |
AV アンプ サウンドバー |
|
出力設定 | サラウンド音響 「自動選択」 |
サラウンド音響 「Dolby Digital Plus」 |
サラウンド音響 「自動選択」または 「Dolby Digital Plus」 |
フォーマットを変更「オフ」 ドルビーアトモス「オン」 |
空間オーディオ 「固定」または 「ヘッドトラッキング」 |
形式の選択 「自動」または 「手動」にて 「ドルビー アトモス / ドルビー デジタル プラス」を有効化 |
Amazon Music |
DD+ JOC Dolby MAT 2.0 |
DD+ JOC Bitstream |
DD+ JOC Bitstream |
– | – | – |
Apple Music |
– | – | – | DD+ JOC Dolby MAT 2.0 |
DD+ JOC Apple Renderer (端末側) |
– |
TIDAL | – | – | – | DD+ JOC Dolby MAT 2.0 |
不明 | DD+ JOC Bitstream |
Amazon Music
スマホやタブレットには Dolby AC-4 IMS を、ストリーミング端末には Dolby Digital Plus JOC を提供している。Dolby AC-4 非対応端末では、アプリ内でデコード・バーチャライズを行っている。
以前の Android 版 Amazon Music は、Dolby AC-4 対応端末でもアプリ内でデコード・バーチャライズする仕様だったが、2024年5月末リリースの 24.9.0 より、端末側で処理するようになった。
Android版Amazon Music、Dolby Atmos (DAX3)搭載機種では、Dolby Atmos (AC-4 IMS)音声を端末側でデコード&バーチャライズさせるようになった (今までは対応機種でも全部アプリ内で処理)
— 井戸水 (@idomizu_) June 15, 2024
Xperiaの「音質と画質のステータス」は、こういうのに気づきやすく検証に便利 pic.twitter.com/5LOrFF4u9A
要は、Amazon Music アプリの最新バージョンさえインストールできれば、どんな機種でも空間オーディオを聴くことができる。ただし、その仕様により、以下のような問題が発生している。
Apple Music
基本的にはすべてのプラットフォームに Dolby Digital Plus JOC を提供しているが、条件次第ではバイノーラル版やダウンミックス版を提供する場合がある。
特に iOS / iPadOS 版は複雑で、「ドルビーアトモス (Dolby Atmos)」の設定が「自動 (Automatic)」か「常にオン (Always On)」か、ストリーミング再生かダウンロード再生か、及び、機器の組み合わせ等によって、挙動が異なる。
現時点で把握している情報を表にまとめると、下記の通り。なお、下記はキャッシュの状況等によって、選択される音声が変わることがある。
再生方法 | 出力先 | Bluetooth デバイスタイプ |
ドルビー アトモス |
iPhone 16 Pro Max (iOS 18) |
iPad mini (第6世代) (iPadOS 18) |
iPad mini (第6世代) (iPadOS 17) |
---|---|---|---|---|---|---|
ストリーミング (通信速度:高) |
内蔵スピーカー | (設定なし) | 自動 | Dolby Digital Plus JOC | Dolby Digital Plus JOC | Dolby Digital Plus JOC |
常にオン | Dolby Digital Plus JOC | Dolby Digital Plus JOC | Dolby Digital Plus JOC | |||
AirPods Pro 1 | (設定なし) | 自動 | Dolby Digital Plus JOC | Dolby Digital Plus JOC | Dolby Digital Plus JOC | |
常にオン | Dolby Digital Plus JOC | Dolby Digital Plus JOC | Dolby Digital Plus JOC | |||
Walkman ZX300 (Bluetooth レシーバー機能) |
ヘッドフォン | 自動 | バイノーラル | バイノーラル | バイノーラル | |
常にオン | バイノーラル | バイノーラル | バイノーラル | |||
ヘッドフォン以外 | 自動 | ステレオ | ステレオ | ステレオ | ||
常にオン | ステレオ | ステレオ | ステレオ | |||
Pixel Buds Pro | ヘッドフォン | 自動 | ステレオ | バイノーラル | バイノーラル | |
常にオン | バイノーラル | バイノーラル | バイノーラル | |||
ヘッドフォン以外 | 自動 | ステレオ | ステレオ | ステレオ | ||
常にオン | ステレオ | ステレオ | ステレオ | |||
Galaxy Buds2 | ヘッドフォン | 自動 | ステレオ | バイノーラル | (未調査) | |
常にオン | バイノーラル | バイノーラル | (未調査) | |||
ヘッドフォン以外 | 自動 | ステレオ | ステレオ | (未調査) | ||
常にオン | ステレオ | ステレオ | (未調査) | |||
ストリーミング (通信速度:低) |
内蔵スピーカー | (設定なし) | 自動 | ダウンミックス | ダウンミックス | ダウンミックス |
常にオン | ダウンミックス | ダウンミックス | ダウンミックス | |||
AirPods Pro 1 | (設定なし) | 自動 | ダウンミックス | ダウンミックス | ダウンミックス | |
常にオン | ダウンミックス | ダウンミックス | ダウンミックス | |||
Walkman ZX300 (Bluetooth レシーバー機能) |
ヘッドフォン | 自動 | バイノーラル | バイノーラル | ダウンミックス | |
常にオン | バイノーラル | バイノーラル | ダウンミックス | |||
ヘッドフォン以外 | 自動 | ステレオ | ステレオ | (未調査) | ||
常にオン | ステレオ | ステレオ | (未調査) | |||
Pixel Buds Pro | ヘッドフォン | 自動 | ステレオ | バイノーラル | ダウンミックス | |
常にオン | バイノーラル | バイノーラル | ダウンミックス | |||
ヘッドフォン以外 | 自動 | ステレオ | ステレオ | (未調査) | ||
常にオン | ステレオ | ステレオ | (未調査) | |||
Galaxy Buds2 | ヘッドフォン | 自動 | ステレオ | バイノーラル | (未調査) | |
常にオン | バイノーラル | バイノーラル | (未調査) | |||
ヘッドフォン以外 | 自動 | ステレオ | ステレオ | (未調査) | ||
常にオン | ステレオ | ステレオ | (未調査) | |||
ダウンロード (オンライン・ オフライン 問わず) |
内蔵スピーカー | (設定なし) | 自動 | Dolby Digital Plus JOC | Dolby Digital Plus JOC | Dolby Digital Plus JOC |
常にオン | Dolby Digital Plus JOC | Dolby Digital Plus JOC | Dolby Digital Plus JOC | |||
AirPods Pro 1 | (設定なし) | 自動 | Dolby Digital Plus JOC | Dolby Digital Plus JOC | Dolby Digital Plus JOC | |
常にオン | Dolby Digital Plus JOC | Dolby Digital Plus JOC | Dolby Digital Plus JOC | |||
Walkman ZX300 (Bluetooth レシーバー機能) |
ヘッドフォン | 自動 | Dolby Digital Plus JOC | Dolby Digital Plus JOC | Dolby Digital Plus JOC | |
常にオン | Dolby Digital Plus JOC | Dolby Digital Plus JOC | Dolby Digital Plus JOC | |||
ヘッドフォン以外 | 自動 | ステレオ | ステレオ | ステレオ | ||
常にオン | ステレオ | ステレオ | ステレオ | |||
Pixel Buds Pro | ヘッドフォン | 自動 | ステレオ | Dolby Digital Plus JOC | Dolby Digital Plus JOC | |
常にオン | Dolby Digital Plus JOC | Dolby Digital Plus JOC | Dolby Digital Plus JOC | |||
ヘッドフォン以外 | 自動 | ステレオ | ステレオ | ステレオ | ||
常にオン | ステレオ | ステレオ | ステレオ | |||
Galaxy Buds2 | ヘッドフォン | 自動 | ステレオ | Dolby Digital Plus JOC | (未調査) | |
常にオン | Dolby Digital Plus JOC | Dolby Digital Plus JOC | (未調査) | |||
ヘッドフォン以外 | 自動 | ステレオ | ステレオ | (未調査) | ||
常にオン | ステレオ | ステレオ | (未調査) |
Apple Music では、Dolby Digital Plus JOC を端末側でデコード・バーチャライズしているため、Dolby Digital Plus 非対応端末では Dolby Atmos の設定項目が現れない。
なお、先程「Dolby Digital Plus JOC は、Dolby Atmos 非対応の Dolby Digital Plus 対応機器とも互換性がある」と述べたが、この仕様を利用しているのは iOS / iPadOS 版のみで、Android 版は端末が Dolby Digital Plus JOC に対応していないと、Dolby Atmos / Dolby Audio 音声を聴くことはできない。
実際、以下に示す様々な Dolby Audio 対応 (= Dolby Digital / Dolby Digital Plus 対応だが Dolby Digital Plus JOC は非対応) 機種で検証したところ、空間オーディオの設定は現れなかった。
- arrows NX F-01K (Android 9)
- Lenovo Tab M8 HD (2nd Gen) (Android 10)
- Lenovo Tab K10 (Android 11 ~ 12)
- Pixel 6 (Android 13 ~ 14)
- Pixel 8 Pro (Android 14)
- Pixel 9 Pro XL (Android 14 ~ 15)
逆に、Dolby Atmos 対応の Android に対して Dolby Audio 音声は一応提供されているものの、なぜか 7.1ch 音声のみで、5.1ch 音声は提供されていない (2.0ch 音声の提供になる)。
なお、iOS / iPadOS 版は再生画面用に「Dolby Audio」のロゴも用意されているが、Android 版は Dolby Audio を再生しても、再生画面のロゴは「Dolby Atmos」となる。
Android版Apple MusicはDolby Audio音声が全く提供されないと思ってたけど、厳密にはDD 5.1chに非対応なだけで、DD+ 7.1chは対応してたらしい
— 井戸水 (@idomizu_) November 7, 2024
ただし再生画面のロゴはDolby Atmos (iOS/iPadOS版はDolby Audioロゴ) pic.twitter.com/tpa3Y97x3B
5 Responses
-
Pingback: 2021年08月14日(土)の日常 | okaz::だめにっき
こんにちは、私は台湾のネチズンです。この文章は Google 翻訳を通じて日本語に翻訳されました。
空間オーディオに関する多くのコンテンツを企画・公開していただき、大変感謝しており、感心しております。
お聞きしたいのですが、Apple Music で Dolby Atmos の曲を再生するために SONY Xperia 5 IV を使用しているのですが、携帯電話自体の Dolby Sound 機能がオンになっていない場合、Dolby Atmos は正しくデコードできますか?
はい、正しく再生できます。 、しかし、私にはそれをオンにするのは違うように思えます。ドルビーアトモスという言葉はまだApple Musicに表示されていますが、ドルビーをオンにしない限り、携帯電話のステータス表示には「ドルビーアトモス」ではなく「通常」のみが表示されます。
私は Xperia 1 IV ユーザーですが、Xperia 5 IV も恐らく同じ挙動だと思われるので、その前提で解説します。
結論から言いますと、Android 13 の場合、Dolby Atmos 再生時に Dolby Sound をオンにする必要はありません。
Android 12 の頃は、Dolby Sound がオンでもオフでも、Dolby Atmos を再生すると「Dolby Atmos」と表示されていたと記憶していますが、Android 13 では Dolby Sound がオンのときのみ「Dolby Atmos」表示、オフのときは「ノーマル」表示になるよう変更されました。
ですが、この「ノーマル」表示になっているとき (Dolby Sound がオフのとき) でも、バーチャライザー (Dolby Surround Virtualizer) のような Dolby Atmos の再生に必要最低限な機能は暗黙的に適用され、ダウンミックスになることはありません。
Dolby Sound をオンにすることで有効になるのは、必ずしも必要ではない音質/音量改善機能です。
なお、この挙動はあくまで Xperia 1 IV の例であり、他の機種では異なる場合がありますのでご注意ください。