標準解讀

《GB/T 44115.3-2025 信息技術(shù) 虛擬現(xiàn)實內(nèi)容表達 第3部分:音頻》作為國家標準,專注于虛擬現(xiàn)實(VR)環(huán)境中音頻的規(guī)范。該標準詳細規(guī)定了在虛擬現(xiàn)實場景中如何處理和表達音頻信息,以確保用戶能夠獲得更加沉浸式的體驗。

首先,標準涵蓋了音頻數(shù)據(jù)的基本要求,包括但不限于采樣率、位深度以及聲道配置等技術(shù)參數(shù),旨在為開發(fā)者提供清晰的技術(shù)指導,從而保證不同平臺或設(shè)備間音頻的一致性和互操作性。此外,還特別強調(diào)了三維空間音效的設(shè)計原則與實現(xiàn)方法,通過模擬真實世界中的聲音傳播特性來增強用戶的臨場感。

其次,《GB/T 44115.3-2025》對頭部相關(guān)傳輸函數(shù)(HRTF)、雙耳錄音技術(shù)等高級音頻處理技術(shù)進行了介紹,并給出了具體的應用指南。這些技術(shù)能夠根據(jù)聽者的頭部位置及方向動態(tài)調(diào)整聲源的方向性,使得即使是在固定位置佩戴耳機的情況下,也能感受到來自四面八方的聲音效果,極大地豐富了虛擬環(huán)境下的聽覺體驗。

再者,標準還討論了針對不同類型應用場景(如游戲、教育、醫(yī)療等)時應考慮的特殊需求,比如在游戲中可能需要更加強烈的空間定位感;而在某些專業(yè)領(lǐng)域,則可能更加注重語音清晰度與準確性等方面的要求。為此,文件提供了相應的建議措施和技術(shù)手段。


如需獲取更多詳盡信息,請直接參考下方經(jīng)官方授權(quán)發(fā)布的權(quán)威標準文檔。

....

查看全部

  • 即將實施
  • 暫未開始實施
  • 2025-02-28 頒布
  • 2025-09-01 實施
?正版授權(quán)
GB/T 44115.3-2025信息技術(shù)虛擬現(xiàn)實內(nèi)容表達第3部分:音頻_第1頁
GB/T 44115.3-2025信息技術(shù)虛擬現(xiàn)實內(nèi)容表達第3部分:音頻_第2頁
GB/T 44115.3-2025信息技術(shù)虛擬現(xiàn)實內(nèi)容表達第3部分:音頻_第3頁
GB/T 44115.3-2025信息技術(shù)虛擬現(xiàn)實內(nèi)容表達第3部分:音頻_第4頁
GB/T 44115.3-2025信息技術(shù)虛擬現(xiàn)實內(nèi)容表達第3部分:音頻_第5頁
已閱讀5頁,還剩391頁未讀, 繼續(xù)免費閱讀

下載本文檔

GB/T 44115.3-2025信息技術(shù)虛擬現(xiàn)實內(nèi)容表達第3部分:音頻-免費下載試讀頁

文檔簡介

ICS35040

CCSL.71

中華人民共和國國家標準

GB/T441153—2025

.

信息技術(shù)虛擬現(xiàn)實內(nèi)容表達

第3部分音頻

:

Informationtechnology—Virtualrealitycontentrepresentation—

Part3Audio

:

2025-02-28發(fā)布2025-09-01實施

國家市場監(jiān)督管理總局發(fā)布

國家標準化管理委員會

GB/T441153—2025

.

目次

前言

…………………………Ⅲ

引言

…………………………Ⅳ

范圍

1………………………1

規(guī)范性引用文件

2…………………………1

術(shù)語和定義

3………………1

符號和縮略語

4……………3

串行流語法規(guī)則

5…………………………6

系統(tǒng)框架

6…………………7

元數(shù)據(jù)定義

7………………13

封裝格式

8AAMSF………………………57

耳機渲染器

9………………60

揚聲器渲染器

10…………………………73

附錄資料性庫的模式選擇

A()HRTF………………86

附錄資料性一種基于線性插值的音頻方法

B()HRTFVR………87

附錄資料性人工混響模式

C()…………92

附錄資料性一種基于全景錄音球的麥克風陣列擺放實現(xiàn)方案

D()Ambisonics…96

附錄資料性一種基于全景錄音球的空間編碼方法

E()Ambisonics………………103

附錄資料性場景信號解碼及渲染的通用技術(shù)

F()…………………108

附錄資料性多聲道音頻生產(chǎn)系統(tǒng)規(guī)范建議及測試方案

G()………112

附錄資料性基于頭相關(guān)傳輸函數(shù)的三維音頻渲染器

H()3DoF…………………119

附錄資料性智能電視音箱環(huán)繞立體聲系統(tǒng)

I()………122

附錄資料性球諧通用制作技術(shù)

J()HRTF…………129

附錄資料性采樣卷積混響模式

K()…………………131

附錄資料性一種空間音頻距離衰減模型

L()………157

附錄資料性一種三維聲近場效應實現(xiàn)方法

M()……………………159

附錄資料性實時制作時元數(shù)據(jù)傳輸系統(tǒng)的案例

N()………………363

附錄資料性非標準揚聲器布局的渲染器

O()GY/T316…………369

附錄資料性擴展元數(shù)據(jù)示例代碼

P()………………373

附錄規(guī)范性子元素支持的材料類型

Q()Surface……………………376

附錄規(guī)范性注冊渲染器的耳機渲染規(guī)范

R()ID0…………………377

附錄規(guī)范性注冊渲染器的揚聲器渲染規(guī)范

S()ID128……………382

參考文獻

……………………387

GB/T441153—2025

.

前言

本文件按照標準化工作導則第部分標準化文件的結(jié)構(gòu)和起草規(guī)則的規(guī)定

GB/T1.1—2020《1:》

起草

本文件是信息技術(shù)虛擬現(xiàn)實內(nèi)容表達的第部分已經(jīng)發(fā)布了以

GB/T44115《》3。GB/T44115

下部分

:

第部分視頻

———2:;

第部分音頻

———3:。

本文件由全國信息技術(shù)標準化技術(shù)委員會提出并歸口

(SAC/TC28)。

本文件起草單位清華大學北京理工大學中國電子技術(shù)標準化研究院北京字跳網(wǎng)絡技術(shù)有限公

:、、、

司賽因芯微北京電子科技有限公司北京全景聲信息科技有限公司中關(guān)村視聽產(chǎn)業(yè)技術(shù)創(chuàng)新聯(lián)盟

、()、、、

清華大學天津電子信息研究院北京大學咪咕文化科技有限公司騰訊科技深圳有限公司北京愛奇

、、、()、

藝科技有限公司小米通訊技術(shù)有限公司全景聲北京智能科技有限公司華為技術(shù)有限公司中國傳

、、()、、

媒大學

。

本文件主要起草人竇維蓓王晶耿一丹朱博成李婧欣黃傳增柳德榮吳健吳強許舒敏

:、、、、、、、、、、

潘興德曲天書李岳鵬商世東王志航劉長滔黃為慶劉孟美趙天博韓澤瑞王賓韓建李琳

、、、、、、、、、、、、、

徐嵩胡蘇王喆高原朱夢堯靳聰張偉民高文黃鐵軍趙海英崔曉冉

、、、、、、、、、、。

GB/T441153—2025

.

引言

隨著虛擬現(xiàn)實技術(shù)的不斷涌現(xiàn)虛擬現(xiàn)實已成為增強沉浸感的新興媒體形式音頻內(nèi)容

(VR),,VR

表達與渲染重建技術(shù)在虛擬現(xiàn)實沉浸感真實感體驗中占有重要地位目前虛擬現(xiàn)實全景視頻技術(shù)已

、。

經(jīng)受到廣泛關(guān)注和重視但是由于缺乏音頻內(nèi)容表達和渲染重建的技術(shù)規(guī)范難以實現(xiàn)各種音

,VR,VR

頻采集制作與終端回放設(shè)備或系統(tǒng)間的互通共享

。

旨在確立適用于虛擬現(xiàn)實的視頻和音頻規(guī)范擬由三個部分構(gòu)成

GB/T44115,。

第部分系統(tǒng)目的在于確立高效編碼的虛擬現(xiàn)實視頻和音頻數(shù)據(jù)的傳輸格式與信令格式

———1:。。

第部分視頻目的在于確立虛擬現(xiàn)實全景視頻和自由視角視頻的編碼表示與重建方法

———2:。。

第部分音頻目的在于確立虛擬現(xiàn)實設(shè)備及相關(guān)系統(tǒng)中的沉浸式音頻內(nèi)容的表達方式包

———3:。,

括元數(shù)據(jù)結(jié)構(gòu)和渲染器的系統(tǒng)架構(gòu)及接口規(guī)范

。

本文件在遵循的前提下面向適應我國全景音頻播出沉浸式音頻通信虛

ITU-RBS.2076:2019,、、

擬現(xiàn)實音頻交互等領(lǐng)域確立音頻元數(shù)據(jù)模型和渲染系統(tǒng)之間的協(xié)同關(guān)系以及音頻元數(shù)據(jù)流

,VR,VR

與音頻流之間的可能的復接模式形成音頻內(nèi)容表達的互聯(lián)互通應用規(guī)范支持和等

,VR,3DoF6DoF

虛擬現(xiàn)實場景下涉及基于聲道對象場景三類信號的采集制作和渲染重建服務于虛擬現(xiàn)實

,、、,(VR/

設(shè)備和相關(guān)系統(tǒng)中的音頻應用

AR/MR/XR)。

本文件設(shè)計了音頻元數(shù)據(jù)模型音頻編解碼系統(tǒng)和音頻渲染系統(tǒng)之間的解耦合架構(gòu)三個系統(tǒng)

、VR,

之間既相互獨立又緊密配合形成音頻內(nèi)容表達的應用規(guī)范本文件將對音頻坐標系元數(shù)

,,VR。VR、

據(jù)模型渲染器系統(tǒng)音頻元數(shù)據(jù)串行流封裝格式進行規(guī)范

、、AVS。

本文件的發(fā)布機構(gòu)提請注意聲明符合本文件時可能涉及附錄附錄

,,6.3、7.2、7.5、9.1、9.8、10.1、D、

附錄附錄附錄中如下項與虛擬現(xiàn)實音頻相關(guān)的專利的使用專利名稱如下

H、I、R、S52。:

音頻渲染系統(tǒng)方法和電子設(shè)備音頻渲染系統(tǒng)方

PCT/CN2021/100076,、;PCT/CN2022/098882,、

法和電子設(shè)備用于音頻渲染的音頻信號編碼方法裝置和電子設(shè)備

;PCT/CN2021/100062,、;PCT/

音頻渲染系統(tǒng)方法和電子設(shè)備音頻元數(shù)據(jù)的處理方法和裝

CN2022/098850,、;PCT/CN2021/114366,

置音頻信號的處理方法和裝置聲音路徑能量的淡入淡

;PCT/CN2022/114219,;PCT/CN2021/121135,

出方法電子設(shè)備和介質(zhì)音頻渲染方法音頻渲染設(shè)備和電子設(shè)備

、;PCT/CN2022/122204,、;PCT/

一種動態(tài)估計場景近似長方體房間的方法一種音頻渲染系統(tǒng)

CN2021/121718,;PCT/CN2022/122635,

和方法混響時長的估計方法音頻信號的渲染方法和電子設(shè)備

;PCT/CN2021/104309,、;PCT/CN2022/

音頻信號的渲染方法裝置和電子設(shè)備用于音頻渲染的信號處理方法

103312,、;PCT/CN2021/115130,、

裝置和電子設(shè)備用于音頻渲染的信號處理方法裝置和電子設(shè)備

;PCT/CN2022/115194,、;PCT/

用于空間音頻渲染的系統(tǒng)方法和電子設(shè)備用于空間音頻渲

CN2021/121729,、;PCT/CN2022/122657,

染的系統(tǒng)方法和電子設(shè)備一種音頻制作模型和生成方法電子設(shè)備及存儲介質(zhì)

、;202110984837.4,、;

音頻節(jié)目元數(shù)據(jù)和產(chǎn)生方法電子設(shè)備及存儲介質(zhì)音頻內(nèi)容元數(shù)據(jù)

202111102045.6,、;202111100818.7,

和產(chǎn)生方法電子設(shè)備及存儲介質(zhì)音頻對象元數(shù)據(jù)和產(chǎn)生方法電子設(shè)備及存儲介

、;202111102038.6,、

質(zhì)音軌唯一標識元數(shù)據(jù)和生成方法電子設(shè)備及存儲介質(zhì)一種音頻軌

;202111205630.9,、;202111204386.4,

道元數(shù)據(jù)和生成方法電子設(shè)備及存儲介質(zhì)一種音頻流元數(shù)據(jù)和生成方法電子設(shè)備及

、;202111202898.7,、

存儲介質(zhì)基于音床音頻包格式元數(shù)據(jù)和產(chǎn)生方法設(shè)備及介質(zhì)基對象

;202111308422.1,、;202111308430.6,

音頻包格式元數(shù)據(jù)和產(chǎn)生方法設(shè)備及介質(zhì)基于場景音頻包格式元數(shù)據(jù)和產(chǎn)生方法設(shè)

、;202111306844.5,、

備及存儲介質(zhì)基于雙耳音頻包格式元數(shù)據(jù)和產(chǎn)生方法設(shè)備及介質(zhì)基

;202111308421.7,、;202111021068.4,

于音床音頻通道元數(shù)據(jù)和生成方法設(shè)備及存儲介質(zhì)基于對象音頻通道元數(shù)據(jù)和生成方

、;202111020417.0,

GB/T441153—2025

.

法設(shè)備及存儲介質(zhì)基于場景音頻通道元數(shù)據(jù)和生成方法設(shè)備及存儲介質(zhì)

、;202111021066.5,、;

基于雙耳音頻通道元數(shù)據(jù)和生成方法設(shè)備及存儲介質(zhì)一種廣播音頻格

202111021039.8,、;202111666346.1,

式文件生成方法裝置設(shè)備及存儲介質(zhì)音頻元數(shù)據(jù)區(qū)塊的生成方法裝置設(shè)備及存儲

、、;202111666362.0,、、

介質(zhì)生成渲染器內(nèi)部數(shù)據(jù)結(jié)構(gòu)的方法裝置設(shè)備及存儲介質(zhì)利用元數(shù)

;202210588174.9,、、;202210634563.0,

據(jù)對基于音床的音頻進行渲染的方法及裝置共享渲染器組件的配置方法裝置設(shè)備及

;202210762912.7,、、

存儲介質(zhì)一種音床渲染項數(shù)據(jù)映射方法裝置設(shè)備及存儲介質(zhì)一種渲

;202210760302.3,、、;202210603204.9,

染器的渲染項確定方法裝置設(shè)備及存儲介質(zhì)一種音床輸出渲染項確定方法裝置設(shè)

、、;202210600880.0,、、

備及存儲介質(zhì)一種對象輸出渲染項確定方法裝置設(shè)備及存儲介質(zhì)一

;202210603208.7,、、;202210603212.3,

種場景輸出渲染項確定方法裝置設(shè)備及存儲介質(zhì)音頻渲染器的渲染項處理方法裝

、、;202210603184.5,、

置設(shè)備及存儲介質(zhì)一種場景渲染項數(shù)據(jù)映射方法裝置設(shè)備及存儲介質(zhì)

、;202210608202.9,、、;

一種音頻渲染器增益計算方法裝置設(shè)備及存儲介質(zhì)用于對象渲染器

202210782056.1,、、;202210910129.0,

的元數(shù)據(jù)解析方法裝置設(shè)備及介質(zhì)利用元數(shù)據(jù)對基于對象的音頻進行渲染的方法及

、、;202210907370.8,

裝置利用元數(shù)據(jù)對基于場景的音頻進行渲染的方法及裝置利用元

;202210912275.7,;202211057713.2,

數(shù)據(jù)對基于對象的音頻進行渲染的方法及裝置利用元數(shù)據(jù)對基于場景的音頻進行渲

;202211063746.8,

染的方法及裝置一種錄音系統(tǒng)球面麥克風陣列分布方法音頻

;201510795213.2,3D;202011306975.9,

播放方法及裝置電子設(shè)備和存儲介質(zhì)一種音頻處理方法裝置電子設(shè)備和可讀存

、;202210451743.5,、、

儲介質(zhì)

。

本文件的發(fā)布機構(gòu)對于該專利的真實性有效性和范圍無任何立場

、。

該專利持有人已向本文件的發(fā)布機構(gòu)承諾他愿意同任何申請人在合理且無歧視的條款和條件下

,,

就專利授權(quán)許可進行談判該專利持有人的聲明已在本文件的發(fā)布機構(gòu)備案相關(guān)信息可以通過以下

。,

聯(lián)系方式獲得

:

聯(lián)系人黃鐵軍

:

通訊地址北京市海淀區(qū)頤和園路號北京大學理科號樓室

:522641

郵政編碼

:100871

電子郵件

:tjhuang@

電話

:+8610-62756172

傳真

:+8610-62751638

網(wǎng)址

:

請注意除上述專利外本文件的某些內(nèi)容仍可能涉及專利本文件的發(fā)布機構(gòu)不承擔識別專利的

,。

責任

GB/T441153—2025

.

信息技術(shù)虛擬現(xiàn)實內(nèi)容表達

第3部分音頻

:

1范圍

本文件規(guī)定了虛擬現(xiàn)實設(shè)備及相關(guān)系統(tǒng)中的沉浸式音頻內(nèi)容的表達方式包括元數(shù)據(jù)結(jié)構(gòu)和

(VR),

渲染器的系統(tǒng)架構(gòu)及接口規(guī)范

。

本文件適用于全景音頻錄播沉浸式音頻通信虛擬現(xiàn)實音頻交互等領(lǐng)域的音頻采集傳輸渲染回

、、、、

放系統(tǒng)

2規(guī)范性引用文件

下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款其中注日期的引用文

。,

件僅該日期對應的版本適用于本文件不注日期的引用文件其最新版本包括所有的修改單適用于

,。,()

本文件

。

信息技術(shù)詞匯第

溫馨提示

  • 1. 本站所提供的標準文本僅供個人學習、研究之用,未經(jīng)授權(quán),嚴禁復制、發(fā)行、匯編、翻譯或網(wǎng)絡傳播等,侵權(quán)必究。
  • 2. 本站所提供的標準均為PDF格式電子版文本(可閱讀打?。?,因數(shù)字商品的特殊性,一經(jīng)售出,不提供退換貨服務。
  • 3. 標準文檔要求電子版與印刷版保持一致,所以下載的文檔中可能包含空白頁,非文檔質(zhì)量問題。

評論

0/150

提交評論