【第一參賽人/留學(xué)人員】SUN XUEJING(孫學(xué)京)
【留學(xué)國家】美國
【技術(shù)領(lǐng)域】新一代信息技術(shù)
【參賽屆次】第10屆
【所獲獎項(xiàng)】入圍
【項(xiàng)目簡介】
聽覺是除視覺外人類感知外界信息的另一個重要途徑。人類的聽覺中,除了對聲音的響度、音調(diào)和音色等主觀屬性的感覺外,還包括對聲音的空間聽覺、也就是對聲音空間屬性或特性的主觀感受及進(jìn)一步的信號處理,涵蓋聲源定位、場景感知與異常音頻事件檢測等。高階聲場三維聲是一種空間音頻技術(shù),在我國,由于技術(shù)和播放平臺受限等原因,三維聲采集播放及智慧音頻應(yīng)用一直以來處于探索階段。主要技術(shù)內(nèi)容:(1)研發(fā)開發(fā)了三維聲特別是高階聲場的采集渲染技術(shù),基于HOA第一增益和基于VBAP第二增益,通過混合增益完成所述多路音頻的混音處理,在保持聲音平滑運(yùn)動的情況下更精準(zhǔn)定位聲源位置;(2)研究開發(fā)了虛擬環(huán)繞聲傳輸?shù)姆椒ǎ乖獢?shù)據(jù)的效率更高,同時使音頻對象在空間里做曲線運(yùn)動時軌跡更平滑。實(shí)現(xiàn)了針對不同場景,不同內(nèi)容,動態(tài)生成最優(yōu)虛擬環(huán)繞聲的音頻技術(shù)。(3)研究基于多麥克風(fēng)陣列的絕對聲源定位方法及音頻事件分類方法。多聲源絕對定位方面,獲得三個麥克風(fēng)陣列SPR-PATH的計算結(jié)果后,通過尋找三條定位線公共垂線中點(diǎn)所組成三角形平面的重心方式進(jìn)行擬合,所擬合得到的點(diǎn)即看作聲源的具體位置。
【展開】
【收起】