声学环境是人类最熟悉的环境之一,和环境交互是具身智能的一个重要特征。在三维声场的分析方法中,由于声球谐函数分解能实现声源信息与环境信息的解耦,基于球形阵列的三维声场分析得到广泛应用。本研究基于球型阵列接收到的信号,进行球谐域展开,采用一种迭代式的反演模型训练方法,通过声学环境与目标信号耦合建模,把球谐域信号在多声源,早期混响,晚期混响及噪声几个维度上进行分离,分离后的声场球谐函数信号可实现声源分析、声场环境描述等任务。相关技术成果已应用于三维声场的录制与重放、三维声场控制、声源检测,定位与增强、多通道音频编解码等领域。
本研究获国家重点研发计划、国家高技术发展计划(863)、国家自然科学基金等项目支持,多项研究成果发表在国内外著名期刊和顶级会议上,包括IEEE TASLP、JAES、ICASSP、Interspeech、AAAI、AES Convetion等,并申请国家发明专利。部分专利技术被3GPP IVAS标准,AVS3-P3标准采纳,编解码器落地华为大屏,耳机等产品,2022年中秋晚会及2022年卡达尔世界杯直播都采用AVS3-P3编解码器。
图:音乐会录制现场
地址:北京市海淀区颐和园路5号(62755617) 反馈意见:its@pku.edu.cn
Copyright 版权所有©12BET - Sports Betting Winners All Rrights Reserved.