前言:在本专栏的系列博文中,我将包含声学场景识别、声音事件检测、声源位置估计等利用机器学习或深度学习技术进行研究的、基于声音信号的相关工作成为“声音计算”。
本篇博文主要介绍与声音计算相关的两个近些年持续跟进的挑战赛:DCASE和L3DAS。
一、DCASE
声音携带着大量关于我们日常环境和发生在其中的物理事件的信息。我们可以感知我们所处的声音场景(繁忙的街道、办公室等),并识别单个声源(路过的汽车、脚步声等)。研究自动提取、识别这些信息的信号处理方法具有广泛的应用场景,例如基于音频内容搜索多媒体,制造情境感知移动设备、机器人、汽车等,以及智能监测系统,利用声学信息识别环境中的活动。然而,要可靠地识别真实声景中的声音场景和单个声源,仍然需要大量的研究。在真实声景中,多个声音经常同时出现,并且极易受到环境的干扰。这些因素都导致了基于声音信号进行广泛的场景应用还存在诸多的难题。
DCASE: detection and classification of acoustic scenes and events
地址: DCASE
DCASE 为该领域内的权威挑战赛,包含多个子任务,包括声学场景分类(Acoustic Scene Classification)、异常声音检测(Anomalous Sound Detection)、声音事件检测与定位(Sound Event Localization and Detection)、带有弱标签的声音事件检测( Sound Event Detection with Weak Labels )、生物声学事件检测(Bioa

文章介绍了DCASE和L3DAS这两个关注声音计算的挑战赛,涉及声学场景分类、声音事件检测与定位等任务。DCASE是该领域的权威赛事,而L3DAS则依托于IEEEICASSP会议,专注于3D音频分析。两者都推动了机器学习和深度学习在声音信号处理中的应用。
5495

被折叠的 条评论
为什么被折叠?



