喜讯 | 港中大(深圳)数据科学学院李海洲教授团队论文获Oriental COCOSDA 2022最佳论文奖
第二十五届口语语音资料库协调暨标准化国际研讨会东方分会(The 25th Conference of the Oriental COCOSDA,简称O-COCOSDA 2022)于2022年11月24至11月26日在越南河内举行。本次会议公布了一个“最佳论文奖”和一个“最佳学生论文奖”。在来自13个国家的60多篇论文中, 香港中文大学(深圳)数据科学学院李海洲教授与他在深圳大数据研究院的团队撰写的论文“ESAA: An EEG-Speech Auditory Attention Detection Database”获得大会唯一的“最佳论文奖”。
Oriental COCOSDA 2022 最佳论文奖
Oriental COCOSDA 会议简介
Oriental COCOSDA是COCOSDA(全称The International Committee for the Coordination and Standardisation of Speech Databases and Assessment Techniques)的东方分会。它成立于1991年,旨在促进国际合作开发语音库和协调语音输入/输出系统的评估方法。Oriental COCOSDA着重讨论东方语言口语语料库的创建、利用、传播以及语音识别、合成系统的评估方法,并促进东方语言的语音研究。2022年,第二十五届Oriental COCOSDA会议在河内举行,由越南语及语音处理会议(VLSP)协会和越南高等数学研究所(VIASM)主办。
来源:O-COCOSDA 2022官网
链接:https://vlsp.org.vn/cocosda2022/
获奖论文详情
论文题目
ESAA: an EEG-Speech Auditory Attention Detection Database
论文简介
人类能够在嘈杂的环境中听到特定的声源,这种能力被称为鸡尾酒会效应。听觉注意力检测 (AAD) 揭示了鸡尾酒会问题的神经机制,并使智能听力假体成为可能。我们建立了一个用于 AAD 研究的数据库,该数据库由多说话人声源和对应的脑电信号(EEG) 组成。我们构建的EEG-Speech AAD (ESAA) 数据库是第一个具有音调语言(普通话)声源的 AAD 数据库,为听觉注意力的深入研究提供了基础。ESAA数据库包含了从 20 个受试者中收集的 12.7 小时的数据。为了方便本领域相关研究的开展,我们的数据库及模型均已开源。
链接:https://zenodo.org/record/7078451
论文节选
教授简介
李海洲
李海洲教授现任香港中文大学(深圳)数据科学学院执行院长、校长学勤讲座教授,同时他也是新加坡国立大学客座教授和德国不来梅大学卓越讲座教授。此前,他曾于2006年至2016年分别担任新加坡南洋理工大学和新加坡国立大学教授,于2009年担任东芬兰大学客座教授,于2011年至2016年任澳洲新南威尔士大学客座教授,于2003年至2016年担任新加坡科技研究局通信与资讯研究院首席科学家和研究总监。
李教授曾任顶级期刊IEEE/ACM Transactions on Audio、Speech and Language Processing主编 (2015-2018年);目前任Computer Speech and Language副主编 (2012-2022年)、Springer International Journal of Social Robotics副主编 (2008-2022年)。李教授也曾担任多个学术委员会委员:IEEE语音与语言处理技术委员会委员 (2013-2015年)、IEEE信号处理学会出版委员会委员(2015-2018年);目前任IEEE 信号处理学会奖励委员会委员(2021-2023年)。李教授也曾是多个学会主席:国际语音通信学会主席 (ISCA, 2015-2017年)、亚太信号与信息处理协会主席 (APSIPA, 2015-2016年)、亚洲自然语言处理联合会主席 (AFNLP, 2017-2018年)。此外,他还担任过ACL 2012、INTERSPEECH 2014等多个大型学术会议的主席,他也是IEEE声学、语音与信号处理国际会议 (ICASSP 2022)的主席。
李教授享誉国际,他不仅在语音识别和自然语言处理研究领域有着突出贡献,还领导研发了多项知名的语音产品,如1996年苹果电脑公司为Macintosh发行的中文听写套件、1999年Lernout & Hauspie公司为亚洲语言发行的Speech-Pen-Keyboard文本输入解决方案。他是一系列重大技术项目的架构师,项目包括2001年为新加坡樟宜国际机场研发的具有多语种语音识别功能的TELEFIQS自动呼叫中心、2012年为联想A586智能手机研发的声纹识别引擎、2013年为百度音乐研发的听歌识曲引擎。