活动回顾 | 大模型时代的语音处理研究研讨会暨CCF语音对话与听觉专委 “走进高校”系列活动—走进香港中文大学(深圳)
12月6日,由中国计算机学会(CCF)主办,CCF语音对话与听觉专委会、香港中文大学(深圳)、深圳市大数据研究院及深圳市跨模态认知计算重点实验室承办的 “CCF走进高校”公益活动在香港中文大学(深圳)顺利举行。
活动吸引了100多名学生、教师及行业专家线下参与,线上直播观看人数超过6,100人次。与会者围绕人工智能、语音识别与跨模态计算等前沿科技进行了深入交流与讨论。此次活动不仅为学生和学者提供了宝贵的学术交流平台,也促进了学术界与产业界的合作与联系。通过各方的互动与分享,参会者对相关领域的最新发展有了更加深入的了解。
本次活动由CCF语音对话与听觉专业委员会主任、上海交通大学的俞凯教授,以及新加坡工程院院士、香港中文大学(深圳)数据科学学院执行院长李海洲教授 (IEEE Fellow)开场致辞。研讨会邀请了党建武教授、颜永红教授、王文武教授、Chng Eng Siong教授、Junichi Yamagishi教授、Jinyu Li 博士(IEEE Fellow)、吴志勇教授、武执政教授等学者发表精彩报告。李明教授、杜俊教授、陈谐教授等专家就当前热点话题作了引导发言,并邀请与会专家展开了专题讨论。此次活动由香港中文大学(深圳)数据科学学院的中村哲(Satoshi Nakamura)教授(IEEE Fellow)教授和武执政教授主持。
扫码查看活动相册
开幕致辞
CCF语音对话与听觉专业委员会主任、上海交通大学俞凯教授通过线上方式发表开幕致辞。他对各位专家学者的到来表示热烈而诚挚的欢迎,并对“CCF走进高校”活动的背景及意义进行了详细介绍。俞教授表示,期待与各位专家学者在专业领域开展深入的学习与交流,共同探讨前沿问题。
CCF语音对话与听觉专业委员会主任、上海交通大学俞凯教授分享现场
随后,新加坡工程院院士、港中大(深圳)数据科学学院执行院长李海洲教授 (IEEE Fellow)通过线上致辞,热烈欢迎各位专家学者。他表示,港中大(深圳)今年迎来十周年校庆,学校在国际学术领域取得显著成绩,致力于培养科研人才与推动前沿研究发展。他感谢参与本次活动的嘉宾、老师和同学们,期望通过此次活动促进学术交流与合作。同时,李教授也感谢了CCF对港中大(深圳)的支持,并表示学校将积极承办与参与更多专委会活动,推动学术进步与创新发展。
港中大(深圳)数据科学学院执行院长李海洲教授分享现场
港中大(深圳)数据科学学院的武执政教授在会议中向与会嘉宾详细介绍了港中大(深圳)的办学理念。他强调,学校秉承国际化办学方针,全面实施全英授课,旨在培养具有全球视野和创新思维的高素质人才。武教授还介绍了学校的书院制与学院制,这种独特的办学模式为学生提供了更为多元和全面的学习体验。此外,武教授还指出,港中大(深圳)高度重视国际交流与合作,积极与全球顶尖高校和科研机构建立合作关系,推动跨国学术合作与人才流动。
港中大(深圳)数据科学学院武执政教授分享现场
报告环节
本次活动邀请了众多在语音技术领域颇具影响力的专家,带来了一系列精彩且富有深度的报告,为语音技术研究领域注入了新的活力与灵感。
颜永红教授在《人工智能时代的语言声学》报告中,对语言声学学科的历史、研究内容予以综述,借由对元音和辅音研究的百年回顾,展现基础成果的应用路径,并分享团队最新成果,助于理解该学科在人工智能时代的走向。
颜永红教授
王文武教授在《Language Queried Audio Source Separation》报告中聚焦语言查询音频源分离范式,详细说明问题设定、动机以及 AudioSep 和 FlowSep 算法,介绍数据集、性能指标与国际挑战任务组织,为音频处理技术创新提供思路。
王文武教授
Junichi Yamagishi 教授的《Automatic Fact Verification across Languages and Modality》报告深入探讨基于证据的事实验证模型,涵盖多语言扩展、多模态模型,比较监督训练与大语言模型上下文学习模型,为相关研究提供全面参考。
Junichi Yamagishi 教授
Jinyu Li 博士(IEEE Fellow)在《CTC guided modality matching for fast and accurate streaming speech translation》报告中提出 CTC 引导模态匹配法,利用机器翻译文本数据增强流式语音翻译模型,提升翻译准确性与解码速度,推动语音翻译技术进步。
Jinyu Li 博士(IEEE Fellow)
吴志勇教授的报告《基于大模型的语音细粒度理解与精细可控生成》针对语音信息构建大模型的挑战,探讨基于大语言模型的语音细粒度理解与生成方法,为多模态交互的语音大模型构建指明方向。
吴志勇教授
党建武教授的《Spoken language information processing based on the speech chain》报告着重阐述将生理和神经知识应用于口语处理,涉及障碍语音处理、语音识别及脑电图语音理解神经机制研究等工作,开辟口语信息处理新径。
党建武教授
武执政教授在《语音大模型的研究进展》报告中,强调语音中的副语言和环境信息,分享语音交互大模型在语音理解与生成方面的最新进展,助力语音大模型在情感感知与多模态交互领域的发展。
武执政教授
Chng Eng Siong 教授的《Towards LLM - based ASR – experiences from NTU’s Speech Lab》聚焦语音模态整合进大语言模型,介绍南大语音实验室在应用大语言模型进行传统 ASR 模型纠错、应对噪声场景及生成式语音增强等方面成果,为相关研究提供借鉴。
Chng Eng Siong 教授
专题讨论
在专题讨论环节,李明教授、杜俊教授、陈谐教授等专家围绕当前的热点学术话题展开了引导性发言,并邀请其他参会专家深入探讨相关领域的前沿问题。通过这一环节,专家们就关键问题展开了热烈的交流与深入的讨论,促进了思想碰撞与学术互动。
校园参观
活动结束后,来访的部分专家与学者一同参观了香港中文大学(深圳)校园。在参观过程中,大家对学校的现代化校园布局、先进的教学设施以及周边环境有了全面的了解。通过本次参访,专家们对港中大(深圳)的未来发展规划和战略方向有了更加清晰的认识,也对学校在学术、科研和国际化发展方面的潜力和愿景表示赞赏。