传媒聚焦 | 《科技日报》报道——港中大(深圳)数据科学学院李海洲教授2023西丽湖论坛主旨演讲
2023年11月16日,李海洲教授获邀出席由中华人民共和国科学技术部与深圳市人民政府共同主办的2023 西丽湖论坛 · 企业科技创新发展论坛并发表题为“大模型及其产业前景”的主旨演讲,其演讲核心观点获得央媒《科技日报》报道。
西丽湖论坛是具有国际影响力、大湾区特色及融合创新特点的高级别品牌论坛,也是中国国际高新技术成果交易会的重点活动,获邀出席的嘉宾皆为科教领军人物包括中国工程院院士、美国工程院院士、图灵奖得主,及政府官员如国务院参事、科技部副秘书长。很荣幸数据科学学院李海洲教授作为学术界代表出席政府级别高规格会议并发表行业观点。
2023西丽湖论坛
西丽湖论坛由中华人民共和国科学技术部与深圳市人民政府共同主办的,是具有国际影响力、大湾区特色及融合创新特点的高级别品牌论坛,也是中国国际高新技术成果交易会的重点活动。以推动科技、教育、产业、金融、人才一体化发展为主线,突出前沿引领、创新变革、央地协同、湾区共振,在“创新·可持续发展”永久主题下,以“前沿·变革·联结”为2023西丽湖论坛年度主题。
作为西丽湖论坛特设的平行论坛之一,“2023企业科技创新发展论坛”由科技部、深圳市政府主办,科技日报社与广东院士联合会承办。院士专家与企业代表围绕“以下一代互联网技术助力新质生产力加速形成”为主题,热议产业如何把握互联网代际变革机遇、形成自主关键技术高地、筑牢新型工业化“数智基座”。
李海洲教授演讲
“下一代互联网技术将在各个领域引发创新,加速形成新质生产力。”
下为李海洲教授的演讲内容:
很高兴接受论坛的邀请,跟大家分享一下我对于大模型的看法。刚才张平院士提到人工智能与通信的大融合将是数字经济的基础,我非常赞同。人工智能已经发展了60余年,我做语音、语言处理也有40年了,很荣幸能够见证并积极参与人工智能技术的不断演进。
今天,我将分享一些关于人工智能的观点,以及人工智能与产业融合的热点话题。尽管我目前是一名大学教授,但在过去的近30年里,我一直与企业保持密切合作。正如主持人刚才介绍的,我曾是苹果电脑第一代语音识别系统团队的成员。也许你们正在使用的苹果语音识别系统中,有一些是我所贡献的研究成果。
我想跟大家回顾一下人工智能的科学范畴,大家看到的人工智能跟实际上科学家们在研究的人工智能其实是有差别的。
我从教科书中截取了一张图,它将人工智能分为四个部分。从左边看,人工智能必须具备思考和行动的能力,即像人一样思考,像人一样行动。从上面看,它还具有两个重要特性,一个是类人性,即像人一样完成任务,另一个是理性地完成任务。我们经常说不忘初心,人工智能的初衷是什么?我们最早想实现这四个板块中的所有内容,但是我们现在只走了一半的路。大家所看到的人工智能实际上只属于左下角蓝色的这个板块,只追求像人一样地行动。一般来说,如果一个系统通过了图灵测试,我们就称之为人工智能。
实际上,人工智能涵盖了许多内容,比如我们强调人工智能必须是可解释的,同时还要能够像人一样思考。举例来说,小区使用刷脸系统进行人脸识别,替代了保安的工作。保安做什么呢?他认得你的脸就让你进去,不认得就不让你进去,刷脸系统完成的工作跟保安是一样的。但是你可以问保安说你是怎么认出我的,保安可能会说你是长头发,你是大眼睛,走路一瘸一拐的,所以我认识你,他可以跟你解释。但是你如果问刷脸系统,它不会给你解释。因此,实现可解释的人工智能目前仍处于初步阶段。
下面我讲一下理性的人工智能。很多人会问,无人驾驶汽车撞到人由谁负责,机器人会不会控制人类?这些问题是把人工智能理性完成任务这件事跟人工智能研究本身割裂了,这是不对的。但这些问题本身也是人工智能研究的一部分。那这跟产业有什么关系呢?现在我们人工智能产业的发展,非常注重左下角蓝色的这个板块,在其它三个领域还没有获得明显收益,但这也许是人工智能产业接下来更应该关注的地方。
近年来,各个国家陆续开始制定人工智能的规范,这些实际上是人工智能怎样理性完成任务的法规设定,给业界提供了一个平台,即如何在人工智能的其它三个领域拓展业务。人工智能早期关注语音识别、人脸识别、指纹识别、机器翻译等应用,经过几十年的发展,准确率已经和人不相上下,可以在很多实用任务中采用。但是人工智能几十年的发展并不是一帆风顺的。值得一提的是,从1975年到1987年这十几年间,人工智能在美国是被压制的,美国联邦政府停止了对语音识别、机器翻译等研究的一切资助,不是因为人工智能没人做了,而是政府认为人工智能是伪科学,是做不出来的,这当然也是受一些所谓专家当时的误导,美国的人工智能停滞了一些年,要不然他们可能发展得更快。
人工智能从出现至今,一直都饱受争议,但每一次人工智能的进步总能给大家带来有用的东西。例如,路上的智能红绿灯是最早的人工智能应用,七十年代人工智能的发展高潮带来了ATM取款机,这些便利了我们的日常生活。
生成式人工智能是这几年的研究热点,我自己也是做语言大模型的,所以我给大家分享一下我的看法。大模型其实不是什么新的东西,1948年的时候,我们信息论的鼻祖Shannon已经提出了语言模型这个概念,并描述了如果以后有电脑,该如何实现。但为什么去年大模型突然火起来了?因为Open AI 在大模型基础上加上了一个可以与人交互的界面。这就好比大家知道汽车的引擎很好,但你不会单独购买引擎。可如果它被做成一辆汽车,你就会买了,因为汽车可以直接驾驶。
去年ChatGPT发布之后非常轰动,给大家举几个例子,它通过了程序员考试,它可以编程上岗;它通过了药剂师考试,甚至可以每周7天,每天24小时工作。据估计,生成式人工智能会对全球约3亿个工作岗位产生冲击,今年第二季度与生成式人工智能相关的人员招聘比去年同期增长了10倍,说明很多企业都在迎接生成式人工智能的到来。
生成式人工智能为什么带来了这么大的冲击?传统的人工智能擅长对输入的内容进行分类、预测、判断,而生成式人工智能是倒过来的,输入一个指令,它帮你写文章、画画,能生成视频、文字、音乐、绘画、程序代码,所以能创作,跟传统的模式识别很不一样。
据彭博社的最新预测,生成式人工智能的产业市场规模呈指数增长,包括硬件、软件和应用。为什么硬件很重要?因为生成式人工智能是算力、算法、数据的结合,不管是学习还是使用都依靠算力,所以对硬件要求非常高,这个是很多业界同事可能忽视的地方。硬件的产业包括满足不断增长的计算需求,也包括搭建新一代的计算平台,比如类脑计算平台。一个GPU的功耗上千瓦,但是人脑大概20多瓦,怎样提供创新的、省电的计算平台来完成复杂的人工智能任务,也是硬件产业的一部分。从产业市场规模增长的角度来看,硬件产业的发展潜力更大。
最后,我要讲的是智能与智慧。我们的先贤孔子说过,“知之为知之,不知为不知,是知也。”一个人能够知道自己的“知”与“不知”是大智慧。人的知识有三种,第一种是我们知道的,第二种是我们知道我们不知道的,第三种是我们不知道我们不知道的。孔子说不知为不知,包括第二种和第三种知识。遗憾的是,第三种知识的内容应该是最多的。现在的大模型实际上只学了我们人知道的那一部分知识,即“知之为知之”,怎样让人工智能达到“不知为不知”,是接下来大模型研究的一个方向。了解了现有大模型的局限,大家在用它的时候,就知道该用在哪些地方。
谢谢大家!
现场回顾
教授简介
数据科学学院
执行院长
校长学勤讲座教授
李海洲
Haizhou Li
新加坡工程院院士
IEEE信号处理学会副会长(任期2024-2026)
IEEE会士
国际语音通信学会会士
亚太人工智能学会会士
曾获新加坡总统科技奖
曾任国际语音通信学会主席
顶级期刊IEEE/ACM《音频、语音和语言处理汇刊》主编
原新加坡国立大学终身教授
研究领域:
语音信息处理、自然语言处理、类脑计算、人机交互
简介:
李海洲教授现任香港中文大学(深圳)数据科学学院执行院长、校长学勤讲座教授,同时他也是新加坡国立大学客座教授和德国不来梅大学卓越讲座教授。此前,他曾于2006年至2016年分别担任新加坡南洋理工大学和新加坡国立大学教授,于2009年担任东芬兰大学客座教授,于2011年至2016年任澳洲新南威尔士大学客座教授,于2003年至2016年担任新加坡科技研究局通信与资讯研究院首席科学家和研究总监。
李教授曾任顶级期刊IEEE/ACM Transactions on Audio、Speech and Language Processing主编(2015-2018年);目前任Computer Speech and Language副主编(2012-2022年)、Springer International Journal of Social Robotics副主编(2008-2022年)。李教授也曾担任多个学术委员会委员:IEEE语音与语言处理技术委员会委员(2013-2015年)、IEEE信号处理学会出版委员会委员(2015-2018年);目前任IEEE 信号处理学会奖励委员会委员(2021-2023年)。李教授也曾是多个学会主席:国际语音通信学会主席(ISCA, 2015-2017年)、亚太信号与信息处理协会主席(APSIPA, 2015-2016年)、亚洲自然语言处理联合会主席(AFNLP, 2017-2018年)。此外,他还担任过ACL 2012、INTERSPEECH 2014等多个大型学术会议的主席,他也是IEEE声学、语音与信号处理国际会议 (ICASSP 2022)的主席。
李教授享誉国际,他不仅在语音识别和自然语言处理研究领域有着突出贡献,还领导研发了多项知名的语音产品,如1996年苹果电脑公司为Macintosh发行的中文听写套件、1999年Lernout & Hauspie公司为亚洲语言发行的Speech-Pen-Keyboard文本输入解决方案。他是一系列重大技术项目的架构师,项目包括2001年为新加坡樟宜国际机场研发的具有多语种语音识别功能的TELEFIQS自动呼叫中心、2012年为联想A586智能手机研发的声纹识别引擎、2013年为百度音乐研发的听歌识曲引擎。他的“音素集”研究成果解决了亚洲口语语言的语音识别的实用化问题,在美国和多个欧洲国家注册。