讲座回顾 | 专业解读ChatGPT
在ChatGPT迅速攻占全网话题时,港中大(深圳)数据科学学院系列学术讲座SDS Colloquium Series在2月17日策划了一场以ChatGPT为主题的专业解读讲座,让更多的人了解这个“流量明星”的全貌。
此次讲座由数据科学学院副院长(科研)查宏远教授主持,数据科学学院四位教授孙若愚、王本友、王趵翔、吴保元和经管学院陈琛教授分别从“ChatGPT的技术和能力概览”、“NLP视角的ChatGPT”、“ChatGPT的强化学习”、“AI大模型的安全性评测”、“机器的崛起:ChatGPT如何颠覆未来的工作?”五个角度进行了解读。
讲座当天有近200人到场,线上听众最多时达到760余人,整场讲座吸引了近千人参与。这是疫情全面开放以来学院线下参与度最高的一场学术讲座,也让我们在学期伊始即见证了学生们空前高涨的学习热情。
目前学院系列学术讲座SDS Colloquium Series已举办48场,讲座旨在聚集众多学者、师生乃至业界人士,共同探索专业学科的前沿研究、促进跨学科的沟通与交流、丰富学生们的学习体验,数据科学学院也将在未来持续开展更多具有讨论意义的优质学术讲座,在即将开通的学院视频号进行对外直播,敬请大家持续关注学院官网、公众号和视频号。
本篇回顾文也特别践行了ChatGPT技术,在孙若愚教授的讲座回顾中使用了ChatGPT协助润色,详情可在下文查看。以下为此次讲座的视频与文字回顾。
讲座回顾视频
https://video.cuhk.edu.cn/Panopto/Pages/Viewer.aspx?id=e8d91f1a-a6dd-4495-82e8-afb0006a789e
讲座回顾
ChatGPT的技术和能力概览
孙若愚 数据科学学院副教授
研究领域:深度学习理论和算法、生成模型、大规模优化算法、学习优化、图神经网络、通信网络
本次讲座,孙若愚教授全面介绍了 ChatGPT 的能力和技术。
第一部分介绍了人工智能领域三次浪潮中的重要事件,为听众提供了背景和历史。第二部分从功能和人格化两个角度详细介绍了 ChatGPT 的能力,例如语言接口、文章写作、代码编写、法律专业知识等功能,以及其在模拟角色、端水大师、情绪化表达等方面的人格化特点。同时,孙教授也指出了 ChatGPT 在事实正确性和符号推理方面的局限性。孙教授还引用了 LeCun 在 2020 年的讲座,强调 ChatGPT 的通用多任务能力是人工智能领域长期以来追求的目标。ChatGPT 很可能是第一个具有很强多任务能力的模型,这种通用能力是与其他 AI 模型(如 AlphaGo 和 AlphaFold2)不同的重要特点。这种能力的实现对于人工智能的未来发展有着重要的意义。第三部分介绍了 ChatGPT 的部分主要技术,包括自监督学习、神经网络架构(如 Transformer 和注意力机制)以及大规模训练技术。
孙教授在讲座中也提到了 Instruction tuning 和 RLHF 两种技术,并表示后续两位教授将对其进行更详细的解读。他特别提到了 LeCun 的蛋糕理论,即强化学习和监督学习类似于蛋糕上的樱桃和冰霜,而自监督学习则是蛋糕的主体。从 ChatGPT 的技术来看,虽然监督学习和强化学习扮演着重要的辅助角色,但是基于自监督学习的预训练大模型还是 ChatGPT 成功的基石。总体来说,孙教授通过全面介绍 ChatGPT 的能力和技术,为听众提供了对这一领域的更全面的了解。
讲座结束后,孙教授使用了 ChatGPT 来对这部分文字稿进行润色,ChatGPT 不仅能婉转地阐述修改意见,更是在润色后的文稿末尾开启了“自夸模式”,让我们见识了它的“高情商”。
NLP视角的ChatGPT
王本友 数据科学学院助理教授
研究领域:自然语言处理、信息检索、应用机器学习
ChatGPT 语言模型在短短两个月的时间里获得了全球的广泛关注。王本友教授介绍了语言模型和 Prompt,其中后者(Prompt)充当连接人与前者(语言模型)的交互接口。
通过文字 Prompt,可以让 ChatGPT 有 In-context learning、复杂推理、Chain of thought 等优点;尽管其中一些已经被 ChatGPT 的早期版本探索过。随后王教授探讨了 ChatGPT 带来的新范式、引入的新特性、未解决的问题。最后他讨论了创建中文 ChatGPT 的可能性和难度、以及 ChatGPT 对行业和更广泛的科学和工程社区的影响。
ChatGPT中的强化学习
王趵翔 数据科学学院助理教授
研究领域:强化学习、在线学习、学习理论
王趵翔教授介绍了 ChatGPT 中有关基于人类反馈的强化学习(RLHF)的内容。
一方面, 他简单地说明了使用 RLHF 是为了赋予语言模型和人类互动能力, 让语言模型更好地和人类进行对话, 完成人类的任务;另一方面, 他讨论了 RLHF 的使用思路, 即使用少量人类反馈数据学习奖励函数, 再通过强化学习生成大量样本来学习该奖励函数所描述的任务。
AI大模型的安全性评测
吴保元 数据科学学院副教授
研究领域:系统辨识、机器学习、状态推理、数据科学、传感器融合、可扩展算法、非线性控制
吴保元教授针对 AI 语言大模型的安全性问题进行了简要介绍。
基于深度神经网络的 AI 模型往往具有很多安全性问题,比如鲁棒性差、隐私泄漏、偏见、难以解释等。随着 AI 语言大模型的快速发展和可预期的广泛应用前景,我们尤其要重视其存在的安全问题,否则会带来难以预料的负面影响。
吴教授重点介绍了偏见(Bias)评估和模型生成文本检测这两个典型安全任务和最新评估结果,揭示了 AI 语言大模型存在着难以忽视的安全问题,希望引起更多研究者和公众对于 AI 安全的关注和思考,共同促进 AI 技术的健康发展。
机器的崛起:ChatGPT如何颠覆未来的工作?
陈琛 经管学院助理教授
研究领域:先进的机器学习算法
作为最新的颠覆性创新,ChatGPT 有望彻底改变未来世界的方方面面,包括工业、商业、服务部门和日常生活等。
陈琛教授重点讲解了 ChatGPT 和新一代人工智能将如何重塑未来的工作。他认为 ChatGPT 将通过取代传统工作、创造对人机交互工作的不断增长的需求,甚至催生新的工作类别,如机器人培训师和即时写作专家,从而彻底改变就业市场。