数说好课 | 港中大(深圳)特聘教授叶荫宇特别课程:优化思维是AI时代的破局关键
香港中文大学(深圳)数据科学学院(SDS)创新融合计算机科学与技术、数据科学与大数据技术、统计学三大专业方向,打造特色交叉学科教育体系。通过“数说好课”专栏,我们精选学院优质课程,展现教学创新成果。
本期专栏聚焦由国际著名运筹学家、冯·诺依曼奖首位华人得主、美国斯坦福大学管理科学与工程系及计算数学工程研究院杰出终身教授、港中大(深圳)数据科学学院特聘教授叶荫宇主讲的精品短期课程——DDA4300 数据科学与机器学习中的优化。
通过学生记者对叶教授的采访和选课学生的心得反馈,我们带您走进叶教授的课堂,聆听他对优化思维的深刻解读、跨学科研究的前沿洞见,以及对青年学者在AI时代的成长建议。
课程及教授介绍
课程内容
DDA4300 数据科学与机器学习中的优化(Optimization in Data Science and Machine Learning)课程介绍机器学习和数据科学中的若干重要优化模型,如强化学习、马尔可夫决策过程等。
任课教师

叶荫宇
教授(特聘)
研究领域:
连续和离散优化、数据科学及应用、数字算法设计及分析、算法博弈及市场均衡、运筹及管理科学
个人简介:
叶荫宇教授现为香港中文大学(深圳)数据科学学院特聘教授,上海交通大学智能计算研究院特聘教授。此前叶教授为斯坦福大学管理科学与工程系及计算数学工程研究院李国鼎讲席教授。他的主要研究方向为连续和离散优化、数据科学及应用、数字算法设计及分析、算法博弈及市场均衡、运筹及管理科学等;他和其他科学家开创了内点优化算法、锥规划模型、分布式鲁棒优化、在线线性规划和学习、强化学习和马尔可夫过程算法分析等。他多次获得科学奖项:包括2006年因在最优化领域做出的基础性贡献而获得的INFORMS Farkas奖(首届获奖者)、2009年因在运筹学和管理科学领域做出的根本性持续贡献而获得的约翰·冯·诺依曼理论奖、国际数学规划2012 Tseng Lectureship Prize(每三年颁发一次)、2014美国应用数学学会优化奖(每三年颁发一次)等。根据谷歌学术统计,目前他的文章被引用总计超过64000次。
01
课堂回顾
培养优化思维,突破资源局限
叶荫宇教授:“我希望向学生传递的是:真正的‘智能’体现在如何用最少的资源(如资金、算力等)完成更多的工作。”
叶教授强调,这门课程的核心目标是培养学生优化的思维方式。在他看来,真正的智能不在于拥有多少计算资源,而在于如何通过数学技巧和逻辑改进来提升效率。他指出,DDA4300课程强调的是“用智慧和数学能力解决问题,而不是单纯依赖资源的堆砌”,并鼓励学生重新思考智能的本质。
启蒙学生:经典案例的启发

叶教授在课堂上使用板书辅助讲解
在课程中,叶教授通过具体案例帮助学生理解优化的价值。李炳然同学分享了一个令他深受启发的课堂案例。这个经典案例让同学们深刻体会到,在计算机尚未普及的年代,理论创新如何实现从0到1的突破:
李炳然
2022级 理工学院 数学与应用数学
“叶老师讲解他从事线性规划(LP)研究的动机让我印象深刻。他提到乔治·丹齐格(George Dantzig)a发明单纯形法时,仅凭纸笔就能完成计算,将原本难以高效求解的LP问题转化为可解问题,实现了从0到1的突破。这让我深刻认识到,在缺乏强大计算资源的时代,理论创新的重要性,也激发了我对计算复杂度理论的兴趣。”
*注a:单纯形法由乔治·丹齐格(George Dantzig)于1947年提出,是解决线性规划问题的第一个有效算法,奠定了现代运筹学的理论基础。该方法通过迭代方式在可行域的顶点间移动,最终找到最优解。
案例为桥:抽象概念的具体呈现

叶教授在课堂上使用板书辅助讲解
以案例深化理论理解
叶教授擅长结合实际案例帮助学生提升学习兴趣,培养学生将理论转化为解决方案的能力。李卓轩同学在课程反馈中提到,叶教授通过应用案例的讲解,让抽象的理论知识变得更加生动易懂,对知识的理解也更加深入。李炳然同学也分享道,叶教授在讲解Wasserstein距离时,通过图像识别等具体案例的剖析,帮助学生深入理解这一抽象概念的实用价值:
李卓轩
2023级 数据科学学院 数据科学与大数据技术
“叶教授在课程中以其独特的教学方式,将理论与实际紧密结合,为学生们打开了优化思维的新视角。他在讲授理论知识时,不仅注重概念的严谨性,还通过大量生动的案例帮助学生更深刻地理解这些理论在实际问题中的应用。这种结合方式让抽象的数学原理变得更加贴近实际,也让学生能够更清晰地感受到优化理论的实用价值。
在课程学习中,我不仅掌握了一些全新的理论知识,还通过案例的讲解理解了这些理论在实际应用中的意义,从而对优化理论的魅力有了更深刻的体会。”
李炳然
2022级 理工学院 数学与应用数学
“其中一个让我印象深刻的课堂内容,是讲解Wasserstein距离b在图像识别中的应用。过去我对这个概念的理解仅停留在抽象定义层面——W(P,Q)是把分布P运送到分布Q的最小运输成本,但始终未能把握其本质。
直到课堂上叶老师用图像识别的实例讲解:给定一组图片,如何生成一张与它们都相似的新图片?这实际上是一个Barycenters问题c——寻找一个分布P使得W(P,Pi)的和最小,Pi是其他图像的分布。非常神奇的是,用这个建模解出来非常好。好的理论真的能给出深刻的结果。”
*注b:Wasserstein距离:是度量两个概率分布之间差异的一种方法。它源自最优传输理论,计算将一个分布"搬运"成另一个分布的最小成本。
*注c:Barycenters问题:在度量空间中,寻找使到各点距离加权和最小的中心点。
使用教学工具可视化演示
叶教授注重将抽象理论与实际应用相结合,通过多种教学手段帮助学生建立直观理解。在算法对比环节,叶教授运用MATLAB等工具进行可视化演示,将不同优化算法的优缺点生动呈现:
郭锦鑫
2023级 理工学院 数学与应用数学
“这门课程作为偏入门(intro)性质的课程,叶老师并没有在理论证明上花费过多时间,而是将重点放在实际问题的解决上。他通过生动的教学方式,向我们完整展示了优化理论在实际应用中的思维转化过程。
特别是借助MATLAB工具d,叶老师直观地对比了不同算法的优缺点,还通过绘制图表帮助我们更好地理解核心概念和重点内容。这种教学方式完全符合我对精品短课的期待,不仅加深了我对优化领域的理解,更激发了我对优化研究的浓厚兴趣。”
*注d:MATLAB是由MathWorks公司开发的数值计算与科学编程平台。
思维培养:超越工具的学习

叶教授课后与学生们进行深入交流,解答疑问
通过DDA4300课程,叶教授希望学生们不仅能够掌握优化技术,更重要的是培养一种应对复杂问题的思维方式——以智慧和逻辑为基础,而非单纯依赖资源来寻求最优解。叶教授希望通过系统性的知识架构和跨领域的思维训练,帮助学生构建完整的知识体系,培养学生在复杂情境中寻找最优解的关键能力。
这种教学理念在学生中产生了深刻共鸣。同学们在课程反馈中分享道:
李炳然
2022级 理工学院 数学与应用数学
“这门课程相当于运筹学领域的'通识课',让我们系统性地接触到众多重要领域,包括锥优化、马尔可夫决策过程(MDP)等。这些内容在其他课程中往往零散分布,比如MDP通常在强化学习课程中才会涉及。因此,这门课提供了一个宏观的、系统的视角,让我们能了解不同领域,特别是通过大量生动的案例教学。
特别值得一提的是,当前机器学习的火热似乎让运筹学失去生机。但我的感受恰恰相反:机器学习中的许多核心概念、基本原理、建模方法和工具都源自运筹学,而且运筹学本身也在不断拓展新的应用领域,不断丰富和发展自身的理论体系。”
02
采访实录
优化思维及AI时代展望
SDS的独特优势
Q:港中大(深圳)和数据科学学院在培养学生方面有哪些独特优势?您对数据科学学院的学生有何印象?
叶荫宇教授:
“港中大(深圳)数据科学学院的独特优势,主要体现在跨学科的培养模式上。学院将统计学、计算机科学、运筹学和数学等多个学科深度融合,这样的全面培养模式是非常难得的,很少能找到类似的院校做到如此全面的整合。所以我的第一感觉是,这里的学生的知识面更加扎实、更加全面。
数据科学学院的学生给我留下的印象很深,他们的数理基础普遍很好。在人工智能领域,基础课程的知识尤为重要,尽管大语言模型目前备受关注,但为人工智能提供坚实技术基础的,主要还是计算机科学、优化、概率、数学等学科。从这一点来看,我认为数据科学学院的学生在这些领域都接受了系统性的跨学科训练,使他们具备明显的优势。

叶教授接受学生记者的采访,分享学术见解
在过去两年与学院学生的教学互动中,我发现同学们的综合素质非常高,这或许得益于学院本身的跨学科特点,使得学生的视野非常开阔,知识面也相对广泛。我个人觉得非常幸运能来这里和数据科学学院的师生一起交流。”
优化思维的核心
Q:您希望通过DDA4300课程向学生传授哪些核心知识与思维方式?能分享一下本次课程有哪些独特之处吗?
叶荫宇教授:
“这门课程的核心是优化。我认为优化不仅仅是技术层面的问题,更是一种思维方式。在算法设计中,通过数学技巧和逻辑改进,可以显著提升计算效率,而不是单纯依赖算力或硬件资源(比如购买更多的显卡)。这一点非常重要。
我希望向学生传递的是:真正的‘智能’体现在如何用最少的资源(如资金、算力等)完成更多的工作。优化的本质就是通过人的智慧、数学推理和逻辑思维,提升算法的有效性和降低其复杂性。这是一种方法论,而不是简单地比拼资源。
未来无论学生从事科研还是其他领域的工作,这种思维方式都至关重要。它强调的是用智慧和数学能力解决问题,而不是依赖资源的堆砌。这就是我想在这门课中传达的核心思想。”
对年轻学者的建议
Q:您培养的许多学生已成为顶尖学者或科技公司首席科学家。对于希望在优化领域或业界取得成就的年轻学者,您会建议他们优先发展哪些核心能力?
叶荫宇教授:
“首先,数学基础非常重要。像优化和其他数据科学等领域都离不开扎实的数学功底。
其次,我觉得直觉(intuition)也非常重要,尤其是在解决实际问题方面。比如,现在很多问题的规模变得很大时,纯数学方法可能解不动,这时候就需要依赖直觉或启发式规则。举个例子,像DeepSeek这样的公司,实际上是使用一些更简单直观的方法,把复杂的优化问题直观化。所以,学会用直观的方式思考问题,是优化领域的一项关键能力。
叶荫宇教授给年轻学者的成长建议
✅️打好数学基础:优化和数据科学领域的研究离不开扎实的数学功底。
✅️培养学科直觉:面对大规模复杂问题时,纯数学方法可能无法求解,需要依赖直觉或启发式规则。
✅️积累多领域知识:学习微观经济学等其他领域知识,建立数学直觉能力。
✅️掌握动态系统知识:动态系统的基本知识对理解强化学习和控制理论等问题非常重要。
我建议学生可以选一些微观经济学的课程,因为微观经济学实际上是把数学直观化的一门课。微观经济学很多情况本质上是利用数学建模,但用的是更直观的语言,比如‘价格’、‘供需’这些概念,能把抽象的数学模型讲得像大白话一样。这对培养数学直觉很有帮助。
当然,纯统计方向的可以学一些机器学习。另外,我推荐学习动态系统。因为无论是算法设计还是学习过程,本质上都是动态的。掌握动态系统的基本知识,对理解强化学习、控制理论等问题很有用。
数学方面,线性代数和凸优化(Convex Analysis)是基础,但微分方程和概率论也很重要,尤其是那些涉及集中不等式(Concentration Inequalities)和大数定理的内容。这些在优化和统计中都非常实用。”
Q:在数据科学领域,特别是像运筹学这样注重实际应用的学科,多了解其他学科的知识是否对科研更有帮助?年轻学者具体可以如何拓展知识面?
叶荫宇教授:
“的确,在运筹学这样的应用学科,仅仅研究数学和算法是不够的。现在科研和发文章,会提到讲big picture(全局观)的能力,要能把你的研究故事讲好。怎么讲好故事呢?关键是要扩大知识面,知道你的研究问题在哪些实际场景中能用得上。
我建议数据科学学院的学生,除了学习本专业的课程外,多去选修一些其他领域的课程。比如微观经济学,还有供应链管理这些课,都是很实用的。

叶教授接受学生记者的采访,分享学术见解
通过学习这些其他领域的知识,可以帮助你把数据科学研究的问题层次拉高。使得你不仅能从数学角度看问题,还能结合经济、甚至政治的高度来看问题。你需要知道你的研究在供应链管理里怎么用,在金融领域怎么用,在医疗系统怎么用。这些跨学科的知识能帮你找到更好的应用场景,也能让你的研究、你的论文更有说服力。”
AI时代的未来展望
Q:当前人工智能与数据科学的交叉融合也正在推动许多新兴领域的发展,您认为未来几年哪些技术方向最具突破潜力?对于年轻学者,您会推荐哪些重点研究方向?
叶荫宇教授
“从AI整体发展来看,我认为两个方向特别值得关注:一是大模型语言定制化,二是训练过程的科学化,减少对实验试错的依赖。
首先大模型语言定制化是一个非常重要的方向。就像医学领域有全科医生和专科医生之分一样,AI模型也需要专业化发展。现在的大模型就像全科医生,覆盖面广但不够深入。未来更需要‘专科医生’式的专业模型,能够针对特定领域提供更精准的解决方案。未来如何让大模型更聚焦、更简化,同时保持专业能力,这是关键。
另一个关键方向是大模型训练的科学化。目前大模型训练面临两个关键挑战:一是算力需求太大,二是专业知识数据相对匮乏。所以重点是要让训练过程更加智能化,而不是单纯靠堆算力、拼GPU。比如说,现在的学习率(Learning Rate)基本都是靠实验试出来的,那能不能发展一套更科学的方法来优化整个训练过程?我们数据科学学院的孙若愚老师就在做这方面的研究。
当然还有其他很有潜力的方向,比如让大模型具备更强的推理能力,但实现这个目标可能还需要时间。在优化领域,强化学习中的‘边采样边优化’方法很有前景。另外,黑箱优化(Black-box Optimization)也很重要——就是研究如何在缺乏函数表达式和梯度信息的情况下实现高效寻优。还有一个方向是如何利用GPU架构(GPU Architecture)设计更高效的算法,大幅提升求解速度。
叶教授强调AI时代下两个关键方向:
✅️优化:应用极其广泛,方方面面都能用得到
✅️强化学习:动态决策的智能引擎
对于年轻学者,特别是数理基础比较好的学生,在当前AI时代我会重点推荐两个方向:首先是优化,这个方向应用极其广泛,方方面面都能用得到;另个方向是强化学习。对于运筹学,有些人会觉得比其他领域简单,其实不然。运筹学的理论更强调可用性,所以表述往往简洁,但证明过程可能非常复杂。它的核心思想是把复杂理论‘下里巴人化’——也就是通俗化、实用化。这恰恰是最考验功底的。慢慢来!你们会体会到其中的奥妙。”

叶教授与学生记者合影
采访学生记者 | 李卓轩、王柯翰
排版、出品 | SDS Publicity
点击下方查看
DDA4310/CSC6135计算成像:探索拍摄黑洞及宇宙深空的前沿技术
敬请期待更多“数说好课”,
认识更多专业精品课程!