星耀数院 | 从“数字孪生股市”到黑盒攻防,港中大(深圳)数据科学学院学子在AI顶会连获佳绩
星耀数院
聚焦学术卓越,展现数院风采
作为香港中文大学(深圳)人工智能研究与教学的核心基地,数据科学学院(SDS)致力于培养具有国际视野的复合型人才。在SDS,学子们在前沿课程的熏陶下,依托顶尖师资与产学研融合平台,在机器学习、自然语言处理、计算机视觉等领域不断突破自我。
聚焦学术卓越,展现数院风采。「星耀数院」栏目将定期呈现数据科学学院学子的卓越成就,展现他们的非凡潜力与未来愿景!
SDS学子构建“数字孪生股市”,获ICLR 2025金融AI研讨会最佳论文奖
在人工智能顶级会议ICLR 2025下设的金融人工智能研讨会上,港中大(深圳)数据科学学院学子凭借研究论文“TwinMarket: A Scalable Behavioral and Social Simulation for Financial Markets”荣获唯一“最佳论文奖”。论文第一作者为计算机科学与技术专业大四本科生阳雨哲,共同第一作者为秋季入学博士生吴铭昊。
TwinMarket是首个整合大语言模型智能体、认知建模与社交传播机制的金融多智能体仿真平台,为计算实验金融和复杂系统研究提供了重要工具,并展示了大语言模型在人机协作和系统性金融风险分析中的潜力。该研究由港中大(深圳)数据科学学院王本友教授指导,并与南京大学俞红海教授团队合作完成。
论文链接:https://arxiv.org/pdf/2502.01506
SDS博士生郑美曦一作论文在AI顶刊IEEE TPAMI发布
港中大(深圳)数据科学学院计算机科学专业博士生郑美曦在黑盒对抗攻击领域取得重要突破。她以第一作者身份完成的研究论文“BlackboxBench: A Comprehensive Benchmark of Black-box Adversarial Attacks”成功发表在人工智能顶级期刊 IEEE TPAMI。
研究团队提出了目前收录规模最大的黑盒对抗攻击方法基准平台BlackboxBench,整合了 59种最新算法,为评估模型鲁棒性及开发强健防御策略提供了重要工具。郑美曦同学导师为吴保元教授。
论文链接:https://ieeexplore.ieee.org/document/11016822
SDS学子构建“数字孪生股市”,获ICLR 2025金融AI研讨会最佳论文奖
在人工智能顶级会议ICLR 2025下设的金融人工智能研讨会上,港中大(深圳)数据科学学院学子凭借研究论文“TwinMarket: A Scalable Behavioral and Social Simulation for Financial Markets”荣获唯一“最佳论文奖”。论文第一作者为计算机科学与技术专业大四本科生阳雨哲,共同第一作者为秋季入学博士生吴铭昊。
TwinMarket是首个整合大语言模型智能体、认知建模与社交传播机制的金融多智能体仿真平台,为计算实验金融和复杂系统研究提供了重要工具,并展示了大语言模型在人机协作和系统性金融风险分析中的潜力。该研究由港中大(深圳)数据科学学院王本友教授指导,并与南京大学俞红海教授团队合作完成。

ICLR 2025 金融人工智能研讨会 “Best Paper Award” 证书
会议介绍
国际表征学习大会(International Conference on Learning Representations, ICLR)是深度学习领域公认的顶级国际会议之一。自2013年创办以来,ICLR与NeurIPS和ICML并称为机器学习领域的“三大顶会”,在全球范围内具有深远的学术影响力。在谷歌学术(Google Scholar)的学术会议与期刊排名中,ICLR位列TOP 10,与Science、Nature和Cell等世界顶尖期刊齐名。ICLR 2025共收到近11,500份有效投稿,最终录取率为32.08%。
ICLR 2025下设的金融人工智能研讨会(Advances in Financial AI Workshop)吸引了来自全球的顶尖学者、产业领袖和政策制定者,共同探讨金融人工智能领域的最新进展、新兴挑战,以及负责任技术应用的实践路径。

来源:https://iclr.cc
学生作者介绍

王本友教授团队成员在 ICLR 2025 会议现场
阳雨哲
港中大(深圳)数据科学学院
计算机科学与技术专业,大四学生
论文第一作者,过去一年多,他专注于金融智能与多智能体系统(Multi-Agent System)领域的研究,已完成多项学术成果,并在自然语言处理顶级会议NAACL上发表论文。
吴铭昊
现为南京大学工程管理学院硕士生
港中大(深圳)王本友教授团队2025年秋季入学博士生
论文共同第一作者,他的研究兴趣聚焦于多智能体模拟(Multi-Agent Simulation)。
张凯迪
港中大(深圳)经济管理学院
市场学硕士生
现为王本友教授团队成员,致力于研究大语言模型的应用,参与研究了大语言模型在金融领域,公共卫生领域,医疗图像领域的应用。
导师教授介绍

王本友
数据科学学院 助理教授
研究领域:
自然语言处理、信息检索、应用机器学习
个人简介:
王本友教授于2022年在意大利帕多瓦大学取得博士学位(受欧盟玛丽居里奖学金资助),曾在丹麦哥本哈根大学、加拿大蒙特利尔大学、荷兰阿姆斯特丹大学、华为诺亚方舟实验室、中科院理论物理所、社科院语言所交流访问。王教授的主要研究方向为大模型应用、多模态大语言模型、AI4Math和Human-Agent Interaction。他曾四次获得了会议最佳论文或提名奖,包括CCF A类会议SIGIR 2017的最佳论文提名奖、CCF B类会议NAACL 2019最佳可解释NLP论文,CCF C类会议NLPCC 2022的最佳论文和ICLR 2025 Financial AI最佳论文。他还获得了华为火花奖、腾讯犀牛鸟项目、滴滴盖亚学者项目和华为AI百校计划。团队开发了医疗大模型华佗GPT等多个大模型,相关工作得到了Nature、金融时报(Financial Times)、CCTV、环球时报、深圳卫视、南方都市报等采访和报道。
研究亮点
构建“数字孪生股市(TwinMarket)”,开辟计算实验金融新范式
TwinMarket 是首个在金融场景中系统整合大语言模型智能体、认知建模与社交传播机制的大规模多智能体仿真平台。它不仅为计算实验金融提供了强大工具链,也为理解复杂系统中个体行为如何演化为集体动态提供了重要研究视角。更广泛而言,该框架展示了 LLM 在构建可信人机协作系统、理解社会经济涌现现象与分析系统性金融风险中的巨大潜力。
该研究针对传统基于规则的智能体建模方法(ABM)在模拟真实金融市场中复杂、异质化决策行为及其涌现特征方面的局限,提出了一个由大语言模型(LLM)驱动的多智能体系统框架 TwinMarket。与以往依赖静态行为规则和同质性假设的模型不同,TwinMarket 能够生成具有人格特征、行为偏好、社会属性和认知能力的“类人”智能体,真实再现投资者在信息感知、情绪响应、交易策略形成和社会互动中的复杂行为。
在微观层面,TwinMarket 构建于信念-愿望-意图(BDI)认知架构之上。每个智能体每天以自然语言与环境交互:接收新闻、分析市场数据、感知社交动态、制定交易计划并执行行动。其行为决策不仅依赖于个体的内在偏好和过往经验,还受其社交邻居影响,实现了动态认知、社交嵌入和行为反馈的统一建模。系统通过使用 LLM赋能每个智能体,使其具备多轮推理、因果判断、行为规划和个性保持等能力,从而突破传统 ABM 模型在表达力和适应性方面的天花板。
在系统层面,TwinMarket 构建了两个核心基础设施:一个订单驱动的市场撮合系统和一个基于交易行为相似性动态更新的社交网络系统。交易系统用于执行个体行为在价格层面的反馈,并驱动市场指数演化;社交网络用于建模信息传播与情绪扩散过程,使智能体之间产生行为模仿、情绪共鸣与信任链条。系统中还设计了基于内容热度和相似度的信息聚合机制,用于动态控制每个智能体的“注意力窗口”,模拟现实中的信息过载、偏见选择与情绪放大效应。
依托上述框架,TwinMarket 在多个实证实验中展现出卓越性能。它不仅成功复现了金融市场中的一系列“典型化事实”,包括:收益分布厚尾性、杠杆效应、交易量-波动相关性和波动聚集现象,还揭示了多个涌现行为机制,例如:
▪️“自我实现预言”:智能体基于集体信念进行行为决策,最终反过来推动市场走势与最初预期一致;
▪️“信息不对称驱动的舆情极化”:关键意见领袖在社交网络中传播偏见性信息,引发市场行为的群体分化和对立演化;
▪️“恐慌传播与价格崩盘”:谣言或负面事件在网络中非线性扩散,引发大规模同步抛售,模拟市场非理性暴跌。
在对比实验中,TwinMarket在多个评价指标上(如 RMSE、MAE、Kurtosis、GARCH系数等)均显著优于传统ABM基线方法。消融实验清晰表明:一方面,移除 BDI认知建模会使市场行为变得非理性但缺乏结构性波动,另一方面,消除智能体异质性会导致市场动态趋于平稳,缺乏真实市场中复杂行为的生成基础。
论文链接:https://arxiv.org/pdf/2502.01506
SDS博士生郑美曦一作论文在AI顶刊IEEE TPAMI发布,在黑盒对抗攻击领域取得重要突破
港中大(深圳)计算机科学专业博士生郑美曦在黑盒对抗攻击领域取得重要突破。她以第一作者身份完成的研究论文“BlackboxBench: A Comprehensive Benchmark of Black-box Adversarial Attacks”成功发表在人工智能顶级期刊IEEE TPAMI。
研究团队提出了目前收录规模最大的黑盒对抗攻击方法基准平台BlackboxBench,整合了 59 种最新算法,为评估模型鲁棒性及开发强健防御策略提供了重要工具。郑美曦同学导师为吴保元教授。
期刊介绍
IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI)是计算机视觉、模式识别与人工智能领域的国际顶级期刊,由IEEE Computer Society出版。作为IEEE旗下最具影响力的期刊之一,TPAMI长期位列中国科学院一区(Top期刊)、CCF-A类推荐期刊,影响因子为20.8。
学生作者介绍

郑美曦
港中大(深圳)数据科学学院
2023级计算机科学博士
导师:吴保元
研究方向:对抗机器学习
导师教授介绍

吴保元
数据科学学院 副教授
研究领域:
可信人工智能、生成人工智能
个人简介:
吴保元博士现任香港中文大学(深圳)数据科学学院终身副教授、助理院长(科研),并担任深圳市模式分析与感知计算重点实验室(筹)副主任、龙岗区智能数字经济安全重点实验室主任。其研究方向包括可信人工智能、机器学习和计算机视觉,在人工智能的顶级期刊和会议上发表论文90多篇,并曾入选人工智能顶级会议CVPR 2019最佳论文候选名单。其担任人工智能领域国际期刊IEEE TIFS、Neurocomputing编委、第五届中国模式识别与计算机视觉大会PRCV 2022组委会主席、国际会议CVPR 2024/2025、NeurIPS 2022/2023/2024、NeurIPS Datasets and Benchmarks Track 2023/2024、ICLR 2022/2023/2024、ICML 2023/2024/2025、AAAI 2022/2024/2025领域主席、中国自动化学会模式识别与机器智能专委会副秘书长,入选斯坦福大学“全球前2%顶尖科学家”2021、2022、2023年度榜单。作为项目负责人承担广东省自然科学基金杰出青年项目1项,科技部重点研发计划重点专项课题1项,国家自然科学基金面上项目1项, 深圳市优秀科技创新人才优秀青年基础研究项目1项,CCF-腾讯犀牛鸟基金1项,CCF-快手大模型探索基金1项,CCF-海康威视斑头雁基金1项,CAAI-华为MindSpore学术奖励基金1项,腾讯犀牛鸟研究专项基金2项。荣获2023年度香港中文大学(深圳)青年科研奖。
研究背景
在人工智能模型不断走向实际应用的今天,如何评估模型的鲁棒性,成为研究者和工程实践者共同关注的难题。对抗样本,即在正常输入中添加人类难以察觉的微小扰动就能够误导性能良好的模型,作为衡量模型脆弱性的核心工具,在黑盒场景下提出了更高挑战——攻击者无法获得被攻击模型参数和结构。这种“黑盒对抗攻击”由于更贴近现实场景,近年来成为研究热点,涌现出大量新方法,攻击效率显著提升。
由于无法获取目标模型的完整信息,攻击者往往依赖外部查询或替代模型,从而分别形成了基于查询的攻击(query-based)和基于迁移的攻击(transfer-based)。这两个方向都投入了大量研究努力,为构建更强健的防御机制和鲁棒模型提供了重要评估手段。然而,由于不同攻击方法在不同的模型和数据集上进行评估,导致研究者难以厘清这些方法带来的实际威胁以及该领域的真实发展进展。同时,不统一的代码风格与缺乏一致的攻击流程框架,也使得很难通过这些方法来系统检验现有鲁棒模型或防御策略的效果。
研究贡献
我们提出了一个全面的黑盒对抗攻击基准平台,称为 BlackboxBench。截至目前,我们已经整合了29种基于查询的攻击算法和30种基于迁移的攻击算法,据我们所知,这是目前收录规模最大的黑盒对抗攻击方法基准平台。

Website: https://blackboxbenchmark.github.io/
Source codes: https://github.com/SCLBD/BlackboxBench/
BlackboxBench具备以下特点:
1️⃣BlackboxBench采用模块化与统一化攻击流程实现,其中核心的攻击模块基于一个由多个功能模块组成的标准化攻击流程构建而成。这种设计使得BlackboxBench能够实现公平且标准的评估,有助于明确有效的技术路线,降低新研究者参与门槛,并提升用户友好性。

2️⃣基于BlackboxBench,我们在多个攻击设置、目标模型和数据集上对所有query-based与transfer-based攻击方法进行了系统评测,总计完成了14,950组评估实验。这些标准化评估构建了一个排行榜,用于识别当前最有效的方法,并追踪该领域的实际进展。


3️⃣除了构建基准评测外,我们进一步利用BlackboxBench来加深对黑盒对抗脆弱性的理解。除了上述评估实验外,我们扩展了实验范围,系统性地研究多个关键因素对模型脆弱性的影响,包括攻击数据来源、替代与目标模型的架构、攻击预算限制、防御策略、以及攻击流程本身。与之前的评估侧重于追踪性能不同,这些扩展分析旨在揭示黑盒脆弱性的深层原因。我们围绕11个关键分析问题展开,从数据、模型架构、攻击预算、防御与攻击策略等视角提供了多个启发性结论。

论文链接:https://ieeexplore.ieee.org/document/11016822