喜讯 | 港中大(深圳)数据科学学院贺品嘉教授团队5篇论文被顶会ICSE 2024接收
香港中文大学(深圳)数据科学学院贺品嘉教授及其团队5位本科生、1位硕士生、3位博士生和1位访问博士生共5篇论文被ICSE (IEEE/ACM International Conference on Software Engineering, 简称ICSE) 2024接收。ICSE是国际公认的软件工程领域顶级会议,被中国计算机学会(CCF)列为A类会议。ICSE 2024共收到论文投稿1051篇,最终录取234篇,录用率22.2%。
截至目前,学院学生2023年在国际权威期刊和学术会议上共发表论文49篇,如顶会NeurIPS 、ICML、ACL、ICRA、CVPR,顶刊OR、SIAM Journal on Optimization 、Briefings in Bioinformatics ,涵盖人工智能、机器学习、计算神经科学、计算机视觉、自然语言处理、机器人、运筹学、数学与计算生物学、应用数学等研究领域。除研究生外,学院本科生们也展示了科研的潜力与实力,论文作者中包括8位本科生。
ICSE简介
ICSE全称为International Conference on Software Engineering,是国际公认的软件工程领域学术顶会,由国际计算机学会(ACM)与电气与电子工程师协会(IEEE)联合主办,每年召开一次,2024年是其第46届会议。
自1975年创办以来,每年都有来自全球众多科研人员投稿与参会。ICSE一直致力于为软件工程领域的研究者、教育者和从业者们提供最新最重要的研究成果、经验及方向。ICSE对论文质量有着高要求,论文被录用代表其对软件工程领域有基础显著的贡献。
来源:ICSE官网
论文作者简介
*按姓名首字母排序
陈翰飞
2022级本科生
港中大(深圳)数据科学学院
计算机科学与技术专业
曾晋级第48届国际大学生程序设计竞赛总决赛
方澳阳
2023级硕士生
港中大(深圳)理工学院
计算机与信息工程专业
曾在国际会议ASE发表论文
忙秋阳
2021级本科生
港中大(深圳)数据科学学院
计算机科学与技术专业
曾晋级第46届国际大学生程序设计竞赛总决赛、曾在国际会议ESEC/FSE发表文章
王定华
2019级访问博士生
悉尼科技大学与南方科技大学联培项目
计算机科学与工程专业
曾在国际会议ESEC/FSE、ICSE、ISSRE发表论文
谢皓天
2018级本科生
港中大(深圳)数据科学学院
计算机科学与技术专业
曾在pony.ai、autra.tech任基础架构工程师
将于2024年春季前往Rutgers大学攻读计算机硕士
徐俊杰龙
2022级博士生
港中大(深圳)数据科学学院
计算机科学专业
曾在国际会议ESEC/FSE、ICSE发表论文
杨睿淳
2018级本科生
港中大(深圳)数据科学学院
计算机科学与技术专业
曾在国际会议ICSE、ICASSP发表论文
姚嘉弈
2020级本科生
港中大(深圳)数据科学学院
数据科学与大数据技术专业
将于2024年秋季前往芝加哥大学攻读计算机博士
余博西
2021级博士生
港中大(深圳)数据科学学院
数据科学专业
曾在国际会议ISSTA、ESEC/FSE、ICSE发表论文
钟智庆
2023级博士生
港中大(深圳)数据科学学院
计算机科学专业
曾在国际会议ISSTA发表论文
指导教授简介
贺品嘉
香港中文大学(深圳)数据科学学院助理教授
香港中文大学博士
全球Top 2% 顶尖科学家、顶会ICSE 2024和ESEC/FSE 2023的程序委员会成员、期刊TOSEM的Associate Editor、曾获IEEE开源软件服务奖、曾任苏黎世联邦理工学院博士后
研究领域:
软件工程、软件测试、软件安全、智能运维、可信人工智能、自然语言处理
个人简介:
贺品嘉教授现为香港中文大学(深圳)助理教授。贺品嘉教授于2018年从香港中文大学获得博士学位,此后在苏黎世联邦理工学院从事学术研究工作三年。贺品嘉教授的研究方向为软件工程、软件测试、软件安全、智能运维、可信人工智能、自然语言处理等。
近年来,他在ICSE, ESEC/FSE, ASE, ISSTA, OSDI, CSUR, TDSC等顶级会议期刊发表过学术论文40余篇。他曾获得首届IEEE开源软件服务奖、ISSRE最有影响力论文奖、ISSRE 2022杰出审稿人奖。其Google Scholar引用超4000次。贺教授主导的自动化日志分析开源项目LogPAI在GitHub上被star 3000余次,并被450多个学界业界组织下载5万余次。贺品嘉教授是ICSE, FSE, ASE, ISSTA等会议的程序委员会成员,期刊TOSEM的Associate Editor。
教授访谈
Q:您是如何指导学生们做科研发表论文的?
A:其实我也还在摸索合适的方法。目前我的做法是,通过给学生提供参考样例而不是直接帮他们解决问题的方式,引导学生自己想出解决方案,锻炼他们独立科研的能力。这是理想状况,实际中由于赶deadline等原因,导师不得不加入“战斗”,比如重写部分论文。
此外,我会尽量了解学生的喜好与能力。有的学生比较独立,有想法,这种情况我会让学生尝试自己提出idea,我来评判idea的好坏,给出建议,并以这种方式推进项目。有的学生解决问题的能力很强,但不习惯于找问题与想idea,这种情况我会给学生指定一个方向或者课题,提供适当的帮助以保证项目不走进死胡同。我比较开心的是,这次组里被ICSE接收的论文,大部分的核心idea都是第一作者学生想到的。比如关于图数据库测试的论文,核心idea是大三本科生忙秋阳同学独立提出,并在他大二期间完成的。
Q:在科研方面,您有什么建议给到学生们?
A:我建议博士生或对科研感兴趣的硕士生尽早以第一作者身份lead科研工作。具体来说,从找问题、idea的提出与修改、相关文献的阅读、方法的构思、实验的设计、到写作的打磨,每一个步骤都以leader的角色经历一遍。过程中与导师和身边的同学积极沟通,寻求帮助与指导。经过几个工作的锻炼后,慢慢掌握独立科研的能力。一开始导师会在其中几个步骤中扮演重要的角色。本科生如对科研有兴趣,建议在学有余力的前提下,参与到由硕博学生lead的项目中,并根据自身的情况考虑是否lead自己的科研工作。
论文介绍
1. Deep Learning or Classical Machine Learning? An Empirical Study on Log-Based Anomaly Detection
作者:
Boxi Yu, Jiayi Yao, Qiuai Fu, Zhiqing Zhong, Haotian Xie, Yaoliang Wu, Yuchi Ma, Pinjia He
论文摘要:
尽管深度学习已经成为一种强大的技术,但在与计算成本相关的情况下,必须谨慎考虑其优势。具体而言,尽管深度学习方法在日志异常检测方面表现出了强大的性能,但它们通常需要更多的时间进行日志预处理和模型训练,从而阻碍了它们在需要快速构建和推断以进行日志异常检测的分布式云系统中的采用。本文研究了深度学习方法在日志异常检测中与较简单技术相比的优越性。我们在五个公共日志异常检测数据集上评估了基本算法(例如,KNN,SLFN)和深度学习方法(例如,CNN,NeuralLog)。我们的研究结果表明,简单的算法在时间效率和准确性方面优于DL方法。例如,在Thunderbird数据集上,K最近邻算法的训练速度比NeuralLog快1000倍,同时F1-Score高出0.0625。我们还确定了导致这一现象的三个因素,即(1)冗余的日志预处理策略,(2)数据集的简单性以及(3)日志异常检测中二进制分类的性质。为了评估DL的必要性,我们提出了LightAD,一种可以优化训练时间、推断时间和性能得分的评估框架。通过自动超参数调整,LightAD可以在日志异常检测模型之间进行公平比较,使工程师能够评估复杂深度学习方法的适用性。我们的研究结果对日志异常检测社区提出了警示,强调在采用深度学习方法之前需要对数据集和研究任务进行批判性分析。提出计算成本较高的模型的研究人员应该将其与轻量级算法进行基准测试,以确保综合评估。
2. DivLog: Log Parsing with Prompt Enhanced In-Context Learning
作者:
Junjielong Xu, Ruichun Yang, Yintong Huo, Chengyu Zhang, Pinjia He
论文摘要:
日志解析是自动日志分析中最首要且关键的步骤,它涉及从半结构化日志中提取日志模板,以生成结构化日志。然而,现有的日志解析器由于两个原因效果有限。首先,传统的数据驱动日志解析器完全依赖于启发式规则或领域专家设计的手工特征,这可能无法在来自不同系统的日志上保持一致的高性能。其次,现有的监督式日志解析器需要模型调优,但通常受限于固定的训练样本,这导致其在整个日志源上的性能不是最优的。为了解决这一限制,我们提出了一个有效的日志解析框架——DivLog,它基于大型语言模型(LLMs)的上下文学习(ICL)能力。具体来说,在日志解析之前,DivLog通过最大化离线日志样本的多样性来选择少量候选日志样本。然后,在日志解析过程中,DivLog为每个目标日志选择五个合适的标记过的候选样本作为示例,并将其构建成一个提示。通过挖掘提示中示例的语义,DivLog能够不需要训练地生成目标日志模板。此外,我们设计了一种简单却高效的提示格式来提取输出并提高生成日志模板的质量。我们在16个广泛使用的公共数据集上进行了实验。结果显示,DivLog平均达到了(1)98.1%的解析准确率、(2)92.1%的精确模板准确率以及(3)92.9%的召回模板准确率,展现了业界领先的性能。
3. UniLog: Automatic Logging via LLM and In-Context Learning
作者:
Junjielong Xu, Ziang Cui, Yuan Zhao, Xu Zhang, Shilin He, Pinjia He, Liqun Li, Yu Kang, Qingwei Lin, Yingnong Dang, Saravan Rajmohan, Dongmei Zhang
论文摘要:
日志记录是软件可靠性增强的关键步骤,它同时涉及到日志语句位置、详细级别和日志信息的确定。近年来,虽然开发了众多自动日志工具帮助开发者处理日志记录任务(例如,在try-catch块中提供是否应进行日志记录的建议),但这些工具通常情况下并不能提供全面的日志解决方案。尽管最近的研究已经开始探索端到端的日志生成,但是高昂的调优成本仍然大幅限制了其在软件开发中的实际应用。为解决这些问题,本文提出了一个名为UniLog的自动日志框架,该框架基于大型语言模型(LLMs)的上下文学习(ICL)范式。具体来说,UniLog能够只通过包含五个演示实例的提示语来生成合适的日志语句,无需进行任何模型调整。此外,在使用几百个随机样本进行热身后,UniLog的日志生成能力可以得到进一步增强。我们在包含来自1,465个GitHub仓库的12,012个代码片段的大型数据集上评估了UniLog。结果显示,UniLog在自动记录日志方面达到了业界最高水平:(1)选择日志位置的准确率达到76.9%,(2)预测详细级别的准确率为72.3%,以及(3)生成日志信息的BLEU-4得分为27.1。同时,UniLog所需的参数调整时间不到细调同一个LLM所需时间的4%。
4. Testing Graph Database Systems via Equivalent Query Rewriting
作者:
Qiuyang Mang*, Aoyang Fang*, Boxi Yu, Hanfei Chen, Pinjia He(*共同一作)
论文摘要:
图数据库管理系统通过图模型存储数据,并利用图遍历来执行查询,在推荐系统、知识图谱和社交网络等领域得到了广泛应用。然而,就像关系数据库管理系统一样,图数据库也存在缺陷。这些缺陷通常表现为逻辑错误,可能导致查询结果不准确、查询性能不稳定或出现异常。
本文将一种高层次、广泛适用的概念——等价查询重写,应用于图数据库的测试中。其核心思想是将图数据库的查询重写为等价的查询形式,这些查询会触发不同的查询执行计划,并检查这些计划在系统行为上是否存在差异。为了实现等价查询重写,我们提出了一个名为“抽象语法图”的通用概念。这个概念通过图中的路径来嵌入查询的语义。给定一个基础查询,我们首先构建一个抽象语法图,然后通过寻找能够共同承载该基础查询完整语义的路径来生成等价查询。基于这一思路,我们设计了一种简单但有效的路径覆盖算法——随机行走覆盖。作为这些理念的实际应用,我们开发了一个名为GRev的工具。该工具已在五个流行的图数据库中成功检测出22个之前未被发现的缺陷,其中12个已得到开发者的确认。特别值得注意的是,我们发现了14个与图数据库中图数据检索遍历不当实现相关的缺陷,这些缺陷使用现有技术很难被检测出来。
5. An Exploratory Investigation of Log Anomalies in Unmanned Aerial Vehicles
作者:
Dinghua Wang, Shuqing Li, Guanping Xiao, Yepang Liu, Yulei Sui, Pinjia He, Michael Lyu
论文摘要:
无人机在我们日常生活中变得越来越普遍。然而,与许多其他复杂系统一样,无人机容易受到软件漏洞的影响,这可能导致异常系统行为和不良后果。研究由软件漏洞引起的无人机异常现象对于确保无人机系统的质量和安全至关重要。然而,对于软件漏洞引起的无人机异常的代码特征调查研究相对有限,这妨碍了开发有效工具以诊断和定位无人机系统代码中的漏洞。
为填补研究空白并加深我们对无人机异常的理解,我们进行了一项实证研究。首先,我们收集了两个流行的开源无人机平台PX4和Ardupilot中由软件漏洞引起的178个真实异常日志。然后,我们检查了每个异常日志并整理了它们的共同模式。特别是,我们调查了导致无人机崩溃的最严重的异常,并确定了它们的特征。根据我们的实证研究结果,我们进一步总结了通过分析异常无人机飞行数据来定位系统代码中漏洞的挑战,这可以为未来在这一领域的研究提供见解。