最新动态
关于我
我是北京航空航天大学博士生,隶属于 SMAT 实验室,导师为黎立教授,副导师为周鸣一。
教育背景
研究聚焦于AI for Software Engineering (AI4SE),将大语言模型(LLM)与程序分析技术结合,构建更可靠、更安全的软件工程智能工具。 我的工作横跨多个子方向——从自动化程序修复到 LLM 安全评估,从领域特定的生态质量保障到低资源编程语言支持——始终围绕同一个核心:让 AI 真正可靠地服务于软件工程实践。
研究动机与愿景
大语言模型展现了令人瞩目的代码生成能力,但其输出往往缺乏真实部署所需的可靠性与安全性保障。 我的研究围绕一个核心问题展开:如何将 LLM 的生成能力与程序分析的严谨性结合,打造真正可信赖的软件工程工具?
具体来说,这意味着:在程序修复场景中,让 LLM 不仅能生成补丁,还能通过静态分析验证其正确性(如 HapRepair); 在安全场景中,系统性地评估和加固 LLM 的防御能力(如 MazeBreaker); 在智能体场景中,分析执行反馈到底何时值得使用(如 To Run or Not to Run),并用轻量静态结构提升代码定位稳定性(如 CodeAnchor)。
长远愿景是构建高效可靠的智能体(Agent)——它不仅能生成代码,更能自主地理解代码库结构、定位缺陷、评估变更影响、生成可验证的修复方案,最终实现从「AI 辅助编码」到「AI 自主工程」的跨越。
代表性工作
To Run or Not to Run
系统分析 LLM 程序修复智能体中的代码执行成本与收益,说明执行反馈应被当作有成本的资源,而不是默认动作。
CodeAnchor
研究轻量静态结构如何作为 deterministic anchors,提升代码智能体在真实仓库中的定位稳定性、复现性和导航效率。
Phantom Rendering Detection
识别和分析 UI 中不必要的渲染计算,帮助开发者发现隐藏的性能瓶颈,提升移动应用的流畅度。
MazeBreaker
提出多智能体强化学习框架,动态评估 LLM 安全防线的越狱漏洞,揭示现有防御机制的系统性弱点。
科研历程
我与华为(OpenHarmony 生态质量、UI 性能分析)、BTH 的 Wei Ma(LLM 代码理解与安全评测)以及 SMU 的 Zhensu Sun(LLM 编程智能体与执行效率)保持紧密合作。 迄今已在 ICSE、FSE、TOSEM、EMSE 等软件工程顶级会议和期刊发表论文,另有多篇工作在投。
研究方向(可点击展开)
科研之外
平时喜欢运动,是陈奕迅和张敬轩的忠实歌迷,也爱玩 NBA 2K、FIFA 等体育类电子游戏。 相信好的研究和好的生活一样,需要节奏感。
研究兴趣
🔬 研究方向
LLM 代码理解
研究大语言模型如何理解代码语法和语义,以改进代码分析任务。
- LLM 捕获的内容:语法、控制流、API 意图
- 评估方式:基准测试 + 探针分析 + 任务指标
智能代码定位
通过整合静态分析与基于 LLM 的 Agent 来提高缺陷定位准确性。
- 混合信号:静态事实(图/流)+ LLM 探索
- 目标:缩小搜索空间,加速调试
OpenHarmony 缺陷检测
为 OpenHarmony 生态系统扩展自动修复工具的缺陷检测能力。
- 基于 HapRepair 提升 OpenHarmony 应用质量
- 针对 ArkTS/HarmonyOS API 的缺陷检测规则
变更影响分析
利用代码知识图谱分析和预测代码变更在大型代码库中的影响。
- 建模超越文件的依赖:符号、调用、数据边
- 在合并/审查前预测连锁反应
代码库健康管理
探索在迭代开发过程中维护代码库质量的结构化方法。
- 及早检测冗余、死代码和风险漂移
- 使维护可度量、可自动化
提示词鲁棒性
解决模型更新和时间漂移导致的提示词退化问题。
- 检测模型更新后提示词的静默退化
- 自动化提示词适配以保持行为稳定
开源工具
HapRay
OpenHarmony 应用性能分析工具,用于检测 UI 中的 Phantom Rendering(幽灵渲染)问题。
HomeCheck
OpenHarmony 应用静态检查与自动修复工具,HapRepair 的核心模块,支持规则驱动的缺陷检测。
HomeTrans
Android → OpenHarmony 应用迁移工具,辅助开发者将安卓应用自动转换为鸿蒙生态。
ResearchClaw
⭐ 59AI 驱动的科研桌面应用,集文献管理、智能阅读笔记、Research Idea 生成于一体,支持 arXiv 论文发现、PDF AI 对话、语义搜索与引用网络。
已接收论文(PDF)
查看全部 →To Run or Not to Run: Analyzing the Cost-Effectiveness of Code Execution in LLM-Based Program Repair
ISSTA 2026
How Much Static Structure Do Code Agents Need? A Study of Deterministic Anchoring
ISSTA 2026
Phantom Rendering Detection: Identifying and Analyzing Unnecessary UI Computations
FSE 2026
MazeBreaker: Multi-Agent Reinforcement Learning for Dynamic Jailbreaking of LLM Security Defenses
ICSE 2026
HapRepair: Learn to Repair OpenHarmony Apps
FSE Industry 2025
Effective Fine-tuning for Low-resource Languages: A Case Study of Cangjie
EMSE 2026
Open-Source AI-based SE Tools: Opportunities and Challenges of Collaborative Software Learning
TOSEM 2024
Exploring Code Analysis: Zero-Shot Insights on Syntax and Semantics with LLMs
TOSEM 2026
合作
- HapRepair:OpenHarmony 应用修复
- Cangjie:低资源编程语言微调
- Phantom Rendering Detection:移动 UI 性能分析
- Phantom Rendering Detection:移动 UI 性能分析
- Phantom Rendering Detection:移动 UI 性能分析
- • OpenHarmony 应用修复
- • Phantom Rendering / UI 性能分析
- • Cangjie 低资源语言微调
衷心感谢 Wei Ma 老师带我走上科研道路。刚开始接触科研时,是他在选题、论文阅读、实验设计和写作上给予了持续而耐心的帮助;我的许多早期科研训练都离不开他的指导与支持。
- MazeBreaker:面向 LLM 越狱评测的多智能体强化学习框架
- HapRepair:面向 OpenHarmony 应用的 LLM 辅助修复
- Exploring Code Analysis:LLM 代码语法与语义理解评估
- Open-source AI-based SE Tools:AI4SE 开源生态综述
- • LLM 代码理解与语义评估
- • LLM 越狱与安全评测
- • AI4SE 开源生态与实证研究
也衷心感谢 Zhensu Sun。在我逐渐能够独立提出研究想法之后,他仍然在问题定义、实验设计、论文叙事和局限分析等方面给予了许多建设性的意见,帮助我学会把初步 idea 打磨成更完整、更扎实的研究工作。
- EAGER:在 LLM 生成代码时并行执行以隐藏延迟
- To Run or Not to Run:LLM 修复智能体中的执行成本收益分析
- • LLM 编程智能体
- • 执行成本与延迟优化
- • 代码生成与程序修复评估