林智灏 (Zhihao Lin)

北航博士生 | 北航 SMAT 实验室

研究方向：AI for Software Engineering

ML 地基与 Agentic Code Model 学习台

面向代码基模与 SWE Agent 训练方向整理的交互式复习资料：覆盖 loss、Transformer、分布式训练、SFT/RL、verifier、execution feedback 和前沿模型报告。

打开学习台阅读前沿综述

复习主线

01先把训练曲线、loss、optimizer、显存讲稳。

02再读 GLM-5.2、DeepSeek-V4、IQuest-Coder 等技术报告。

03最后把 CodeAnchor / To Run 接到 agentic training 语言里。

关于我

我是北京航空航天大学博士生，隶属于 SMAT 实验室，导师为黎立教授，副导师为周鸣一。

教育背景

博

北京航空航天大学 · 硕博连读

2024 – 至今 · 计算机科学与技术 · SMAT 实验室

本

北京航空航天大学 · 软件工程

2019 – 2024 · 软件学院

研究聚焦于AI for Software Engineering (AI4SE)，将大语言模型（LLM）与程序分析技术结合，构建更可靠、更安全的软件工程智能工具。我的工作横跨多个子方向——从自动化程序修复到 LLM 安全评估，从领域特定的生态质量保障到低资源编程语言支持——始终围绕同一个核心：让 AI 真正可靠地服务于软件工程实践。

研究动机与愿景

大语言模型展现了令人瞩目的代码生成能力，但其输出往往缺乏真实部署所需的可靠性与安全性保障。我的研究围绕一个核心问题展开：如何将 LLM 的生成能力与程序分析的严谨性结合，打造真正可信赖的软件工程工具？

具体来说，这意味着：在程序修复场景中，让 LLM 不仅能生成补丁，还能通过静态分析验证其正确性（如 HapRepair）；在安全场景中，系统性地评估和加固 LLM 的防御能力（如 MazeBreaker）；在智能体场景中，分析执行反馈到底何时值得使用（如 To Run or Not to Run），并用轻量静态结构提升代码定位稳定性（如 CodeAnchor）。

长远愿景是构建高效可靠的智能体（Agent）——它不仅能生成代码，更能自主地理解代码库结构、定位缺陷、评估变更影响、生成可验证的修复方案，最终实现从「AI 辅助编码」到「AI 自主工程」的跨越。

代表性工作

ISSTA 2026程序修复

To Run or Not to Run

系统分析 LLM 程序修复智能体中的代码执行成本与收益，说明执行反馈应被当作有成本的资源，而不是默认动作。

ISSTA 2026Code Agent

CodeAnchor

研究轻量静态结构如何作为 deterministic anchors，提升代码智能体在真实仓库中的定位稳定性、复现性和导航效率。

FSE 2026性能分析

Phantom Rendering Detection

识别和分析 UI 中不必要的渲染计算，帮助开发者发现隐藏的性能瓶颈，提升移动应用的流畅度。

ICSE 2026LLM 安全

MazeBreaker

提出多智能体强化学习框架，动态评估 LLM 安全防线的越狱漏洞，揭示现有防御机制的系统性弱点。

科研历程

2023 年底

大四期间开始接触科研，加入 SMAT 实验室

2023.11

第一篇论文投稿 — 开源 AI 软件工程工具的机遇与挑战，系统梳理了 AI4SE 领域的开源生态现状

2024

第一篇论文被 TOSEM 接收 — Open-Source AI-based SE Tools，这是一篇覆盖 100+ 开源工具的全景式综述

2024.09

本科毕业，正式开始硕博连读；同时开启与华为、BTH 和 SMU 的合作研究

2025.03

HapRepair 被 FSE Industry 2025 接收 — 面向 OpenHarmony 生态的自动修复，实现从论文到工程落地

2025.06

MazeBreaker 被 ICSE 2026 接收 — 多智能体强化学习越狱框架，向 LLM 安全方向发力

2025–2026

研究全面铺开：Phantom Rendering（FSE 2026）、Cangjie 微调（EMSE 2026），以及多个在投稿件涵盖代码理解、Agent 推理、变更影响分析等方向

我与华为（OpenHarmony 生态质量、UI 性能分析）、BTH 的 Wei Ma（LLM 代码理解与安全评测）以及 SMU 的 Zhensu Sun（LLM 编程智能体与执行效率）保持紧密合作。迄今已在 ICSE、FSE、TOSEM、EMSE 等软件工程顶级会议和期刊发表论文，另有多篇工作在投。

研究方向（可点击展开）

科研之外

平时喜欢运动，是陈奕迅和张敬轩的忠实歌迷，也爱玩 NBA 2K、FIFA 等体育类电子游戏。相信好的研究和好的生活一样，需要节奏感。

研究兴趣

程序修复LLM 安全静态分析代码生成OpenHarmony越狱防御知识图谱提示工程低资源语言

🔬 研究方向

代码智能

LLM 代码理解

研究大语言模型如何理解代码语法和语义，以改进代码分析任务。

LLM 捕获的内容：语法、控制流、API 意图
评估方式：基准测试 + 探针分析 + 任务指标

相关发表

Exploring Code Analysis (TOSEM 2026)CodeAnchor (ISSTA 2026)

3 个方法点击查看详情 →

故障定位

智能代码定位

通过整合静态分析与基于 LLM 的 Agent 来提高缺陷定位准确性。

混合信号：静态事实（图/流）+ LLM 探索
目标：缩小搜索空间，加速调试

相关发表

CodeAnchor (ISSTA 2026)To Run or Not to Run (ISSTA 2026)

3 个方法点击查看详情 →

程序修复期刊扩展

OpenHarmony 缺陷检测

为 OpenHarmony 生态系统扩展自动修复工具的缺陷检测能力。

基于 HapRepair 提升 OpenHarmony 应用质量
针对 ArkTS/HarmonyOS API 的缺陷检测规则

相关发表

HapRepair (FSE Industry 2025)Phantom Rendering Detection (FSE 2026)

3 个方法点击查看详情 →

影响分析

变更影响分析

利用代码知识图谱分析和预测代码变更在大型代码库中的影响。

建模超越文件的依赖：符号、调用、数据边
在合并/审查前预测连锁反应

相关发表

CodeAnchor (ISSTA 2026)Open-Source AI-based SE Tools (TOSEM 2024)

3 个方法点击查看详情 →

代码质量

代码库健康管理

探索在迭代开发过程中维护代码库质量的结构化方法。

及早检测冗余、死代码和风险漂移
使维护可度量、可自动化

相关发表

To Run or Not to Run (ISSTA 2026)Open-Source AI-based SE Tools (TOSEM 2024)

3 个方法点击查看详情 →

提示词工程

提示词鲁棒性

解决模型更新和时间漂移导致的提示词退化问题。

检测模型更新后提示词的静默退化
自动化提示词适配以保持行为稳定

相关发表

MazeBreaker (ICSE 2026)

3 个方法点击查看详情 →

开源工具

🔍

HapRay

OpenHarmony 应用性能分析工具，用于检测 UI 中的 Phantom Rendering（幽灵渲染）问题。

FSE 2026GitHub

🔧

HomeCheck

OpenHarmony 应用静态检查与自动修复工具，HapRepair 的核心模块，支持规则驱动的缺陷检测。

FSE Industry 2025GitCode

🔄

HomeTrans

Android → OpenHarmony 应用迁移工具，辅助开发者将安卓应用自动转换为鸿蒙生态。

迁移工具GitCode

📚

ResearchClaw

⭐ 59

AI 驱动的科研桌面应用，集文献管理、智能阅读笔记、Research Idea 生成于一体，支持 arXiv 论文发现、PDF AI 对话、语义搜索与引用网络。

Electron + TypeScriptGitHub

已接收论文（PDF）

查看全部 →

To Run or Not to Run: Analyzing the Cost-Effectiveness of Code Execution in LLM-Based Program Repair

ISSTA 2026

PDF

How Much Static Structure Do Code Agents Need? A Study of Deterministic Anchoring

ISSTA 2026

PDF

Phantom Rendering Detection: Identifying and Analyzing Unnecessary UI Computations

FSE 2026

PDF

MazeBreaker: Multi-Agent Reinforcement Learning for Dynamic Jailbreaking of LLM Security Defenses

ICSE 2026

PDF

HapRepair: Learn to Repair OpenHarmony Apps

FSE Industry 2025

PDF

Effective Fine-tuning for Low-resource Languages: A Case Study of Cangjie

EMSE 2026

PDF

Open-Source AI-based SE Tools: Opportunities and Challenges of Collaborative Software Learning

TOSEM 2024

PDF

Exploring Code Analysis: Zero-Shot Insights on Syntax and Semantics with LLMs

TOSEM 2026

PDF

合作

Huawei

OpenHarmony / 移动应用质量

合作人员与工作

Chi Chen

HapRepair：OpenHarmony 应用修复
Cangjie：低资源编程语言微调

Han Hu

Phantom Rendering Detection：移动 UI 性能分析

Bo Sun

Phantom Rendering Detection：移动 UI 性能分析

Gang Fan

Phantom Rendering Detection：移动 UI 性能分析

合作主题

• OpenHarmony 应用修复
• Phantom Rendering / UI 性能分析
• Cangjie 低资源语言微调

Blekinge Institute of Technology (BTH)

LLM 代码理解 / 安全评测

合作人员与工作

Wei Ma

瑞典布莱金厄理工学院（BTH）助理高级讲师

BTH Google Scholar

衷心感谢 Wei Ma 老师带我走上科研道路。刚开始接触科研时，是他在选题、论文阅读、实验设计和写作上给予了持续而耐心的帮助；我的许多早期科研训练都离不开他的指导与支持。

MazeBreaker：面向 LLM 越狱评测的多智能体强化学习框架
HapRepair：面向 OpenHarmony 应用的 LLM 辅助修复
Exploring Code Analysis：LLM 代码语法与语义理解评估
Open-source AI-based SE Tools：AI4SE 开源生态综述

合作主题

• LLM 代码理解与语义评估
• LLM 越狱与安全评测
• AI4SE 开源生态与实证研究

Singapore Management University (SMU)

LLM Agent / 执行效率

合作人员与工作

Zhensu Sun

新加坡管理大学（SMU）博士候选人

Homepage Google Scholar

也衷心感谢 Zhensu Sun。在我逐渐能够独立提出研究想法之后，他仍然在问题定义、实验设计、论文叙事和局限分析等方面给予了许多建设性的意见，帮助我学会把初步 idea 打磨成更完整、更扎实的研究工作。

EAGER：在 LLM 生成代码时并行执行以隐藏延迟
To Run or Not to Run：LLM 修复智能体中的执行成本收益分析

合作主题

• LLM 编程智能体
• 执行成本与延迟优化
• 代码生成与程序修复评估

林智灏 (Zhihao Lin)

最新动态

ML 地基与 Agentic Code Model 学习台

关于我

教育背景

研究动机与愿景

代表性工作

To Run or Not to Run

CodeAnchor

Phantom Rendering Detection

MazeBreaker

科研历程

研究方向（可点击展开）

自动化程序修复

LLM 安全与优化

领域软件工程

科研之外

研究兴趣

🔬 研究方向

LLM 代码理解

智能代码定位

OpenHarmony 缺陷检测

变更影响分析

代码库健康管理

提示词鲁棒性

开源工具

HapRay

HomeCheck

HomeTrans

ResearchClaw

已接收论文（PDF）

To Run or Not to Run: Analyzing the Cost-Effectiveness of Code Execution in LLM-Based Program Repair

How Much Static Structure Do Code Agents Need? A Study of Deterministic Anchoring

Phantom Rendering Detection: Identifying and Analyzing Unnecessary UI Computations

MazeBreaker: Multi-Agent Reinforcement Learning for Dynamic Jailbreaking of LLM Security Defenses

HapRepair: Learn to Repair OpenHarmony Apps

Effective Fine-tuning for Low-resource Languages: A Case Study of Cangjie

Open-Source AI-based SE Tools: Opportunities and Challenges of Collaborative Software Learning

Exploring Code Analysis: Zero-Shot Insights on Syntax and Semantics with LLMs

合作