师资
个人简介:
南方科技大学理学院统计与数据科学系助理教授,副研究员,博士生导师。都柏林大学博士毕业,师从Barry Smyth教授,历任西湖大学博士后,研究助理教授,伦敦大学学院研究员。他已发表学术论文40余篇,包括以第一作者发表11篇CCF-A类论文,总引用次数超过9,310次,GitHub项目累计获得超9,000次星标,代表作CycleResearcher被评为AI自主科学发现年度十大突破。他曾获得国家优秀自费留学生奖项(爱尔兰仅1位)及CCIS最佳论文提名奖,担任ICLR、ACL、EMNLP领域主席、IJCAI 2023高级程序委员会成员,主持和参与科研项目包括国家自然科学基金重点项目,科技部重点项目等。
研究方向:
大语言模型、强化学习、智能体。目前带领团队致力于在开放领域实现人工智能自主科学发现。相比于以往依据灵光一现的科研研究范式,团队正在致力于将具有颠覆性的科学发现过程转变为可量化的训练过程,最终实现可以系统化地增加计算资源来“规模化生产”创新成果。这种趋势正在推动科研范式的转变,为解决人类面临的重大科学挑战,开辟了一条全新且可加速的路径。重点探索“AI for Science”与“Science for AI”迭代更新的科研新范式。
工作经历:
2025 - 至今,南方科技大学,理学院,统计与数据科学系,助理教授
2023 - 2025,伦敦大学学院(UCL),AI Centre,博士后研究员
2024 - 2025,华为伦敦研究院,自然语言处理团队,研究员
2023 - 2024 西湖大学,研究助理教授
2021 - 2023,西湖大学,自然语言处理团队,博士后
教育经历:
2017 - 2021 都柏林大学,人工智能,博士
2016 - 2017 都柏林大学,数据科学,硕士研究生
项目经历:
1、国家自然科学基金重点项目 子课题负责人
2、科技部重点研发计划(港澳合作) 项目 子课题负责人
3、浙江省科技厅重点项目 子课题负责人
4、国家自然科学基金博士后面上项目 课题负责人
5、浙江省博士后科研启动经费 课题负责人
荣誉及奖励:
1、国家优秀自费留学生奖学金(爱尔兰1位,全球50位), 2021
2、CCIS 最佳论文提名, 2018
3、西湖大学优秀博士后代表 (1/180), 2023
4、西湖大学优秀博士后, 2022
5、都柏林大学优秀博士论文, 2021
代表性论文和专利 (详见谷歌学术):
2025:
[1] Constrain Alignment with Sparse Autoencoders ICML 2025 (CCF-A)
[2] Pre-Training a Graph Recurrent Network for Text Understanding TPAMI (CCF-A)
[3] CycleResearcher: Improving Automated Research via Automated Review ICLR 2025 (CCF-A)
[4] An Empirical Analysis of Uncertainty in Large Language Model Evaluations ICLR 2025 (CCF-A)
[5] DeepReview: Improving LLM-based Paper Review with Human-like Deep Thinking Process ACL 2025 (CCF-A)
[6] MMQA: Evaluating LLMs with Multi-Table Multi-Hop Complex Questions ICLR 2025 (CCF-A)
[7] CofCA: A STEP-WISE Counterfactual Multi-hop QA benchmark ICLR 2025 (CCF-A)
[8] Personality Alignment of Large Language Models ICLR 2025 (CCF-A)
[9] Human Simulacra: Benchmarking the Personification of Large Language Models ICLR 2025 (CCF-A)
[10] ThinkBench: Dynamic Out-of-Distribution Evaluation for Robust LLM Reasoning NeurIPS 2025 (CCF-A)
[11] Causal Sufficiency and Necessity Improves Chain-of-Thought Reasoning NeurIPS 2025 (CCF-A)
[12] ReMA: Learning to Meta-think for LLMs with Multi-Agent Reinforcement Learning NeurIPS 2025 (CCF-A)
[13] MCEval: A Dynamic Framework for Fair Multilingual Cultural Evaluation of LLMs TASLP (CCF-B)
[14] Direct Value Optimization: Improving Chain-of-Thought Reasoning in LLMs with Refined Values EMNLP 2025 (CCF-B)
