报告题目:数据驱动材料设计的局限与潜力
报告人:李康铭
主持人(邀请人):蒋青、陈志文
报告时间:2025年6月19日 15:00—17:00
报告地点:机械材料馆219
主办单位:汽车材料教育部重点实验室,体育投注
摘要:
数据驱动的高通量计算与自动化实验正以颠覆传统试错或经验驱动的模式,为材料科学带来深刻变革。在这一范式中,人工智能(AI)被视为实现自主发现的核心手段,然而对其应用局限性的系统性研究仍较匮乏。本报告将结合近期案例,揭示当前AI模型与材料数据库的限制,并探讨AI在若干挑战性任务中的潜力与启示。
首先,以 Materials Project 数据库为例,我们发现在旧版数据库上基准测试得分突出的预训练模型,在最新版新增样本上的预测精度大幅下降,说明现有基准测试无法准确评估模型的真实泛化能力。其次,通过对大型材料数据集的冗余度分析发现,高达 95%的数据可以在不影响预测精度的情况下被剔除,提示当前数据采集方式效率不足;此外,考察了数据规模对模型在新领域泛化的影响,结果表明扩大数据量并不能显著提升模型的分布外预测能力,甚至可能引入负面效应,与“数据越多、模型越好”的常见认知相悖。第三,针对 AI 加速材料设计的潜力,我们以高熵合金为研究对象,发现仅在相对简单体系上训练的模型依然能够准确预测复杂无序高熵合金的性能,这一“意外之效”不仅扩展了模型适用范围,也为高熵材料的探索提供了新路径。最后,通过对多个大型数据集的系统性分析,我们观察到现有模型往往具备超越训练数据化学或结构类别的分布外泛化能力,暗示其应用领域可能远超直觉所及。
综上所述,AI 在材料设计与发现中既存在出人意料的局限,也蕴含显著的潜力。这些发现表明,我们对AI应用的有效性边界尚无充分认识。深入理解并克服这些局限,将是实现真正高效自主材料发现的关键所在。
报告人简介:
李康铭,沙特阿卜杜拉国王科技大学(KAUST)理体育投注助理教授,博士生导师。2021年博士毕业于法国巴黎萨克雷大学,博士期间的多尺度建模工作获法国冶金与材料学会Dalla Torre奖章。此后在加拿大多伦多大学材料体育投注从事博士后研究,2024年起在多伦多大学加速联盟担任研究科学家,并于近期加入阿卜杜拉国王科技大学。研究方向聚焦人工智能与材料科学的交叉,致力于AI在材料研发中的方法开发与应用,已在Nature Communications、Matter、npj Computational Materials、Acta Materialia等期刊以第一作者发表论文十余篇。