我院刘轶教授课题组发表材料机器学习的特征工程方法评述

创建时间:  2025/08/29  荆瑞   浏览次数:   返回

近日,上海大学材料基因组工程研究院刘轶教授课题组在“Wiley Interdisciplinary Reviews: Computational Molecular Science”期刊(影响因子IF= 27)上受邀发表了综述论文“Integrating Materials Representations Into Feature Engineering in Machine Learning for Crystalline Materials: From Local to Global Chemistry-Structure Information Coupling”(《集成材料表征的晶体材料机器学习的特征工程:从局部到全局的化学-结构信息耦合》),引用信息为:Wiley Interdisciplinary Reviews: Computational Molecular Science, 2025; 15:e70044;https://doi.org/10.1002/wcms.70044(2025年8月11日首次上线)。博士生肖斌和唐宇超为共同第一作者,刘轶教授为通讯作者。

材料机器学习中特征工程的本质是对材料构建有效的数字化表征,对材料性质的机器学习预测精度起决定作用。目前文献报道的材料特征模型众多,但其具体形式和特点差异很大,尚缺乏从统一的视角进行横向评估。该综述对晶体材料的机器学习特征模型进行了系统的分类,重点强调了化学和结构信息的耦合。为了全面系统的评估各种特征模型的特点,综述首次采用了多维度的评价视角,包括图和非图网络结构表示、结构信息嵌入、化学-结构信息耦合、全局和局部结构特征、长程和短程作用描述、核函数和深度神经元网络的算法匹配、数据量要求、计算复杂性和可解释性等。在对典型的主流特征模型的多维度评价基础上,着重介绍了刘轶教授课题组近年来开发的“中心-环境”(Center Environment,简写CE)特征模型的构建方式、特点和应用案例。CE模型利用了预定义的注意力机制,将注意力从复杂机器学习算法内部的隐式细节转移到外部显示的描述物理核壳构型的特征模型。CE特征模型因此可以大幅度减少对数据量的需求,同时可以获得较高的精度和传递性,为开发面向材料小数据场景的高效准确的机器学习模型提供了通用的特征工程方法。该综述提出的多维度评价视角为机器学习特征模型应用时的合理选择和新特征模型的开发完善方向提供了理性依据。



下一条:我院孙强教授课题组搭建超高真空环境下材料自主实验平台

版权所有 © 上海大学   沪ICP备09014157   沪公网安备31009102000049号  地址:上海市宝山区上大路99号    邮编:200444   电话查询
 技术支持:上海大学信息化工作办公室   联系我们