金属学报, 2025, 61(4): 541-560 DOI: 10.11900/0412.1961.2024.00355

综述

综述:合金设计中物理模型与人工智能的集成与发展

王晨充, 徐伟,

东北大学 数字钢铁全国重点实验室 沈阳 110819

Overview: Integration and Development of Physical Models and Artificial Intelligence in Alloy Design

WANG Chenchong, XU Wei,

State Key Laboratory of Digital Steel, Northeastern University, Shenyang 110819, China

通讯作者: 徐 伟,xuwei@ral.neu.edu.cn,主要从事金属材料基因工程研究

责任编辑: 肖素红

收稿日期: 2024-10-22   修回日期: 2025-01-22  

基金资助: 国家重点研发计划项目(2023YFB3712403)
国家自然科学基金项目(U22A20106, 52311530082)

Corresponding authors: XU Wei, professor, Tel:(024)83680246, E-mail:xuwei@ral.neu.edu.cn

Received: 2024-10-22   Revised: 2025-01-22  

Fund supported: National Key Research and Development Program of China(2023YFB3712403)
National Natural Science Foundation of China(U22A20106, 52311530082)

作者简介 About authors

王晨充,男,1988年生,副教授,博士

摘要

随着第四科学范式数据驱动方法的兴起,其在合金设计领域中对物理模型驱动的第三科学范式构成了显著的冲击。但2种范式均无法在合金设计,尤其是宏观力学性能设计层面打破模型准确性与可解释性间的互斥关系,因而无法满足材料基因工程领域,尤其是针对块体金属结构材料设计的高效率、高合理性要求,这一困境也催生了第五范式AI4Sci在该领域的兴起。本文综述了物理冶金原理指导人工智能方法体系下的诸多案例,从数值数据指导、图像数据指导和机制指导3个层次系统阐明如何进行物理模型/机制与人工智能的深度结合,以打破合金设计过程中模型准确性与可解释性间的互斥关系,从而深刻揭示合金设计过程中多尺度物理模型、人工智能及AI4Sci三大范式的理论本质与优劣势,并在突破跨尺度建模困境、发展材料学大模型技术等方向上,给予各科学范式在合金设计中未来发展的研究思路与技术方法指导。

关键词: 合金设计; 材料基因工程; 人工智能; 跨尺度建模; AI4Sci

Abstract

With the rise of data-driven methods as the fourth scientific paradigm, their impact on the third paradigm—physical model-driven approaches—has been significant in the field of alloy design. However, neither paradigm can overcome the trade-off between model accuracy and interpretability, particularly in mechanical performance design. As a consequence, they fail to meet the efficiency and rationality requirements necessary for alloy development within Material Genome Engineering, especially for metal structural materials. This challenge has led to the emergence of the fifth paradigm, AI4Sci, in alloy design. This article provides an overview of various cases employing the physical metallurgy-guided artificial intelligence method system. It systematically explains how to integrate physical models and mechanisms with artificial intelligence at three levels: numerical data guidance, image data guidance, and mechanism guidance. This approach aims to resolve the inherent trade-off between accuracy and interpretability in alloy design. In addition, it explores the theoretical foundations, advantages, and limitations of three paradigms—multi-scale physical models, artificial intelligence, and AI4Sci—within the field. For cross-scale modeling and materials science large models, this article offers insights into conceptual frameworks and technical methodologies for the future development of each scientific paradigm in alloy design.

Keywords: alloy design; material genome engineering; artificial intelligence; cross scale modeling; AI4Sci

PDF (2632KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

王晨充, 徐伟. 综述:合金设计中物理模型与人工智能的集成与发展[J]. 金属学报, 2025, 61(4): 541-560 DOI:10.11900/0412.1961.2024.00355

WANG Chenchong, XU Wei. Overview: Integration and Development of Physical Models and Artificial Intelligence in Alloy Design[J]. Acta Metallurgica Sinica, 2025, 61(4): 541-560 DOI:10.11900/0412.1961.2024.00355

合金设计是材料学领域永恒的热点话题,而随着大数据与人工智能时代的到来,基于数据驱动理念的材料基因工程更受到了业内的广泛关注与认可[1,2]。数据驱动式的研究方法作为科学发展的“第四范式”[3],其变革性的研究理念对“第三范式”的物理模型与理论计算带来了巨大的冲击[4,5]。首先,数据驱动(以人工智能为主)的主要优势在于无需先建立基于物理机制的本构方程,再进行模拟计算,因此其理论上可以规避金属结构材料中大量复杂难明的多尺度机制问题,直接形成可满足合金设计基本要求的成分、工艺与目标性能间的高精度计算方法,从而指导设计。但同时,上述优势也为数据驱动方法带来了相应的弊端,即众所周知的可解释性问题,一个“黑箱”式的模型会为合金设计过程带来诸多不确定的风险性。因此,目前基于集成计算的物理模型驱动理念和基于人工智能的数据驱动理念是材料基因工程领域中2个偏向于并行式关系的技术路线[5]。基于数据驱动理念的研究工作经常以物理模型为对比,以体现其模型的计算精度与计算效率优势[6],而基于物理模型驱动理念的工作则以人工智能模型为对比,以体现其在可解释性与合理性方面的优势[7]。上述争论也间接驱动了近年来基于AI4Sci理念的“第五范式”在合金设计领域的发展[6]。因此,本文的主旨是通过对目前材料基因工程领域部分代表性工作的综述,在合金设计领域范围内,阐明分别代表第三、四、五科学范式的物理模型、人工智能与AI4Sci之间的协同、替代和发展关系,并为各方向提出可供参考的未来研究思路与技术方法指导。需要特别强调的是,本文并非在全科学领域探讨3个科学范式的优劣性。本文所有讨论仅局限在合金设计范畴,以关注宏观力学性能的块体金属结构材料为主,不涉及陶瓷、半导体、无机非等非合金功能材料设计领域,更不涉及非合金设计的更广泛研究领域。

首先,物理模型与人工智能间的关系,其本质可归结于上述提到的模型“准确性”与“可解释性”之间的冲突,这种冲突一直存在并被广泛认知。由于本文后续的大多数论述会围绕“准确性”与“可解释性”展开,所以首先需要对这2个名词在本文中的定义与量化评价方法加以明确。“准确性”是模拟计算中的标准名词,在本文中是指模型对合金设计中关注的目标性能的预测准确性,可通过对比模型预测值与实验测定的性能实际值来量化计算(例如拟和优度(R2)或平均绝对误差(MAE))。“可解释性”一般在人工智能领域是指模型与人们普适性认知的客观规律相吻合,因而其计算过程或结果具有可被常人理解的能力。其常见的外在表现形式是模型不但对已有的训练样本适用,更可普适性反映更多新样本的规律与通用机制,但其目前并没有公认的标准量化评价方法,本文主要使用“域外扩展能力”(out-of-distribution generalization)来量化评价模型的“可解释性”,即认为2者之间是互为充要条件的关系。这一观点也在人工智能的“稳定学习”研究[7]中被证明,即一个在物理机制上更合理的模型必然促使其域外扩展能力增强,同时,一个模型的域外扩展能力变强,则也可以反推出该模型一定是找到了与现实更加吻合的物理机制,2者在本质上是一个概念。值得注意的是,“稳定学习”作为一个近年来新发展的理论方法,其通用性还有待进一步考证。但由于“可解释性”本身是一个极难量化的抽象概念,因此在缺少其他更为合理、直观的量化方式前提下,本文选择使用模型的域外扩展能力作为“可解释性”的量化评判标准。关于模型“准确性”与“可解释性”之间的冲突,Zhong等[8]已提及了类似的问题:人工智能模型往往存在准确性与可解释性之间的互斥关系(图1a),例如绝大多数深度学习模型有极强的数据拟合能力,可表现出高准确性,但其是典型的“黑箱”模型,可解释性低;而决策树等具有可解释性的人工智能模型的数据拟合能力要远低于深度学习网络,即模型准确性上存在劣势。这一互斥关系进一步扩展至计算材料宏观力学性能的多尺度物理模型中也依然适用,大多数长链条集成或宏观性能预测的物理模型具有强可解释性,但其数据拟合能力与准确度往往低于人工智能模型,这一观点已被诸多案例所证实[1,4,9]

图1

图1   模型可解释性与准确性的互斥关系本质

Fig.1   Essential nature of the mutually exclusive relationship between model interpretability and accuracy

(a) trade-off between model accuracy and interpretability (AI—artificial intelligence)

(b) high degrees of freedom in equations

(c) low degrees of freedom in equations

(d) high degrees of freedom in equations constrained by physics


综上可知,合金设计实质上需要准确性与域外扩展能力2者兼得。因此,为了突破上述互斥关系问题,一个很自然的理念就逐步形成了:需要将物理模型与人工智能模型相结合,实现物理模型可解释性/域外扩展能力与人工智能模型准确性的优势互补,这就是近年来被广泛提及的物理冶金原理指导人工智能方法理念[10,11]

1 物理冶金原理指导人工智能方法的数学理论基础

显然,物理冶金原理指导人工智能方法并非针对某一特定合金体系的独特技术,而是与物理模型、人工智能一样的通用性方法论,理论上可以应用于任何合金设计过程。因此,本小节对于通用性数学理论基础的论述是本文的根基所在,其不仅可以使合金设计领域的研究者从更本质的角度理解物理冶金原理指导人工智能方法的普适性价值与优势,更可以深入地阐明诸多值得深思的问题,例如:如果人工智能或多尺度物理模型不相互交叉融合,他们各自的发展是否能在合金设计领域打破域外扩展能力与准确性的互斥关系?物理模型与人工智能模型的结合就一定会是优势互补,不可能产生一加一小于二的效果吗?

首先,针对人工智能方法,以最为常见的人工神经网络为例,理论上其一个模型中包含的神经元数量可以进行无限制的扩充,神经元间可选择的组合模式也基本处于无限制的状态,这种高自由度的计算方式自然可以为其带来强大的数据拟合能力,从而保证其对已有数据的高吻合性,但其带来的弊端即是在域外扩展时面临的高度不确定性问题。如图1b所示,针对同一个数据集,完全不受方程形式约束的高自由度人工智能算法完全可以通过训练获得2个不一样的模型,如图1b中蓝色线和黄色线所示。2个模型均有很好的准确性,而且也均无明显的过拟合现象,但其域外扩展方向可以完全不同,这就是人工智能领域经典的认知不确定性问题[12,13]。而针对此问题,人工智能领域相关学者也在持续地探索解决手段。例如:只需要在域外空间补充少量的数据点,这些数据点本身就可以成为模型扩展方向的判别性约束,无法与补充数据吻合的模型自然代表其不具备域外扩展能力,从而被摒弃。这种思想就是被大量应用于功能及化学材料设计中的主动学习算法[14,15]。该方法目前在合金设计中也有成功案例[16],但针对合金设计,通过补充数据提升模型域外扩展能力的方法也有一定的风险性,其成功与否取决于2个核心因素:(1) 补充的数据本身是否准确;(2) 新数据所在空间位置是否具有足够代表性。针对疲劳、蠕变等本身就有较大实验误差的性能来说,每补充一个准确的数据点都是一个费时、费力的工程。而对于大多数多组元合金设计来说,需补充的数据点是否具有代表性往往也很难抉择。而针对此问题,主动学习算法中也常使用不确定性估计算法[17,18]来进行数据补充方向的合理决策,最具代表性的材料学应用范例是Bayesian不确定性计算方法[19]。该方法已在钢铁材料[20,21]、钛合金[22]、复合材料[23]、锂电池[24]等多种材料体系中得到广泛应用。当然,不确定性算法也可以脱离主动学习框架,在合金设计过程中成为独立的数据处理方式,受篇幅所限本文未做介绍。但无论是主动学习还是不确定性估算方法,都属于一种相对冗长的先发现问题再解决问题的循环迭代流程,其通过评估模型的外推能力,施行“亡羊补牢”式的逐步改进处理,一旦这种补救的循环次数过多,依然会导致时间及资金成本问题。因此,更一劳永逸的思路是尝试直接开发本身就具有可解释性的机器学习模型,其自然就会具有良好的域外扩展能力。

实质上,可解释性机器学习(XAI)[8,25,26]本身就是人工智能领域中的一个重要研究分支,但是人工智能策略的基础思路就是基于数据的算法训练,将统计学理论作为人工智能的数学根基,其本身也是一个统计大量数据并进行综合分析的学科门类。因此,目前大多数可解释性机器学习算法的开发都是通过进一步扩展算法构架,以形成更接近人类复杂思考过程的计算策略,而算法构架扩展所带来的问题就是需要更大量的数据进行模型训练,甚至很多算法在开发伊始的基本假设就是在数据无限多的理想空间中应用,因此这些大模型的应用背景也自然更多面向交通、医疗、财政等大数据环境[26]。例如目前被广为使用的Transformer构架[27],与传统循环神经网络(RNN)相比引入了更符合人类在理解文本内容时全局思考模式的自注意力机制,提升了模型性能,但其所需的训练数据量也相应提升了。然而在合金设计领域,面对大量长时服役或复杂工况的性能设计需求,往往高质量数据的获取极为困难[28]。受到合金设计领域小样本困境的限制,目前尚很难见到人工智能领域可解释性机器学习大模型在此方面的成功应用。当然,人工智能领域也经常使用多种降维处理手段来实现小样本条件下的模型准确性提升,但这种处理方式同样是以牺牲物理可解释性为代价的。图2[29~32]量化对比了常见的多种降维处理方式对模型性能的提升作用。可以看到,主成分分析(principal components analysis,PCA)算法[29,30]作为最为常用的降维处理方式,可以使模型预测精度得到显著提升,提升效果可接近20%[30]。同样,其他降维处理方式(例如t-随机邻近嵌入(t-distributed stochastic neighbor embedding,t-SNE)[31]、等距映射(Isometric Mapping,ISOMAP)[32]等)也可使模型得到不同程度的精度提升,但获得的新特征均为原始特征经过数学处理后的无物理意义特征,会不同程度降低模型的可解释性与域外扩展能力。综上,前述内容充分论述了人工智能算法因其高自由度属性而带来的域外扩展问题,而该问题又受到合金设计领域小样本特点的进一步限制,很难在统计数学自身的理论框架内寻求突破。

图2

图2   降维处理方法对模型准确性的量化影响[29~32]

Fig.2   Quantitative effect of dimensionality reduction methods on model accuracy[29-32] (PCA—principal components analysis, KPCA—kernel based principal component analysis, t-SNE—t-distributed stochastic neighbor embedding, ISOMAP—Isometric Mapping)


物理模型(本文中的物理模型不涉及人工智能概念,其与材料学领域普遍认知的物理模型定义一致,是指基于物理机制的数学公式模型)则与人工智能模型截然相反,其数学理论基础是具有更强固定性的微积分学,如图1c所示,由于各物理场适用的偏微分方程组直接固定了计算的确切方程形式,因此物理模型一般会具有非常稳定的域外扩展能力,不会遇到人工智能算法所涉及的域外不确定性问题。但这种低自由度的算法稳定有余、变通不足,一旦其面对一些细小的机制变化问题,偏离了其预定理想的方程形式,物理模型就会出现明显的准确性问题。例如图1c中蓝色线所代表的模型为典型的ln型方程形式,当黄色箭头所标注的数据点明显偏离ln型曲线的行进路径时,则该模型无法与之吻合。因此,大多数物理模型,尤其是与力学性能预测相关的本构模型(例如Hall-Petch公式[33,34]),在合金设计过程中往往只能给予半定量甚至定性化的指导[35,36]。然而从纯数学的角度看,突破准确性问题比解决域外扩展问题要相对简单,因为只要赋予模型更高的拟合自由度,则自然可以提升对已知数据的吻合性。而物理模型领域常用的提高模型自由度的方法就是“模型修正”,这一类型的工作不胜枚举[34,35],但问题是多数“模型修正”类工作往往只依据一个独立研究体系中的少量数据,研究者很少会对这种优化是否适用于其他体系进行广泛验证,因此这种修正并不是为模型引入了一个普适性的通用机制,而是为了提升模型对已知数据的吻合性,加入了一个不具备普适性扩展价值的拟合项。这其实与人工智能方法中不包含物理机制的纯数据拟合没有本质的区别,甚至相比之下人工智能方法可能更具价值,因为毕竟人工智能拟合得到的模型是基于更大量数据的。而更可怕的是,现今合金材料的内部机制越来越复杂,针对一个复杂性能,尤其是宏观力学性能的预测,往往会使用链式串联结构的多尺度物理模型[35]。可以想象,多个上述经过修正的物理模型串联到一起后,各模型的域外扩展误差逐层累积,其会对模型最终的域外扩展能力造成灾难性的削弱,导致其根本无法应用于实际合金设计。基于上述限制,目前绝大多数集成式物理模型实际上只是“局部多尺度”模型,而并不能贯通成为真正意义上的“全局跨尺度”模型。由此可见,物理模型作为一种低自由度算法,很难在其固定式偏微分方程的理论根基框架下,在合金设计领域打破其域外扩展能力与准确性的互斥关系。

综上,域外扩展能力与准确性的互斥关系本质上是受模型的拟合自由度决定的,多数普适性物理模型机制明确,所以方程与参数均固定,基本无自由度,所以拟合能力差;人工智能自由度高,就有更强的数据拟合能力,但其可解释性就不足。而算法自由度的高低实际上是受其使用的本质数学理论决定的,统计数学算法通常自由度高,需大量数据拟合,而偏微分方程则形式固定。因此,物理冶金原理指导人工智能方法的数学理论本质就是综合统计学与微积分各自的优势,建立一个受固定偏微分方程形式约束的统计学算法,如图1d所示,模型建立过程中依然保持统计学算法对数据的自由拟合能力,但要规定一个稳定的方程形式来约束其拟合的宏观方向,在这一综合算法体系中,高自由度的统计学算法用以补足偏微分方程的数据拟合能力,以应对偏离主体物理机制的其他扰动因素,而低自由度的偏微分方程则给予统计学算法一个弱约束,提示统计学算法正确的训练方向,这种提示性的弱约束不但可以帮助模型规避在域外扩展中的不确定性问题,而且可以大幅减少模型训练所需的数据量,从而更适应合金设计领域面临的小样本特点。这个思想实质上比较接近于人工智能中常用的“正则化”处理方法[36],通过向人工智能模型中引入一个函数项,来约束模型的复杂度,从而避免过拟合及域外泛化能力差的问题,因此物理冶金原理指导人工智能方法其实也可以变为更华丽的名字,例如“物理机制正则化”方法。

由此可见,物理冶金原理指导人工智能方法的核心为“指导”,而这个“指导”背后的数学理论基础是物理方程/机制提供的“弱约束”。只有物理模型/机制在人工智能训练中起到了这种“弱约束”的作用,才可达到打破域外扩展能力与准确性互斥关系的效果。反之,在与人工智能的结合过程中,如果物理模型/机制并不起到这种“弱约束”的“指导”作用,即使模型建立过程中同时用到了物理模型与人工智能算法,其也只能起到一加一等于二或者小于二的作用,无法打破上述互斥关系。例如,目前合金设计领域有大量的人工智能建模工作使用物理模型计算提供数据标签,包括通过物理模型计算合金成分、工艺方案所对应的性能值,再通过人工智能直接学习这些“成分-工艺-性能”间的数学关联并指导合金设计等。此类型的工作虽然也有物理模型与人工智能模型的共同参与,但实际上2者的结合并不紧密,物理模型在提供数据时依然要独立面对机制扰动带来的准确性问题,人工智能也依然独立进行数据学习,难以获得域外扩展过程中的约束指导。因此,虽然该类型工作目前已在合金设计领域形成系统而全面的研究进展[1,2],但本文后续并不以该类型工作为论述重点,而是主要聚焦于物理冶金原理指导人工智能方法分别在数值数据指导、图像数据指导和机制指导3个层次的应用示范案例。

图3系统展现了真正意义上“跨尺度”的3个层次,以及各层次之间的逐步深化关系:随着物理冶金原理引入程度的不断加深,整个模型系统所使用的人工智能策略优化手段也在不断提升,模型训练所需的数据量不断减少。在这一框架下,物理模型/机理与人工智能策略间呈现协同深化的关系,因此该方法更易打破模型准确性与域外扩展能力的互斥关系。本文将通过对这3个层次的系统性论述,充分探讨物理模型与人工智能模型的深度结合方式、各种技术方案的优劣势与其本质原因。

图3

图3   物理冶金原理指导人工智能的跨尺度体系

Fig.3   Cross scale system of physical metallurgy-guided artificial intelligence (ML—machine learning, Vm—mole fraction, UTS—ultimate tensile strength, UE—uniform elongation, BC—band contrast, KAM—kernel average misorientation, CAM—Class Activation Mapping)


2 跨尺度数值信息指导人工智能

物理冶金原理指导人工智能方法一词的正式提出始于2019年[10],彼时图像相关的人工智能算法尚未在合金设计领域受到广泛的关注,绝大多数工作仍集中于对纯数值型数据的分析。由于在基于材料基因理念的合金设计方面,热力学与相图一直起到至关重要的核心作用,因此最早的物理冶金原理指导人工智能方法案例也是使用热力学物理模型为核心,进行与人工智能算法的融合。基于上述原因,本小节的论述以热力学数值信息指导人工智能的案例为主体,并延伸至更多尺度下的物理数值信息层面。

2.1 热力学信息指导人工智能的固态相变预测

已有的合金设计工作均提出:合金设计可以不以最终性能为设计目标,而以组织特征为目标的合金设计可以减少设计过程中的模型建立流程,从而提高设计效率与稳定性[37]。但实际上,目前大多数合金设计工作仍然是以最终性能为直接设计目标的,甚至部分工作在数据驱动理念的指引下直接跳过了对组织因素的考虑[38]。而本小节的论述依然以固态相变预测为起始,并不完全因为多数材料方向学者高度认可相变在合金设计中所起到的重要作用,更是因为固态相变作为金属材料领域数据最为全面的方向之一,可以更充分地展示与证实上述对物理冶金原理指导人工智能方法理论基础论述的正确性,以及该方法对模型准确性和域外扩展能力的同时提升作用。

首先,在固态相变领域,热力学理论模型虽然可以基本解决奥氏体相变等扩散型相变的温度点预测问题,但对于切变型马氏体相变开始温度(Ms)的普适性预测一直是领域内的难点问题,而Ms的预测对于淬火-配分(Q&P)钢等高性能钢种的设计至关重要。实际上多年来已经积累了大量的Ms预测模型[39],包括热动力学机理模型[40]、经验公式[41]以及人工智能模型[42]等。图4[43]充分展示了各类型模型准确性与域外扩展能力间的关系。对于已知的511条数据的拟合准确性方面,具有物理可解释性的热力学算法Olson-Cohen模型[44]的拟合准确性最低(MAE = 36.3 K),而完全放弃了物理意义的人工智能模型支持向量机(support vector machine,SVM)则展现出明显更优的拟合准确性(优于物理模型约一倍)。而对于域外扩展能力来说则完全相反,在面对新数据的预测时,具有物理意义的Olson-Cohen模型的预测精度甚至出现了略微提升(MAE = 30.3 K),充分体现出其稳定的域外扩展能力,但SVM模型对新数据的预测精度降低了6倍,暴露出其在域外扩展能力方面的问题。而作为物理冶金原理指导人工智能方法的代表,深度数据挖掘指导的卷积神经网络(deep data mining guided convolutional neural network,DDM-CNN)模型对已知数据的拟合准确性与SVM模型基本持平(MAE = 14.7 K),同时,其在高Cr、高Mn的超广域外体系下的大量验证结果中,均体现出良好的稳定性,模型预测精度一直保持在MAE ≈ 24 K的水平。与物理模型和人工智能相比,DDM-CNN模型显然打破了准确性与域外扩展能力的互斥关系。DDM-CNN模型并未基于纯统计数学分析直接建立成分与Ms间的数据关联,而是先基于成分数据信息,使用被高度认可的普适性热力学模型计算了对Ms有主要机制贡献的化学驱动力、形核驱动力等能量项数值,而后将这些包含热力学模型机制的信息通过卷积神经网络的卷积操作引入至人工智能中,与成分信息一起作为输入特征,进行模型训练。因此,在训练过程中,这些能量信息带给了人工智能具有可解释性的热力学机制的同时,约束了其训练与扩展方向,从而助力该模型突破了准确性与域外扩展能力的互斥关系。由此可见,对于Ms的预测案例虽然不是直接针对合金性能设计的典型示范应用,但其是系统性证明物理冶金原理指导人工智能方法理论基础正确性的良好案例。目前该方法在其他固态相变领域的研究工作中也有了广泛应用[45]

图4

图4   马氏体相变开始温度(Ms)计算模型准确性与域外扩展能力对比[43]

Fig.4   Comparisons of accuracy and extensibility of martensite transformation start temperature (Ms) computation models[43] (MAE—mean absolute error, SVM—support vector machine, DDM-CNN—deep data mining guided convolutional neural network)


2.2 热力学信息指导人工智能的合金设计

在直接针对合金性能设计的研究方面,虽然很难找到像上述Ms预测一样系统性对比物理模型、人工智能及物理冶金原理指导人工智能方法的案例,但也有一些值得关注的结果从另一个角度证明了物理冶金原理指导人工智能方法的本质。Shen等[10]在超高强不锈钢体系下分别使用人工智能和物理冶金原理指导人工智能方法进行了针对硬度的单目标设计。该研究与Ms预测的案例相似,先基于不同钢种的成分信息,使用热力学模型计算了不同钢种中主要析出相的化学驱动力与平衡态相体积分数,然后将这些热力学机制数据与成分工艺信息一起作为输入特征训练SVM模型用以预测硬度,该热力学机制信息指导的SVM模型被命名为物理冶金原理指导的支持向量机(physical metallurgy-guided support vector machine,PM-SVM)。而后,该工作通过对比PM-SVM与传统SVM算法(直接建立成分、工艺与硬度间的关系,不加入热力学机制信息),非常直观地展示了其在合金设计中的区别。首先,PM-SVM与传统SVM模型对已知数据的拟合能力没有任何差别,都达到90%以上,说明从准确性的角度来看,2个模型似乎都没有任何问题,可以应用于后续设计。但当将2个模型分别连接优化算法,进行新合金方案的发现时,2个模型的设计结果出现明显差别。传统SVM模型甚至可以提出硬度提升10 HRC的“超强”方案,但该方案的合理性却非常低,其提出的时效温度甚至低到300 ℃以下,根本不可能生成合理的强化型析出相,而实际的实验验证结果也证实该“超强”方案的实际硬度不但没有提升,反而比原有合金下降了接近20 HRC。而PM-SVM模型的设计方案则具有较高的合理性,虽然其预测的硬度提升效果并没有夸张式的增长,但其预测结果与最终的实验验证结果吻合良好,说明其可以切实地指导合金设计。

由此可见,该案例虽然没有像Ms预测案例一样系统性地对比各模型在域外扩展时展现出的预测精确度,但是以更为直观的合金设计结果展现了纯人工智能模型域外扩展能力。更重要的是,该工作进一步直观展示了纯人工智能模型存在域外扩展问题的本质根源。热力学机制信息计算结果表明,传统SVM模型找到的高硬度设计方案与热力学机制信息没有任何数据关联关系,而PM-SVM模型找到的所有高硬度设计方案均具有相对较高的析出相化学驱动力与平衡态相体积分数,非常符合析出强化的基础物理冶金原理。这个结果非常直观地展现了热力学机制对人工智能训练方向的“弱约束”作用。没有这种来源于物理原理的“弱约束”,人工智能就可以非常自由地进行数据拟合,其得到的模型可以与已有的训练数据吻合得很好,形成准确率高于90%的“伪优质”模型,但实际上其代表的方程形态也是非常散乱自由的,根本不遵循应该遵守的基本物理学方程构型,因此其在域外扩展过程中就会面临如图1b所示的严重错误。而PM-SVM模型通过引入热力学机制信息,给予人工智能一个“需要向高化学驱动力与高平衡态相体积分数的方向搜索”的指引,在此方向指引下,人工智能的自由度就会被限制在合理的范围内,从而展现出良好的域外扩展能力,其与图1d所示的机理本质完全吻合。所以,这个案例从设计的角度充分证明了物理冶金原理指导人工智能方法理论基础的正确性。

而在应用技术层面,热力学机制信息指导人工智能也是一个非常容易被推广的合金设计范式(图5[10,46~54])。首先,该方法并不限定所使用的人工智能策略,其可以像Ms计算案例一样与深度学习结合,也可以像超高强钢硬度设计案例一样与相对简单的统计学算法结合,而热力学与相图计算本身更是合金设计中非常常用的技术手段。因此,该范式已在各合金体系下得到了广泛应用,例如其他种类钢铁材料[10,46]、铝合金[47]、钛合金[48]、铜合金[49,50]、高熵合金[51]、镍基高温合金[52]、钴基高温合金[53]、形状记忆合金[54]等。虽然以上列举的诸多案例并未像本小节论述的超高强钢硬度设计案例一样对该方法的理论本质进行深入探讨,但其实际设计效果均是显著的,这也侧面证明了该范式的普适性与可靠性。而这里还要特别提及一个完全区别于上述技术路线的思路:热力学机制信息计算与强化学习的结合[55]。之所以称其为完全不同的技术路线,是因为其给予人工智能“约束”的方式完全不同于上述各案例。上述绝大多数案例在引入热力学机制信息的同时并不增加训练样本的数量,只是为训练样本引入了一个更符合物理机制的特征因素,所以这种处理方式是相当柔和的,只是用更符合物理机制的特征“暗示与规劝”人工智能走向一条正确的路。但强化学习的技术路线则是更为直接的“明示”,其通过热力学计算与强化学习结合的筛选机制,制造出更多符合物理冶金原理的“合理数据”,再使这些数据直接参与到模型训练中,获得新模型。实质上,人工智能模型经常会“找到一条错误道路”,其本质原因也可以理解为在正确道路上的数据点还不够多,自由度高的人工智能模型仍然有余力穿梭在各数据点间,走出一条七扭八歪的“邪路”。如果在正确道路上的数据点足够多,占据主导地位,则为了拟合更多的数据,人工智能算法自然会被钉死在这条正确的道路上。但这种“明示”的机制显然与物理冶金原理指导人工智能方法提倡的“正则化”思想有所不同。“正则化”思想更趋近于材料学科的思维模式,用机制去软性引导;而强化学习技术路线更趋近于人工智能思维模式,直接采取扩展数据量的手段硬性钉扎,趋近于上文提到的主动学习的思路。2种思想在合金设计领域孰优孰劣是一个值得在未来研究中进一步探讨的话题。

图5

图5   热力学机制信息指导人工智能的合金设计范式[10,46~54]

Fig.5   Paradigm of thermodynamic mechanism information-guided artificial intelligence for alloy design[10,46-54] (ANN—artificial neural network)


2.3 其他尺度数值数据指导人工智能的设计

与热力学相同,其他尺度的数值模拟结果也可以使用与2.2节相同的方式引入人工智能,并起到良好的指导作用。但需要特别注意的是,这种信息引入的效果与信息本身的准确性息息相关,可以想象,如果将错误或不准确的信息引入人工智能,则人工智能也自然会被其引入“歧途”,导致准确性与域外扩展能力降低。热力学理论在合金设计领域经过多年的广泛验证,其准确性已经达到很高程度,因此其完全可以胜任对人工智能的指导任务。而另一个可以想到的相对准确的物理机制信息,自然就是原子尺度的物理本征参数,因为这些参数大多都是已被准确测量的定值,或者可使用无自拟合参数的第一性原理算法计算得到。因此,除热力学机制信息之外,原子尺度信息是最多被用以指导人工智能的物理机制数据。而基于原子尺度数值信息指导人工智能的合金设计案例则大部分集中于高熵合金体系[56~59],其本质原因是高熵合金成分配比均衡的特点尤其有利于第一性原理建模,从而可以更为便捷地获得丰富的原子尺度机制数据。而大多数高熵合金设计的案例与上述超高强钢硬度设计案例所使用的技术路线相同,只是将其中的热力学机制信息替换为原子尺度机制信息,使用的人工智能方法根据其面向的不同数据特点可酌情选择SVM、随机森林、XGboost等统计或集成学习算法[56~58]。无独有偶,在众多高熵合金设计工作中,也有一种完全不同的技术路线存在:Li等[59]将原子尺度机制信息引入生成对抗网络(generative adversarial networks,GAN)来生成更多的“合理数据”,进而将这些合理数据与原始数据结合,共同训练人工智能模型以进行高熵合金设计。显然,这个技术路线与2.2节中介绍的强化学习技术路线如出一辙,其核心思想完全一致,只是将数据生成过程中使用的人工智能策略由强化学习变为了对抗神经网络。由此可见,“正则化”思想与“数据增强”思想的差异化技术路线选择现象在多种合金设计方向上都存在,而目前为止尚鲜有人针对同一个合金设计问题对比2种技术路线的具体优劣势,更缺乏针对某一类型问题应该选择哪种技术路线的指导方针。因此,未来对此问题的系统性探索具有极高的理论与应用价值。当然,如图5[10,46~54]所示,与热力学机制数据指导相同,原子尺度信息指导人工智能的方法也不仅被应用于高熵合金,在铜合金[60]、铁电材料[61]、磁性材料[62]等合金设计中均有广泛应用,这些应用案例虽有算法上的细节差异,但主体技术路线与上述诸多高熵合金的案例基本相同,因此不再一一赘述。

除却原子尺度与热动力学尺度外,其他尺度数值信息指导合金设计的系统性案例并不多见。同时,部分大尺度下的模拟方法不仅生成数值型信息,更会生成图像型信息,例如晶体塑性有限元,因此其在与人工智能结合时需要使用多模态的图像处理技术,这部分内容会在下文详细论述。尽管如此,在部分特殊的研究体系下,分子动力学、有限元等物理计算方法依然可以通过提供数值型机制信息发挥良好的指导作用(图6[60~67])。例如,分子动力学可以模拟激光加工过程中的烧蚀羽流等分子层面数值机制信息,从而指导人工智能在极少量的训练数据支撑下进行包括激光打孔[63]、激光表面加工[64]在内的多种工艺设计。而对于增材制造这一热点方向,有限元也可以提供3D打印过程中的凝固、热传导等相关数值机制信息,从而指导人工智能在有限样本空间内进行精准的裂纹敏感性预测与设计[65]

图6

图6   多尺度机制信息指导人工智能的设计范式[60~67]

Fig.6   Paradigm of multi-scale mechanism information-guided artificial intelligence for design[60-67] (DFT—density functional theory, FEM—finite element model)


综合上述全部案例可以发现,虽然用于指导人工智能的数值信息包含了从第一性原理到宏观有限元的多种尺度物理模型,但上述案例均只分别使用了一种特定尺度的数据,并没有涉及跨尺度数据的同时引入。但实质上,在此人工智能体系下,同时引入多个尺度的物理机制信息在技术方面并不难实现,例如Rao等[66]就在高熵合金设计中通过同时引入热力学与第一性原理数据来指导人工智能训练与合金设计。值得关注的是,该研究工作采用了一个对抗神经网络+传统神经网络+梯度提升树+主动学习的复杂计算流程,因此其使用的训练数据量多达700个样本。有趣的是,在本小节的高熵合金设计案例中,大多数工作仅将机制数据与简单的传统人工智能算法结合,也可优化设计出良好的合金,且其数据需求量大多不超过200条。而在钛合金的设计中,Zou等[67]也同时将包括原子尺度信息、相变尺度信息(层错能)、力学信息(体模量)在内的更多尺度的丰富信息引入相对简单的传统人工智能算法中,从而进行合金的强-塑性协同优化,而此设计中使用的训练数据样本为125条。因此,复杂的人工智能模型构架与算法流程是否真的有助于提升合金设计效率又是一个未来值得深入探讨的方向。

3 图像数据指导人工智能

第2节充分论述了数值型物理机制信息,尤其是热力学、第一性原理对人工智能的指导作用。除了热力学、第一性原理等物理机制数值信息的引入,引入图像信息指导人工智能也是值得发展的重要方向之一。传统物理模型在考虑材料显微组织时需要将真实组织的特点抽象成理想化的组织模型,再进行建模,其与材料的实际组织状态还是存在一定差异的。而人工智能模型可以直接从真实的显微组织照片中提取信息,这是人工智能算法独特的优势。因此,近年来针对显微组织图像指导人工智能的研究爆发式增长,而且还有大量高潜力方向有待系统性研究。所以本小节将依据显微组织图像指导人工智能方向的发展历程,从图像核心信息提取、全图像信息利用和组织图像预测3个由浅入深的层次分别进行系统性论述。

3.1 图像核心信息指导人工智能

早期的图像信息指导人工智能研究工作主要关注于显微组织的图像识别,在人工智能的术语中称其为“语义分割”,即训练人工智能模型,使其能精准识别显微组织照片中的相边界与相分布区域,从而进行图片中诸如晶粒度、相体积分数等核心组织信息的精准提取[68]。对于图像数据的使用始于图像识别与核心信息提取,实质上是受到了第2节所述的数值型数据处理方法的思想引导,或者是物理机制建模长期以来的思维定式。在材料学大量的传统研究中,组织信息很多情况下并不是以图像的形式直接引入模型的,而是以相体积分数、长径比等数值信息引入的。如果可以从组织图像中精准地提取出上述核心组织信息,自然可以沿用第2节所列举的诸多数值型数据处理方法,使用显微组织核心信息指导人工智能。因为该技术路线除了要引入组织图像识别技术外,其与第2节所述的诸多数值型数据处理方法并无其他不同,所以本小节只专注于对图像识别方法发展的论述。

人工智能的语义分割技术在显微组织图像中的应用已经有接近15年的历史,其形成的丰富而系统性的研究基础已在Müller等[69]的综述中予以详尽的论述。不同研究中使用的各种人工智能算法不胜枚举,而使用频次最多的是基于卷积网络的视觉几何组(visual geometry group,VGG)构架[70]、基于融合式架构的U型网络(U-shaped network,Unet)[71]和基于残差算法的残差网络(residual network,ResNet)构架[72]。因此,在处理一些常见的显微组织图像识别问题时可以优先尝试这几种技术路线。而无论使用哪种人工智能构架,永恒不变的难点问题依然在“数据标签”的精准度上(图7[73~75])。如果原始训练数据都没有一个准确的“标签”作为模型可学习的正确答案,那模型的最终性能也不可能优异。而标签的标注成本与其准确度是呈正相关的。直接使用一个灰度阈值来界定各相的边界最为简单,可以快速获得大量标签,但显然其并不准确。比较常用的折中方案是人工手动标注,其相对更费时费力,但准确性会有所提升。但人工标注终究还是会有人为误差,所以最精准的标注方式实际上是使用电子背散射衍射(EBSD)等测试设备直接精准测量相边界等信息,这一方法的代表性工作是Shen等[73]提出的EBSD指导深度学习的SEM图像识别方法。显然,通过EBSD标签的使用,显微组织识别的准确率大幅提升,稳定性也有了显著的改善,但该方法的主要局限性还是在于标签的成本。制备一个与SEM照片有良好对应性的EBSD相图标签所需要花费的时间与资金成本是明显高于人为经验标注的,因此Shen等[73]的工作一直以小样本图像识别算法为主体,来大幅规避大量标签制备带来的成本问题。实质上标签准确性与成本间的客观关系很难被打破,所以目前越来越多工作开始关注于如何在不使用标签的情况下直接获得良好的图像识别效果,这就是图像识别领域技术由监督学习逐渐向半监督,乃至无监督学习的转变。虽然Kunselman等[74]已综述了无监督学习算法在显微组织图像识别中的应用进展,但其综述的大多研究结果只是对图像的分类,而非语义分割,且其中大量工作是使用相场法计算得到的组织模拟图,而非真实组织照片。目前真正能在无标签的情况下实现普适性显微组织图像语义分割的工作少之又少。而由Meta开源的图像分割大模型——分割一切任何模型(segment anything model,SAM)的诞生似乎预示着普适性显微组织图像语义分割模型的发展又将进入一个里程碑式的时期。已有最新研究结果展现出了SAM在完全无标签支持的情况下对显微组织图像语义分割问题的良好处理效果,这一工作可为显微组织图像识别领域的发展带来一个令人振奋的全新思路[75]

图7

图7   图像核心信息指导人工智能的算法对比[73~75]

Fig.7   Comparisons of algorithms for guiding artificial intelligence with image core information[73-75] (DL—deep learning, SAM—segment anything model, ML1 and ML2 represent different machine learning models for regression)

(a1-a12) large sample, low accuracy

(b1-b5) small sample, high accuracy

(c1-c16) no sample, medium accuracy


3.2 全图像信息指导人工智能

实质上,“显微组织识别”本身就是一个具有良好应用价值的方向,其可以加深研究人员对显微组织图像的理解。但先通过语义分割提取出组织图像中的核心数值信息,再引入人工智能框架进行合金设计,并不一定是最合理与高效的合金设计方法,因为该过程本质上是一个基于人为经验对显微组织图片所展现的信息进行选择性使用的处理方式,其也会受到个人认知的局限性影响而引入误差。此外,图像中诸如相形貌等复杂信息也很难直接量化成一个合理的数值。因此,一个自然的想法就诞生了:是否可以将整个显微组织图片的全部信息没有人为选择地直接加入到人工智能模型中,去指导其训练方向?要实现这一想法的难点在于如何将图像信息与成分、工艺、性能等数值型数据信息共同处理,这就需要用到人工智能领域中的多模态数据处理方法。这里要首先说明的是,材料学中目前所提到的多模态问题远没有人工智能领域所关注的多模态问题复杂。人工智能领域的绝大多数多模态算法是面向图像数据和有排列顺序关系的“时序数据”的联合处理,而材料学中成分、工艺、性能等数值型数据绝大多数都可以作为非时序数据处理,因此广泛应用于人工智能领域多模态问题中的时序数据多模态算法,在合金设计领域目前还尚无用武之地。

图像的本质是一个由诸多像素点数值组成的矩阵,而成分、工艺、性能等离散型数值数据也可以用向量表示。所以从数学本质来说,2者也可以看作是模态相同或至少是相近的数据。因此,只需将图像这一矩阵数据通过卷积操作转换成向量数据,就可以方便地与成分、工艺、性能等向量数据协同分析,这一处理方式用传统卷积神经网络构架就可以实现,并不用涉及诸多更为复杂的人工智能策略。而这一思路最具代表性的范例是双相钢的常规力学性能预测[76]。该研究将双相钢的多种组织图片(相分布图、带衬度(BC)图、局部取向差(KAM)图)与钢种成分信息联合,共同作为输入,训练卷积神经网络用以预测钢种的强度与塑性,取得了良好的模型准确性与域外扩展能力,充分证明了使用组织图像作为“弱约束”指导人工智能,也可以达到打破模型准确性与域外扩展能力互斥关系的效果。钛合金领域也同时发表了基于多模态思想的合金设计工作[77],而且同样使用卷积神经网络预测合金的常规力学性能(压缩)。但值得关注的是,2者使用的具体技术方案略有不同:钛合金设计的案例中直接使用了全连接层向量拼接的技术手段融合成分信息与组织信息,双相钢的案例中则更为系统地对比了图像点乘的预处理技术方案与全连接层向量拼接技术方案2种路线,同时指出了全连接层向量拼接技术方案的模型准确性可能会受到全连接层向量维度变化的影响。而且双相钢案例用更为直观的反向热图生成方法证明了该模型具有极强的物理可解释性,能够反向指明显微组织图像中对性能贡献最大的相区域,这也是模型具有良好域外扩展能力的本质原因(图8)。目前,多模态数据处理方法被进一步推广应用至更多领域,包括应力诱导马氏体相变温度的预测[78]等。更有趣的是,近期该方法被应用于与晶体塑性有限元的结合,获得了良好的效果[79]。该工作将晶体塑性有限元计算获得的应力云图引入卷积神经网络,指导其进行应力-应变曲线的预测。由于应力云图包含基本的晶体塑性本构方程信息,因此,卷积神经网络在晶体塑性本构的“弱约束”下获得了极强的域外扩展能力。在无任何人为拟合参数的前提下,该模型可以实现双相钢应力-应变曲线的普适性预测,针对不同成分和工艺,甚至不同热处理工艺路线,双相钢均能获得稳定的预测结果。在该方向上为解决晶体塑性有限元因参数敏感性导致的准确性问题和人工智能的域外扩展能力问题提供了高可行性思路。综上,合金设计领域的多模态数据处理研究尚处于起步阶段,目前形成的系统性技术方案也多基于最基本的卷积神经网络构架,但其已经可以被用来解决诸多领域内存在的难点问题,助力高效的合金设计。进一步开发适用于材料学数据特点的,具有更强大数据分析与融合能力的多模态分析策略则是未来的高潜力研究方向。

图8

图8   各多模态算法框架及其优缺点

Fig.8   Various multimodal algorithm frameworks and their advantages and disadvantages


3.3 “成分-工艺-组织图像-性能”的全链条设计方法

上述多模态分析方法可以实现显微组织图像与成分、工艺信息的联合分析,共同用来预测性能,甚至应力-应变曲线,但实质上并未建立起成分、工艺与显微组织图像之间的关系。而材料学科的研究模式向来以“成分-工艺-组织-性能”全链条分析为核心,在多模态分析的基础上,进一步实现基于成分、工艺向显微组织图像的预测,则自然成为了打通整个计算链条的终极目标。而此链条中的核心难点技术就是“成分、工艺信息→显微组织图像”的预测,这一技术涉及人工智能领域的热点研究方向之一:图像生成模型[80]

当论及图像生成领域,应最先被提及的自然是应用最为广泛的GAN[81]。值得注意的是,GAN虽然在合金组织分析研究中被广泛提及,但其并不是本文主要推荐使用的策略。GAN的本质是训练得到一个图像生成器和一个图像判别器,图像生成器可以将一个向量转化成矩阵式的图像,而图像鉴别器可以将矩阵式的图像转化成一个向量以鉴别其真伪。试想,当显微组织图像可以转化成一个对应的特征向量时,自然就可以通过传统机器学习方式建立起成分、工艺信息向量与显微组织特征向量间的关系模型,从而通过成分、工艺信息预测出对应的显微组织特征向量,进而再使用图像生成器将该向量转化为矩阵式的图像,呈现出显微组织图。更重要的是GAN是一个无监督学习网络,不存在语义分割中所涉及的“标签”问题。因此GAN在基于图像的合金设计领域中也有诸多应用,例如Qian等[82]使用GAN进行力学超材料设计,让其寻找可使材料性能变得更佳的超材料结构图样。而使用GAN进行纯图像生成的研究工作则更多[83~85],例如Long等[84]使用GAN助力稳定晶体结构的搜索,Yang[85]使用GAN生成晶粒长大、枝晶生长等组织图像,为图像识别工作提供更多训练数据等。但可以发现,虽然理论上GAN可以实现“成分-工艺-真实组织图像-性能”的全链条模型构建,但遗憾的是,真正实现这一理想效果的示范案例很少,其本质原因还是材料学领域的小样本限制问题。基于前文对于诸多图像相关案例的论述不难发现,无论是图像识别、多模态处理,还是图像生成,其处理过程的数学本质是相通的,都是先将图像这一矩阵数据转换成更易处理的小维度向量数据,然后再做后续计算。图像识别是先将显微组织图片转换成特征向量,再将该特征向量解码成一个只包含核心信息的相分布图;多模态处理则根本不用将特征向量解码成图片,而是直接用其去预测性能数值;而基于GAN的图像生成则是要依据特征向量再构造出一个与原始组织图片相似的“真实”全信息图像,这3者间的难度差异是不可同日而语的(图8)。在合金设计领域小样本实验数据的环境下,GAN很难被训练稳定,并实现合理的真实组织图像生成与预测,这也是为何目前合金设计领域多数GAN相关的研究是使用相场等模拟手段提供数据来源,而非用实验获得的真实显微组织图像。而为数不多的基于真实组织照片的GAN工作也是在大量数据积累的基础上才得以实现的,例如Cao等[86]针对单一的Ti-6Al-4V合金体系进行3D打印工艺分析,在组织形式相对固定的体系环境下,该工作依然积累了450张真实组织照片,并通过数据增强与图像切割,最终获得了一个多达10.8万张子图的数据库,才完成了GAN的训练,而且该工作只建立了成分、工艺与显微组织间的预测模型,并未涉及对后续性能的预测。可想而知,面对组织状态更为多变的复杂合金体系,再引入性能预测功能,GAN训练的数据需求是会更为夸张的。实质上,早在2018年,美国西北大学Ankit Agrawal团队的Yang等[87]就针对利用GAN建立“成分-工艺-真实组织图像-性能”全链条模型进行了探索,并认为这一GAN框架的训练数据需求量至少是5000个显微组织图像样本,这一工作可以给予后续研究人员在人工智能方法选择上提供极大的指导。

如果上述例子有助于研究者理解GAN的不稳定性及其在材料学小数据环境下应用的局限性,那本文后续推荐另一种算法替代GAN的原因也就很清晰了,这种算法就是变分自编码器(variational autoencoder,VAE)[88,89],其也是AI4Sci领域中受到广泛关注的算法之一[6]。与GAN的区别是,VAE是自监督学习算法。在小样本环境下,VAE不容易像GAN一样过度发散而导致一些图像无法生成或生成的图像不合理的问题(图9[73,76,87,90])。当然,数据量不足会导致VAE生成的图像模糊。但在分析组织与性能关系时,一个模糊的组织图片也基本不影响使用,可以权当拍摄组织照片时焦距未能调好,其总比一张错误的组织照片要有价值。因此,VAE在基于真实组织图像的合金设计中已有成功的案例。Pei等[89]通过对钢铁材料组织的自监督学习建立了可进行钢铁材料组织生成的VAE模型,该模型可以为开发更优力学性能的钢铁材料提供定性的搜索方向指导。虽然该工作没能给出可进行精准定量化合金设计的模型,但其对于VAE算法在合金设计方向上的应用具有里程碑式的意义。而Ma等[90]则以双相钢为研究对象,提供了一个更具参考价值的合金设计案例,其使用22个合金样本获得组织照片,照片经裁剪后为700余条图像样本,建立了双相钢下的VAE模型,并且真正实现了显微组织图像与成分、工艺、性能间的全链条预测,并且基于该全链条预测模型定量化设计了多种高性能双相钢,实验验证结果良好。模型所提方案无论在显微组织图像还是最终力学性能的预测结果方面都与实际制备出的钢种吻合,充分证明了该方法的有效性,而且22个合金获得的700余条组织图片样本需求显然比GAN所需的5000,甚至上万图片样本要更为人性化。当然,虽然VAE算法在双相钢中实现了“成分-工艺-组织图像-性能”全链条预测与指导合金设计的理想模式,但其稳定性如何,在预测的组织图像信息指导下模型的域外扩展能力是否得到了切实的改善,是否打破了准确性与域外扩展能力的互斥关系,以及在更多合金体系下VAE算法是否依然适用,诸多问题都尚待探索与解答,基于“成分-工艺-组织图像-性能”全链条预测理念的合金设计方法刚刚迈出历史性的第一步,仍然任重而道远。

图9

图9   各图像算法的机制关联与数据量需求[73,76,87,90]

Fig.9   Mechanism correlation and data requirements of various image algorithms[73,76,87,90]


4 物理机制指导人工智能

由以上论述可见,本文一直在强调物理模型与机制对人工智能的“弱约束”作用及其重要性,这也是物理冶金原理指导人工智能最核心的理论本质。而前文所列举的诸多案例引入这种“弱约束”作用的方式并非直接将模型或机制本身融入人工智能算法,而是以相对间接的数据输入形式加入一种隐性的“规劝”。例如,在数值型数据方面将热力学模型以能量数据的形式引入统计学习算法、在图像数据方面将晶体塑性本构方程以应力云图的形式引入深度学习网络。然而这种“规劝”式的处理方式也存在局限性,例如其会受到引入数据准确性的影响、引入的物理指导信息过多或维度过大也会导致过拟合等。因此,如果可以将物理机制以更直接的方式加入到人工智能的构架中,则可以大幅避免通过数据间接引入造成的上述诸多问题。因此,本小节专门针对“非数据引入”型的物理冶金原理指导人工智能方法进行总结分析。

4.1 针对定性/半定量机制的迁移学习方法

首先,基于神经网络框架的人工智能模型具有极高的构架调整自由度,因此将各种定性/半定量的物理机制及原理反映在神经网络框架中相对容易,而目前在合金设计领域中应用最广泛的相关技术手段当属迁移学习技术。针对2种内在本质具有相似性的问题(例如,A问题与B问题),如果其中一个问题(A问题)已经通过分析训练建立了具有高精准度的模型,迁移学习则可以通过保留该模型的核心特征,将其内在机制直接应用于对另一个问题(B问题)的模型建立,由于内在机制的共通性,对此问题(B问题)的模型训练所需数据量将大幅降低。

迁移学习技术作为图像识别领域非常经典的技术手段,其在材料学领域的图像识别方面也早有应用。但真正将迁移学习技术与物理机制相关联,进行机制数据间的迁移最早始于2019年,美国西北大学Ankit Agrawal研究团队的Jha等[91]将其应用于加速第一性原理计算,并提出了该算法可通过机制间的关联关系,大幅缩减人工智能面对新问题时训练所需数据量的观点。从依托GAN算法的合金设计,到基于物理机制的迁移学习技术,Ankit Agrawal研究团队作为数据驱动材料基因领域的代表性团队,其所使用的人工智能技术一直具有极强的前瞻性。同一时间,日本统计数理研究所的Yamada等[92]也发表了迁移学习在有机和无机化学领域的应用,证明了其在减少人工智能训练数据需求量方面的强大能力。虽然上述迁移学习工作已得到诸多材料学者的广泛认可,但实质上在上述研究结果发表的3年后,迁移学习技术才被合金设计领域关注并形成了第一个代表性的示范案例:低合金钢的疲劳性能设计[93]。众所周知,疲劳性能的测试需要消耗大量时间与资金成本,因此金属的疲劳一直是一个数据稀缺的领域。Wei等[93]将疲劳与常规力学性能间具有强关联性这一力学领域广泛认可的基本物理机制引入至人工神经网络框架,实现了使用常规拉伸数据部分取代疲劳数据的效果,其最终仅使用30余条疲劳数据就建立起可以进行合理合金设计的疲劳强度预测模型,设计结果与实验验证结果吻合良好,新设计的合金实现了疲劳强度提升50 MPa的效果。30余条数据建立一个人工智能模型而不出现过拟合本身就是一个很令人惊讶的夸张效果,且还能保证对新数据进行稳定的扩展预测,并指导合理的合金设计,实属罕见。而形成该效果的本质原因是该模型的框架中包含了“常规力学性能-疲劳性能”这一物理机制的“弱约束”,因此常规拉伸性能预测的源模型为迁移后的疲劳性能预测模型提供了大量可直接借鉴的经验,大幅降低了模型在分析该问题时面临的困难。该范例充分证明了将物理冶金机制引入人工智能可使其突破人工智能本身算法的局限性,获得准确性与扩展能力的同时提升。

迁移学习技术本质上是一个方法理念,只要所处理的问题与前人已解决的某个问题有关联性或相似性,就可以使用迁移学习技术直接将其模型中学到的“机制或规律”沿用至本问题。最简单的操作方式就是保持源模型的特征提取过程参数不变,只使用现问题的数据重新训练模型在特征提取之后所涉及的参数。因此该方法所需数据量少,对模型构架无特别要求,是一个非常容易推广使用的范式。因此,目前迁移学习技术也被广泛应用于诸多合金设计案例中:近期,Jiang等[94]在铝合金体系下实现了基于迁移学习的合金设计案例,同样着重强调了迁移学习数据需求少的显著优势。针对不同的性能目标需求,迁移学习方法也被进一步推广应用至蠕变性能的预测与设计,甚至疲劳曲线的外推与条件转换等方向[95]

4.2 针对定量机制的物理信息神经网络方法

上述介绍的迁移学习技术虽然是一个非常具有代表性的“非数据引入”型物理冶金原理指导人工智能方法策略,但通过调整神经网络构架引入物理冶金机制显然只能处理定性或半定量的机制关系,因为构架调整实质上不涉及任何定量化的公式构建。那是否可以将各种定量化的物理场与物理机制直接以公式、方程的形式引入人工智能算法,实现约束指导的作用?论及这方面的研究,就涉及了目前AI4Sci领域的热点研究方向之一:物理信息神经网络(physics-informed neural network,PINN)[96]。但同样值得注意的是,PINN也并非本文主要推荐在合金设计中使用的计算策略。

图10所示,PINN是一个主要基于人工智能思想提出的技术路线,人工智能模型在训练过程中所受到的约束完全来源于其设定的损失函数,按损失函数计算后损失达到最低则模型训练过程终止。所以对人工智能进行方程式约束的最直接办法,就是将物理方程直接写进损失函数里,则模型自然会沿着损失函数所界定的方程形式进行训练与优化。作为一个重要的研究方向,人工智能领域近年来开发的PINN算法较多,包括物理信息卷积神经网络(physics-informed convolutional neural network,PCNN)、守恒物理信息神经网络(conservative physics-informed neural networks,CPINN)等,而这些算法的技术细节见文献[96]。从表象来看,PINN似乎是一个非常值得推广的应用范式,其不受机制的尺度限制、不受体系种类限制,只要合金设计过程中涉及的物理过程可以用方程形式表示,就可以将其引入损失函数,万事皆可PINN。但当抛却这些华丽的示范案例,更为深入地窥视PINN的数学理论本质时,就会发现PINN并没有想象中的那样完美。这也是本文在开篇之初花费大量篇幅介绍各方法数学理论基础的原因,只有透过这些数学本质才能看清各种计算方式真正的优势与劣势。实质上,损失函数对人工智能算法的约束是一种“强约束”,不是“规劝与引导”,而是强迫人工智能必须按这个方程形式去训练,与损失函数所定义的方程形式不够吻合,模型训练过程就不会停止。所以PINN的本质是让一个高自由度的统计学算法强行拟合成一个与定义的损失函数相一致的固定微分方程形式,可以形象地称其为“人工智能物理模型化”。所以,即使再精确的拟合也会有误差,自然可以想象,对于一个低纬度的简单问题,PINN就是一个全面弱化版的物理模型,其拟合所需的数据量远高于物理模型,准确度却低于物理模型,域外扩展能力也不会比物理模型更好,这一点也是人工智能领域对PINN公认的评价[96]。对于高维度复杂问题,PINN则会体现出一定的优势,因为基于有限元思想的物理模型很容易在维度过大的体系下产生误差累积,变得极为不准确,此时PINN这种随机拟合的算法则会体现出相对更好的准确性优势,这与统计模拟方法中的Monte Carlo思想类似。例如,上述提到的多数固体力学领域案例均强调了PINN在高维问题求解方面的准确性优势[97,98]。需要注意的是,这里提到的准确性优势并不是指PINN真的很准确,而是因为有限元计算在高维度问题上更加不准,所以PINN相对更可接受一些。所以,这种“人工智能物理模型化”的思想显然是与物理冶金原理指导人工智能方法的理论基础并不完全吻合。PINN中物理方程起到的作用显然已经不是“弱约束”了,而是一种逼迫人工智能成为物理模型的“强约束”,导致的结果就是人工智能变成了与物理模型一样的低准确性、高域外扩展能力算法,本质上依然没有打破准确性与域外扩展能力间的互斥关系。

图10

图10   机制指导人工智能的方法与应用

Fig.10   Methods and applications of mechanism guided artificial intelligence (PINN—physics-informed neural network, NN—neural network, PDE—partial differential equation, MSE—mean squared error. x—spatial variable, t—temporal variable, w—weight, b—bias, σ—activation function, u—solution of the partial differential equation and also the output of the neural network, L—differential operator, g—known function on the right-hand side of the partial differential equation, θ—parameter set of the partial differential equation, R—residual value, ε—threshold. MSE{u, BC, IC}—mean squared error of the solution u when considering boundary conditions (BC) and initial conditions (IC), MSER is the mean squared error based on the R)


由此说来,为何还要花大量篇幅介绍PINN这一方法?PINN在合金设计方面的价值在于其是一个非常方便的微分方程“万能自动”求解器。试想在使用物理模型进行合金计算设计的过程中,搜索到某一个合金成分空间时无法收敛,需要将原本的梯度下降法变成Newton迭代法才能继续算出结果,这将会给合金的自动化设计带来很大的不便。同理,当使用有限元进行合金计算设计时,若针对不同案例都要重新进行手动网格划分,如何去进行合金方案的大范围自动化搜索?所以,当使用PINN作为一个物理方程的替代品时,可直接规避各种网格划分及优化算法选取的问题,从而更为便捷地形成一个自动化迭代寻优的设计系统。相比于有限元等无法规避手动调整网格划分步骤的算法,PINN可以成为一个取代有限元的自动化提供机制数据的方法,用于在合金设计过程中更便捷地为其他人工智能算法的迭代过程提供持续的数据供应。例如,Mondal等[65]用PINN提供传热与凝固相关数据,从而利用该机制数据指导人工智能预测3D打印合金的裂纹敏感性。Zhang等[99]则结合图像信息与PINN提供的数据信息进行多模态数据分析建模,用以分析铝合金材料的内部缺陷。因此,从取代物理模型、为人工智能算法提供更便捷的物理机制信息获取渠道方面,PINN可以发挥良好的贡献作用。

5 结论与展望

在遍历了如此多算法范式与应用案例后,还是要聚焦回本文的主题:在合金设计领域,物理模型、数据驱动和AI4Sci三个范式间的协同、替代和发展关系。其实在本文第2小节论述过后,多尺度物理模型和数据驱动范式各自的优劣势就已经比较清晰了,而且两大范式都很难在合金设计领域基于自身的理论框架突破各自面临的困局。因此,AI4Sci的思路实质上与本文重点介绍的物理冶金原理指导人工智能方法非常接近,融合了各范式的优势。而这里所指的各范式不仅包括物理模型与数据驱动,也包含第一和第二范式涉及的理论与经验。正如刘铁岩[100]对AI4Sci的解读:AI4Sci的本质是以物理机制为核心,以人工智能技术处理实验观测结果与现今普适性理论间的残差。该解读与本文中所强调的物理冶金原理指导人工智能方法的理论基础不谋而合。虽然一家之言并不能代表AI4Sci的总体全貌,但至少可以证明,在以金属结构材料为主的合金设计领域中,物理冶金原理指导人工智能方法可以被理解为AI4Sci方向的一个分支。由此可见,AI4Sci作为第五范式,其代表着未来科学发展的关键趋势,合金设计领域显然也不例外。但专注于AI4Sci的发展并不等于从事物理模型与数据驱动研究就要被淘汰,因为AI4Sci本身就是前四种科学范式的结合体,只是未来研究人员在基于自身范式发展的研究基础上,要更关注于其他范式的进展情况,以明确未来研究方向,尽量使自身研究方向与其他范式研究进展相结合时能起到共同促进、而非相互取代的作用。基于此目的,本文在最后的展望部分,基于主观浅显的理解,尝试性地提出各范式在未来合金设计领域可能的高潜力研究方向,以供参考(图11)。

图11

图11   五个科学范式在合金设计领域的未来发展方向

Fig.11   Future development directions of the five scientific paradigms in the field of alloy design


(1) 物理机制研究方向。首先,对于第一和第二范式而言,揭示物理机制的实验研究永远有其重要的价值,不会受到算法理念革新的影响,正如细晶强化、相变诱导塑性(TRIP)效应等普适性机制永远是合金设计需要遵循的核心,而通过实验研究发现新的机制则会给算法提供更多指导思想,物理机制永远是科学发展的根基。

(2) 跨尺度物理模型方向。相比于物理机制研究,物理模型的发展则更需要关注人工智能技术所带来的冲击。目前大多数链式结构的多尺度模型由于其很难通过自身的发展突破至跨尺度层级,因此其大概率会在合金设计领域逐步走下神坛。链式结构的多尺度模型很容易随着模型串联数量的增加而产生误差累积,同时其所需算力也会呈几何级数的增长。正因受到上述限制,目前领域内大多数多尺度模型均是局限在某个尺度范围内的“局部多尺度”模型,而并非真正意义上可以贯通原子尺度到宏观尺度的“全局跨尺度”模型。而人工智能则为实现真正意义上全局跨尺度信息的融合提供了一个更为宽松的并行式框架,各尺度信息完全可以如本文中所举的钛合金设计案例[67]一样同时输入至人工智能模型中,而多模态深度学习模型更可以给予跨尺度数据更为合理的分层级、分结构的引入方式,从而避免传统局部多尺度集成模型链式结构导致的误差累积问题。因此,从合金设计的需求角度,未来对于物理模型的研究或许应淡化其对某一特定体系数据的吻合精准度,或对某一特殊机制的特异性修正,淡化物理模型链式集成思想,尽量在单一尺度下开发对多种体系均适用的普适性模型,或者像热力学理论一样,通过系统性建立参数数据库提升模型的普适性应用价值,而后通过人工智能策略集成为并行式跨尺度计算体系。而只有具备足够普适性的物理模型才能在此跨尺度体系中成为指导人工智能域外扩展方向的核心,这也充分符合AI4Sci的中心思想。而上述观点也仅是针对合金设计的需求而提出的可行发展方向。如果抛开合金设计不谈,建立链式结构的物理模型依然是解析科学机制的有效方法,人工智能也可辅助加速各尺度物理模型间的衔接,提升计算效率,从而帮助链式结构物理模型在机制解析层面突破跨尺度技术。

(3) 数据驱动的大模型与小模型方向。目前人工智能技术的发展看似日新月异,但实质上越来越偏于一隅,绝大多数学者均集中在大模型领域。虽然也有吴恩达、崔鹏等知名学者一直呼吁对小模型的关注[7],但大模型的研究惯性与吸引力仍然非常强大。但合金设计不同于自然语言处理与自然图像识别,其数据获取成本注定其面临的问题多数具有小样本特点。因此,未来在合金设计领域,人工智能技术或许应适当弱化基于海量模拟数据样本开展的大模型研究,而更应侧重于基于小样本实验数据的可解释性小模型开发,例如本文在图像数据应用部分提到的基于小样本的多模态算法。而大模型的开发也应充分考虑材料学数据量限制,通过丰富样本信息与模态,调整模型构架,降低大模型对样本量的硬性需求度,开发基于小样本的图像生成算法,甚至小样本下的文本与图像数据联合分析算法等,上述算法均是在合金设计领域中有迫切需求的高潜力技术。更进一步来说,目前针对小样本数据的算法也是种类多样,每一个问题使用的算法构架或自定义的超参数均不同,这也会大大限制方法的迁移推广。因此更需要一个可普适性指导小样本算法构建或选择的理论体系,这样才能更贴近应用层面,为解决合金设计等更为现实的科学问题提供方法论指导。同时,基于AI4Sci的理念,普适性物理机制永远是指导科学决策的核心,其价值无法被数据驱动所取代,因此基于人工智能的强大数据分析能力,反向揭示物理机制或发现具有普适性价值的新物理方程描述也是非常值得关注的方向,该方向已有了诸多代表性的工作成果[33]。同样,上述观点也仅是针对合金设计的需求而提出的可行发展方向,在具有更多数据的工业大数据分析领域,端对端的大模型开发依然具有长久的生命力与发展潜力。

(4) AI4Sci方向。由于AI4Sci是数学、物理、化学等领域,以理论计算及功能性设计为主体思路被最新提出的概念,因此目前在该方向上的金属结构材料研究人员相对有限,信息学与物理化学相关研究人员较多,这也导致目前AI4Sci领域的热点技术偏重于物理本构方程与人工智能算法的结合,PINN的兴起就是其中的典型案例。但从五大范式的发展历程来看,第一和第二范式是历史最长,对材料学发展指导最深远的范式,目前以金属结构材料为代表的合金设计所使用的绝大多数方法依然依赖于第一和第二范式。以本文论述最多的大量物理冶金原理指导人工智能方法范例来说,其虽然相对最接近于AI4Sci的理念,但实质上仍无法完全做到AI4Sci提倡的人工智能自主决策。大多数基于该方法的合金设计案例也只能通过计算得到多个高潜力的可行方案,形成一个方案集,后续依然需要通过人为经验判断哪种合金方案更具有实际工程验证价值。因此,如果说物理冶金原理指导人工智能方法为AI4Sci提供了一个物理模型与人工智能模型结合以实现“合理”决策的初步指导思想,则未来AI4Sci在金属结构材料等合金设计领域的发展方向似乎应该适当淡化对于PINN等更为复杂的物理方程引入模式的开发,而更应侧重于定性/半定量经验与理论的引入。这将使解决实际问题更实用的第一范式及第二范式更多地引入人工智能体系,从而真正形成人工智能可以全流程自主决策的合金设计系统。

参考文献

Liao M Q, Wang Y, Wang Y, et al.

Zentropy theory: Bridging materials gene to materials properties

[J]. Acta Metall. Sin., 2024, 60: 1379

DOI      [本文引用: 3]

Entropy is an important concept in science and is ubiquitous from quantum to astronomy. By integrating statistical mechanics, quantum mechanics, and thermodynamics, Professor Zi-Kui Liu proposed the zentropy theory, which stacks entropy over configurations. The zentropy theory takes the configurations in Gibbs' statistical mechanics of a given ensemble as the material gene with the ground state as the basic configuration and additional configurations ergodically derived from its internal degrees of freedom. In the zentropy theory, the total entropy of a system is defined as the weighted average of the entropy of each configuration plus the statistical entropy among all configurations. In this paper, the basic equations and principles of the zentropy theory are introduced, and their typical applications, including magnetic and ferroelectric transformations, thermal expansion mechanisms, and critical phenomenon prediction are outlined. Furthermore, a perspective on the development of this theory, software ecosystems, high-throughput computing, and integration with artificial intelligence is provided in this study.

廖名情, 王 毅, 王 义 .

叠熵理论: 从材料基因到材料性能

[J]. 金属学报, 2024, 60: 1379

DOI      [本文引用: 3]

熵是科学中一个非常重要的概念,从量子到天文,无处不在。基于统计力学,综合量子力学密度泛函理论和热力学,刘梓葵教授团队建立了关于系统总熵的理论:叠熵理论。该理论以Gibbs统计力学中的微观组态作为材料的基因,把密度泛函理论中的基态作为最基本的微观组态,通过基态的内部自由度遍历所有的微观组态。叠熵理论定义系统总熵为每个微观组态熵的加权平均再加上微观组态之间的Gibbs统计熵。本文系统介绍了叠熵理论的基础方程与原理,简单概述了叠熵理论的典型应用,包括磁性转变、铁电转变、热膨胀机制以及临界现象预测,并对叠熵理论从理论发展、软件生态构建、高通量计算以及与人工智能集成等方面进行了展望。

Xie J X, Su Y J, Xue D Z, et al.

Machine learning for materials research and development

[J]. Acta Metall. Sin., 2021, 57: 1343

DOI      [本文引用: 2]

The rapid advancement of big data and artificial intelligence has resulted in new data-driven materials research and development (R&D), which has achieved substantial progress. This fourth paradigm is believed to improve materials design efficiency and industrialized application and stimulate the discovery of new materials. The focus of this work is on the emerging field of machine learning-assisted material R&D, with an emphasis on machine learning predictions and optimization design. Following a brief description of feature construction and selection, recent developments in material predictions on phases/structures, processing-structure-property relationships, microstructure, and material performance are reviewed. This paper also summarizes the research progress on optimization algorithms with machine learning models, which is expected to overcome the bottlenecks such as the small size and high noise level of material data samples and huge space for exploration. The challenges and future opportunities for machine learning applications in materials R&D are discussed and prospected.

谢建新, 宿彦京, 薛德祯 .

机器学习在材料研发中的应用

[J]. 金属学报, 2021, 57: 1343

DOI      [本文引用: 2]

大数据和人工智能技术的快速发展推动数据驱动的材料研发快速发展成为变革传统试错法的新模式,即所谓的材料研发第四范式。新模式将大幅度提升材料研发效率和工程化应用水平,推动新材料快速发展。本文聚焦机器学习辅助材料研发这一新兴领域,以材料预测和优化设计为主线,在简述材料特征构建与筛选的基础上,综述了机器学习在材料相结构、显微组织、成分-工艺-性能、服役行为预测等方面的研究进展;针对材料数据样本量少、噪音高、质量差,以及新材料探索空间巨大的特点,综述了机器学习模型与优化算法和策略融合,在新材料优化设计中的研究进展和典型应用。最后,讨论了机器学习在材料领域的发展机遇和挑战,展望了发展前景。

Agrawal A, Choudhary A.

Perspective: Materials informatics and big data: Realization of the “fourth paradigm” of science in materials science

[J]. APL Mater., 2016, 4: 053208

[本文引用: 1]

Peng G C Y, Alber M, Tepole A B, et al.

Multiscale modeling meets machine learning: What can we learn?

[J]. Arch. Comput. Methods Eng., 2021, 28: 1017

[本文引用: 2]

Su Y J, Fu H D, Bai Y, et al.

Progress in materials genome engineering in China

[J]. Acta Metall. Sin., 2020, 56: 1313

DOI      [本文引用: 2]

Materials genome engineering (MGE) is a frontier technology in the field of material science and engineering, which is well capable to revolutionize the research and development (R&D) mode of new materials, greatly improve the R&D efficiency, shorten the R&D time, and reduce the cost. This paper reviews the progress of MGE in China from the aspects of the fundamental theory and methods, key technology and equipment, the R&D of new materials and related engineering application, talents training, formation and promotion of new concept of material genetic engineering. The paper also looks forward to the future development of MGE in China.

宿彦京, 付华栋, 白 洋 .

中国材料基因工程研究进展

[J]. 金属学报, 2020, 56: 1313

DOI      [本文引用: 2]

材料基因工程是材料领域的颠覆性前沿技术,将对材料研发模式产生革命性的变革,全面加速材料从设计到工程化应用的进程,大幅度提升新材料的研发效率,缩短研发周期,降低研发成本,促进工程化应用。本文从基础理论与方法、关键技术与装备、新材料研发与工程化应用、人才培养以及材料基因工程新理念的形成和推广等方面,综述了中国材料基因工程的研究进展,并提出了未来发展方向建议。

Zhang X, Wang L M, Helwig J, et al.

Artificial intelligence for science in quantum, atomistic, and continuum systems

[DB/OL]. arXiv: 2307. 08423, 2023

[本文引用: 3]

Cui P, Athey S.

Stable learning establishes some common ground between causal inference and machine learning

[J]. Nat. Mach. Intell., 2022, 4: 110

[本文引用: 3]

Zhong X T, Gallagher B, Liu S S, et al.

Explainable machine learning in materials science

[J]. npj Comput. Mater., 2022, 8: 204

[本文引用: 2]

Shen C G, Wang C C, Rivera-Díaz-del-Castillo P E J, et al.

Discovery of marageing steels: Machine learning vs. physical metallurgical modelling

[J]. J. Mater. Sci. Technol., 2021, 87: 258

[本文引用: 1]

Shen C G, Wang C C, Wei X L, et al.

Physical metallurgy-guided machine learning and artificial intelligent design of ultrahigh-strength stainless steel

[J]. Acta Mater., 2019, 179: 201

[本文引用: 8]

Guo A X Y, Cheng L J, Zhan S, et al.

Biomedical applications of the powder‐based 3D printed titanium alloys: A review

[J]. J. Mater. Sci. Technol., 2022, 125: 252

DOI      [本文引用: 1]

3D printing technology is a new type of precision forming technology and the core technology of the third industrial revolution. The powder-based 3D printing technology of titanium and its alloys have received great attention in biomedical applications since its advantages of custom manufacturing, cost-saving, time-saving, and resource-saving potential. In particular, the personalized customization of 3D printing can meet specific needs and achieve precise control of micro-organization and structural design. The purpose of this review is to present the most advanced multi-material 3D printing methods for titanium-based biomaterials. We first reviewed the bone tissue engineering, the application of titanium alloy as bone substitutes and the development of manufacturing technology, which emphasized the advantages of 3D printing technology over traditional manufacturing methods. What is more, the optimization design of the hierarchical structure was analyzed to achieve the best mechanical properties, and the biocompatibility and osseointegration ability of the porous titanium alloy after implantation in living bodies was analyzed. Finally, we emphasized the development of digital tools such as artificial intelligence, which provides new ideas for the rational selection of processing parameters. The 3D printing titanium-based alloys will meet the huge market demand in the biomedical field, but there are still many challenges, such as the trade-off between high strength and low modulus, optimization of process parameters and structural design. We believe that the combination of mechanical models, machine learning, and metallurgical knowledge may shape the future of metal printing.

Cisternas L A, Lucay F A, Botero Y L.

Trends in modeling, design, and optimization of multiphase systems in minerals processing

[J]. Minerals, 2020, 10: 22

[本文引用: 1]

Huang L, Ruan S, Xing Y C, et al.

A review of uncertainty quantification in medical image analysis: Probabilistic and non-probabilistic methods

[J]. Med. Image Anal., 2024, 97: 103223

[本文引用: 1]

Szymanski N J, Rendy B, Fei Y X, et al.

An autonomous laboratory for the accelerated synthesis of novel materials

[J]. Nature, 2023, 624: 86

[本文引用: 1]

Xue D Z, Balachandran P V, Hogden J, et al.

Accelerated search for materials with targeted properties by adaptive design

[J]. Nat. Commun., 2016, 7: 11241

DOI      PMID      [本文引用: 1]

Finding new materials with targeted properties has traditionally been guided by intuition, and trial and error. With increasing chemical complexity, the combinatorial possibilities are too large for an Edisonian approach to be practical. Here we show how an adaptive design strategy, tightly coupled with experiments, can accelerate the discovery process by sequentially identifying the next experiments or calculations, to effectively navigate the complex search space. Our strategy uses inference and global optimization to balance the trade-off between exploitation and exploration of the search space. We demonstrate this by finding very low thermal hysteresis (Delta T) NiTi-based shape memory alloys, with Ti50.0Ni46.7Cu0.8Fe2.3Pd0.2 possessing the smallest Delta T (1.84 K). We synthesize and characterize 36 predicted compositions (9 feedback loops) from a potential space of similar to 800,000 compositions. Of these, 14 had smaller Delta T than any of the 22 in the original data set.

Zhao W C, Zheng C, Xiao B, et al.

Composition refinement of 6061 aluminum alloy using active machine learning model based on Bayesian optimization sampling

[J]. Acta Metall. Sin., 2021, 57: 797

DOI      [本文引用: 1]

Within the China standard (6061 GB/T 3190-2008) of the aluminum alloy 6061, there are a wide range of alloy compositions having multiple trace elements. From the viewpoint of scientific research and quality control in industries, it is important to understand the relationship between the different potential compositions and corresponding mechanical properties of the aluminum alloy 6061. In this work, high-throughput experiments on materials synthesis and an active-learning framework based on the Bayesian optimization sampling process were combined to develop effective machine learning (ML) models to describe the relationship between the composition and hardness of aluminum 6061 alloys. In this work, > 100 alloys with ML designed compositions were synthesized and their hardness data were obtained through high-throughput experiments. The composite ML features were introduced by combining elementary material properties and chemical compositions of alloys and were selected subsequently according to their importance and correlation among features. The efficiencies of two sampling strategies were compared in guiding the iterative experiments: manual sampling based on empirical experience and Bayesian optimization sampling trained within the active-learning framework using the efficient global optimization and knowledge gradient algorithms. These ML models were updated iteratively until the prediction accuracy approached the experimental error. Specifically, the error in the hardness values predicted by the Bayesian model using 64 aluminum alloy samples after three rounds of iterations was 4.49 HV (7.23%), which is much lower than the error predicted by the empirical sampling method (9.73 HV; 15.68%). The results show that Bayesian optimization sampling accelerates the optimization of alloys property more efficiently than manual empirical sampling. Finally, the machine learning models using Bayesian sampling were interpreted using the Shapley additive explanations method and analysis of the partial dependence plot discuss the effects of various trace alloying elements and composite ML features on the hardness of the aluminum alloys. It was found that the hardness value of the aluminum alloys became large when the ratio between Mg and Si (Mg/Si) was between 1.37 and 1.72. In addition, the machine learning models suggested that the lattice distortion, cohesive energy, configurational entropy, and shear modulus were positively proportional to the hardness of the alloy. This work demonstrated that active-learning-guided high-throughput experiments on composition refinement can not only improve the performance and quality control of aluminum 6061 alloys within its standard nominal composition range as used in industry but also provide a feasible approach for the design and property optimization of other multialloy materials.

赵婉辰, 郑 晨, 肖 斌 .

基于Bayesian采样主动机器学习模型的6061铝合金成分精细优化

[J]. 金属学报, 2021, 57: 797

DOI      [本文引用: 1]

结合高通量材料制备实验与基于Bayesian优化采样策略的主动学习方法,开发了有效的机器学习模型来描述合金元素组成与硬度之间的关系,并分析关键微量元素含量对硬度的影响。研究发现,经过3轮迭代64个铝合金样品建模后,Bayesian取样策略方法的预测硬度误差为4.49 HV (7.23%),远低于应用人工经验采样法的机器学习模型误差9.73 HV (15.68%),且当铝合金中的Mg和Si比值Mg/Si在1.37~1.72时,具有较高的合金硬度。通过在6061铝合金标准名义成分范围内进行成分精细优化以及性能调控,为工业上提高产品质量提供了可实现的策略.

Gawlikowski J, Tassi C R N, Ali M, et al.

A survey of uncertainty in deep neural networks

[J]. Artif. Intell. Rev., 2023, 56(suppl.1) : 1513

[本文引用: 1]

Kurz A, Hauser K, Mehrtens H A, et al.

Uncertainty estimation in medical image classification: Systematic review

[J]. JMIR Med. Inf., 2022, 10: e36427

[本文引用: 1]

Jospin L V, Laga H, Boussaid F, et al.

Hands-on Bayesian neural networks—A tutorial for deep learning users

[J]. IEEE Comput. Intell. Mag., 2022, 17: 29

[本文引用: 1]

Venkatraman A, de Oca Zapiain D M, Kalidindi S R.

Reduced-order models for ranking damage initiation in dual-phase composites using Bayesian neural networks

[J]. JOM, 2020, 72: 4359

DOI      [本文引用: 1]

The design and development of materials with increased damage resilience is often impeded by the difficulty in establishing the precise linkages, with quantified uncertainty, between the complex details of the internal structure of materials and their potential for damage initiation. We present herein a novel machine-learning-based approach for establishing reduced-order models (ROMs) that relate the microstructure of a material to its susceptibility to damage initiation. This is accomplished by combining the recently established materials knowledge system framework with toolsets such as feedforward neural networks and variational Bayesian inference. The overall approach is found to be versatile for training scalable and accurate ROMs with quantified prediction uncertainty for the propensity to damage initiation for a variety of microstructures. The approach is applicable to a large class of challenges encountered in multiscale materials design efforts.

Wu S W, Zhou X G, Chen Q Y, et al.

Development of constitutive models for extrapolative prediction of Nb-Ti micro alloyed steel

[J]. Steel Res. Int., 2017, 88: 1700082

[本文引用: 1]

Muth A, Venkatraman A, John R, et al.

Neighborhood spatial correlations and machine learning classification of fatigue hot-spots in Ti-6Al-4V

[J]. Mech. Mater., 2023, 182: 104679

[本文引用: 1]

He Z C, Huo S L, Li E, et al.

Data-driven approach to characterize and optimize properties of carbon fiber non-woven composite materials

[J]. Compos. Struct., 2022, 297: 115961

[本文引用: 1]

Norris C, Ayyaswamy A, Vishnugopi B S, et al.

Uncertainty quantification and propagation in lithium-ion battery electrodes using Bayesian convolutional neural networks

[J]. Energy Storage Mater., 2024, 67: 103251

[本文引用: 1]

Ali S, Abuhmed T, El-Sappagh S, et al.

Explainable Artificial Intelligence (XAI): What we know and what is left to attain Trustworthy Artificial Intelligence

[J]. Inf. Fusion, 2023, 99: 101805

[本文引用: 1]

Hassija V, Chamola V, Mahapatra A, et al.

Interpreting black-box models: A review on explainable artificial intelligence

[J]. Cogn. Comput., 2024, 16: 45

[本文引用: 2]

Vaswani A, Shazeer N, Parmar N, et al.

Attention is all you need

[A]. 31st International Conference on Neural Information Processing Systems [C]. Long Beach: Curran Associates Inc., 2017

[本文引用: 1]

Xu P C, Ji X B, Li M J, et al.

Small data machine learning in materials science

[J]. npj Comput. Mater., 2023, 9: 42

[本文引用: 1]

Ikram S T, Cherukuri A K.

Improving accuracy of intrusion detection model using PCA and optimized SVM

[J]. J. Comput. Inf. Technol., 2016, 24: 133

[本文引用: 4]

He F, Zhang L Y.

Prediction model of end-point phosphorus content in BOF steelmaking process based on PCA and BP neural network

[J]. J. Process Control, 2018, 66: 51

[本文引用: 2]

Xue J L, Chen Y C, Li O, et al.

Classification and identification of unknown network protocols based on CNN and T-SNE

[J]. J. Phys.: Conf. Ser., 2020, 1617: 012071

[本文引用: 1]

Gallos I K, Gkiatis K, Matsopoulos G K, et al.

ISOMAP and machine learning algorithms for the construction of embedded functional connectivity networks of anatomically separated brain regions from resting state fMRI data of patients with Schizophrenia

[J]. AIMS Neurosci., 2021, 8: 295

DOI      PMID      [本文引用: 4]

We construct Functional Connectivity Networks (FCN) from resting state fMRI (rsfMRI) recordings towards the classification of brain activity between healthy and schizophrenic subjects using a publicly available dataset (the COBRE dataset) of 145 subjects (74 healthy controls and 71 schizophrenic subjects). First, we match the anatomy of the brain of each individual to the Desikan-Killiany brain atlas. Then, we use the conventional approach of correlating the parcellated time series to construct FCN and ISOMAP, a nonlinear manifold learning algorithm to produce low-dimensional embeddings of the correlation matrices. For the classification analysis, we computed five key local graph-theoretic measures of the FCN and used the LASSO and Random Forest (RF) algorithms for feature selection. For the classification we used standard linear Support Vector Machines. The classification performance is tested by a double cross-validation scheme (consisting of an outer and an inner loop of "Leave one out" cross-validation (LOOCV)). The standard cross-correlation methodology produced a classification rate of 73.1%, while ISOMAP resulted in 79.3%, thus providing a simpler model with a smaller number of features as chosen from LASSO and RF, namely the participation coefficient of the right thalamus and the strength of the right lingual gyrus.© 2021 the Author(s), licensee AIMS Press.

Jiang L, Fu H D, Zhang H T, et al.

Physical mechanism interpretation of polycrystalline metals' yield strength via a data-driven method: A novel Hall-Petch relationship

[J]. Acta Mater., 2022, 231: 117868

[本文引用: 2]

Baskes M I.

The status role of modeling and simulation in materials science and engineering

[J]. Curr. Opin. Solid State Mater. Sci., 1999, 4: 273

[本文引用: 2]

Elliott J A.

Novel approaches to multiscale modelling in materials science

[J]. Int. Mater. Rev., 2011, 56: 207

[本文引用: 3]

Chen Z, Haykin S.

On different facets of regularization theory

[J]. Neural Comput., 2002, 14: 2791

PMID      [本文引用: 2]

This review provides a comprehensive understanding of regularization theory from different perspectives, emphasizing smoothness and simplicity principles. Using the tools of operator theory and Fourier analysis, it is shown that the solution of the classical Tikhonov regularization problem can be derived from the regularized functional defined by a linear differential (integral) operator in the spatial (Fourier) domain. State-of-the-art research relevant to the regularization theory is reviewed, covering Occam's razor, minimum length description, Bayesian theory, pruning algorithms, informational (entropy) theory, statistical learning theory, and equivalent regularization. The universal principle of regularization in terms of Kolmogorov complexity is discussed. Finally, some prospective studies on regularization theory and beyond are suggested.

Lu Q, Xu W, van der Zwaag S.

The design of a compositionally robust martensitic creep-resistant steel with an optimized combination of precipitation hardening and solid-solution strengthening for high-temperature use

[J]. Acta Mater., 2014, 77: 310

[本文引用: 1]

Wang C C, Wei X L, Ren D, et al.

High-throughput map design of creep life in low-alloy steels by integrating machine learning with a genetic algorithm

[J]. Mater. Des., 2022, 213: 110326

[本文引用: 1]

Li Y, Martín D S, Wang J L, et al.

A review of the thermal stability of metastable austenite in steels: Martensite formation

[J]. J. Mater. Sci. Technol., 2021, 91: 200

DOI      [本文引用: 1]

Metastable austenite plays a critical role in achieving improved combinations of high strength and high ductility/toughness in the design of advanced high-strength steels (AHSS). The thermal stability of metastable austenite determines the transformation characteristics of AHSS and thus primarily determines the microstructure evolution during complex processes, e.g., the quenching and partitioning process, to achieve the desirable microstructure. This study provides a review of the thermal stability of austenite and its influence on martensitic transformation from both experimental and theoretical modeling perspectives. From the experimental perspective, factors affecting the thermal stability are analyzed, the relative sensitivities are compared, and their corresponding mechanisms are discussed. From the theoretical modeling perspective, the most representative kinetic models that describe athermal and isothermal martensitic transformation are reviewed. The advantages, shortcomings, and applicability of each model are discussed. The systematic review of both experimental and theoretical aspects reveals critical factors in tailoring the stability of metastable austenite and, therefore, provides guidance for the design of advanced steels.

Stormvinter A, Borgenstam A, Ågren J.

Thermodynamically based prediction of the martensite start temperature for commercial steels

[J]. Metall. Mater. Trans., 2012, 43A: 3870

[本文引用: 1]

Lee S J, Park K S.

Prediction of martensite start temperature in alloy steels with different grain sizes

[J]. Metall. Mater. Trans., 2013, 44A: 3423

[本文引用: 1]

Rahaman M, Mu W Z, Odqvist J, et al.

Machine learning to predict the martensite start temperature in steels

[J]. Metall. Mater. Trans., 2019, 50A: 2081

[本文引用: 1]

Wang C C, Zhu K Y, Hedström P, et al.

A generic and extensible model for the martensite start temperature incorporating thermodynamic data mining and deep learning framework

[J]. J. Mater. Sci. Technol., 2022, 128: 31

DOI      [本文引用: 3]

The martensite start temperature is a critical parameter for steels with metastable austenite. Although numerous models have been developed to predict the martensite start (Ms) temperature, the complexity of the martensitic transformation greatly limits their performance and extensibility. In this work, we apply deep data mining of thermodynamic calculations and deep learning to develop a generic model for Ms prediction. Deep data mining was used to establish a hierarchical database with three levels of information. Then, a convolutional neural network model, which can accurately treat the hierarchical data structure, was used to obtain the final model. By integrating thermodynamic calculations, traditional machine learning and deep learning modeling, the final predictor model shows excellent generalizability and extensibility, i.e. model performance both within and beyond the composition range of the original database. The effects of 15 alloying elements were considered successfully using the proposed methodology. The work suggests that, with the help of deep data mining considering the physical mechanisms, deep learning methods can partially mitigate the challenge with limited data in materials science and provide a means for solving complex problems with small databases.

Ghosh G, Olson G B.

Kinetics of F.C.C. → B.C.C. heterogeneous martensitic nucleation—I. The critical driving force for athermal nucleation

[J]. Acta Metall. Mater., 1994, 42: 3361

[本文引用: 1]

Lu Q, Liu S L, Li W, et al.

Combination of thermodynamic knowledge and multilayer feedforward neural networks for accurate prediction of MS temperature in steels

[J]. Mater. Des., 2020, 192: 108696

[本文引用: 1]

Kannan R, Nandwana P.

Accelerated alloy discovery using synthetic data generation and data mining

[J]. Scr. Mater., 2023, 228: 115335

[本文引用: 5]

Zhang S J, Yi W, Zhong J, et al.

Computer alloy design of Ti modified Al-Si-Mg-Sr casting alloys for achieving simultaneous enhancement in strength and ductility

[J]. Materials, 2023, 16: 306

[本文引用: 1]

Zou H, Tian Y Y, Zhang L G, et al.

Integrating machine learning and CALPHAD method for exploring low-modulus near-β-Ti alloys

[J]. Rare Met., 2024, 43: 309

[本文引用: 1]

Fu H, Gao T C, Gao J B, et al.

Breaking hardness and electrical conductivity trade-off in Cu-Ti alloys through machine learning and Pareto front

[J]. Mater. Res. Lett., 2024, 12: 580

[本文引用: 1]

Zhang W L, Tang Y, Gao J H, et al.

Determination of hardness and Young's modulus in fcc Cu-Ni-Sn-Al alloys via high-throughput experiments, CALPHAD approach and machine learning

[J]. J. Mater. Res. Technol., 2024, 30: 5381

[本文引用: 1]

Liu X L, Zhang J X, Pei Z R.

Machine learning for high-entropy alloys: Progress, challenges and opportunities

[J]. Prog. Mater. Sci., 2023, 131: 101018

[本文引用: 1]

Xu B, Yin H Q, Jiang X, et al.

Data-driven design of Ni-based turbine disc superalloys to improve yield strength

[J]. J. Mater. Sci. Technol., 2023, 155: 175

DOI      [本文引用: 1]

Increasing the thrust-weight ratio of aeroengines requires development of high-strength and stable high-temperature materials. A data-driven design of Ni-based turbine disc superalloys is performed to improve the yield strength to reach the target. Through first-principles calculations determining the design superalloy system, the theoretical models and Calculation of Phase Diagram (CALPHAD) screening compositions, and machine learning extrapolating prediction, 14 compositions are selected from 2,865,039 composition combinations. Ni-17Cr-8Co-1Mo-1W-6Al-3Ti-1Nb-1Ta is selected to verify the design accuracy. Experimental tests prove that the designed alloy has trade-offs of microstructure with satisfying design targets, and then, the yield strength is higher in the designed alloy than in commercial superalloys, reaching 728 MPa at 850 °C. A scheme for increasing the performance of the designed alloy is proposed by discussing the strengthening mechanisms, machine learning process, and alloying chemistry effect. The cross-scale data-driven design is regarded as an accurate and efficient way to design novel high-strength Ni-based turbine disc superalloys, whose significance is the obvious reduction of trial-and-error tests.

Lu S, Zou M, Zhang X R, et al.

Data-driven “cross-component” design and optimization of γ′-strengthened Co-based superalloys

[J]. Adv. Eng. Mater., 2023, 25: 2201257

[本文引用: 1]

Trehern W, Ortiz-Ayala R, Atli K C, et al.

Data-driven shape memory alloy discovery using Artificial Intelligence Materials Selection (AIMS) framework

[J]. Acta Mater., 2022, 228: 117751

[本文引用: 5]

Zeng Y Z, Man M R, Bai K W, et al.

Explore the full temperature-composition space of 20 quinary CCAs for FCC and BCC single-phases by an iterative machine learning + CALPHAD method

[J]. Acta Mater., 2022, 231: 117865

[本文引用: 1]

Jin X Z, Luo H, Wang X F, et al.

Data mining accelerated the design strategy of high-entropy alloys with the largest hardness based on genetic algorithm optimization

[J]. MGE Adv., 2024, 2: e49

[本文引用: 2]

Vazquez G, Singh P, Sauceda D, et al.

Efficient machine-learning model for fast assessment of elastic properties of high-entropy alloys

[J]. Acta Mater., 2022, 232: 117924

Wen C, Wang C X, Zhang Y, et al.

Modeling solid solution strengthening in high entropy alloys using machine learning

[J]. Acta Mater., 2021, 212: 116917

[本文引用: 1]

Li Z, Nash W T, O'Brien S P, et al.

cardiGAN: A generative adversarial network model for design and discovery of multi principal element alloys

[J]. J. Mater. Sci. Technol., 2022, 125: 81

DOI      [本文引用: 2]

Multi-principal element alloys (MPEAs), inclusive of high entropy alloys (HEAs), continue to attract significant research attention owing to their potentially desirable properties. Although MPEAs remain under extensive research, traditional (i.e. empirical) alloy production and testing are both costly and time-consuming, partly due to the inefficiency of the early discovery process which involves experiments on a large number of alloy compositions. It is intuitive to apply machine learning in the discovery of this novel class of materials, of which only a small number of potential alloys have been probed to date. In this work, a proof-of-concept is proposed, combining generative adversarial networks (GANs) with discriminative neural networks (NNs), to accelerate the exploration of novel MPEAs. By applying the GAN model herein, it was possible to directly generate novel compositions for MPEAs, and to predict their phases. To verify the predictability of the model, alloys designed by the model are presented and a candidate produced - as validation. This suggests that the model herein offers an approach that can significantly enhance the capacity and efficiency of development of novel MPEAs.

Zhang H T, Fu H D, Zhu S C, et al.

Machine learning assisted composition effective design for precipitation strengthened copper alloys

[J]. Acta Mater., 2021, 215: 117118

[本文引用: 4]

He J J, Li J J, Liu C B, et al.

Machine learning identified materials descriptors for ferroelectricity

[J]. Acta Mater., 2021, 209: 116815

[本文引用: 1]

Hartnett T Q, Sharma V, Garg S, et al.

Accelerated design of MTX alloys with targeted magnetostructural properties through interpretable machine learning

[J]. Acta Mater., 2022, 231: 117891

[本文引用: 1]

Wang C C, Zhang Z, Jing X Y, et al.

Optimization of multistage femtosecond laser drilling process using machine learning coupled with molecular dynamics

[J]. Opt. Laser Technol., 2022, 156: 108442

[本文引用: 1]

Zhang Z, Yang Z N, Wang C C, et al.

Accelerating ultrashort pulse laser micromachining process comprehensive optimization using a machine learning cycle design strategy integrated with a physical model

[J]. J. Intell. Manuf., 2024, 35: 449

[本文引用: 1]

Mondal B, Mukherjee T, DebRoy T.

Crack free metal printing using physics informed machine learning

[J]. Acta Mater., 2022, 226: 117612

[本文引用: 2]

Rao Z Y, Tung P Y, Xie R W, et al.

Machine learning-enabled high-entropy alloy discovery

[J]. Science, 2022, 378: 78

DOI      PMID      [本文引用: 1]

High-entropy alloys are solid solutions of multiple principal elements that are capable of reaching composition and property regimes inaccessible for dilute materials. Discovering those with valuable properties, however, too often relies on serendipity, because thermodynamic alloy design rules alone often fail in high-dimensional composition spaces. We propose an active learning strategy to accelerate the design of high-entropy Invar alloys in a practically infinite compositional space based on very sparse data. Our approach works as a closed-loop, integrating machine learning with density-functional theory, thermodynamic calculations, and experiments. After processing and characterizing 17 new alloys out of millions of possible compositions, we identified two high-entropy Invar alloys with extremely low thermal expansion coefficients around 2 × 10 per degree kelvin at 300 kelvin. We believe this to be a suitable pathway for the fast and automated discovery of high-entropy alloys with optimal thermal, magnetic, and electrical properties.

Zou C X, Li J S, Wang W Y, et al.

Integrating data mining and machine learning to discover high-strength ductile titanium alloys

[J]. Acta Mater., 2021, 202: 211

[本文引用: 5]

Holm E A, Cohn R, Gao N, et al.

Overview: Computer vision and machine learning for microstructural characterization and analysis

[J]. Metall. Mater. Trans., 2020, 51A: 5985

[本文引用: 1]

Müller M, Stiefel M, Bachmann B I, et al.

Overview: Machine learning for segmentation and classification of complex steel microstructures

[J]. Metals, 2024, 14: 553

[本文引用: 1]

Simonyan K, Zisserman A.

Very deep convolutional networks for large-scale image recognition

[A]. 3rd International Conference on Learning Representations [C]. San Diego, May 7-9, 2015

[本文引用: 1]

Ronneberger O, Fischer P, Brox T.

U-Net: Convolutional networks for biomedical image segmentation

[A]. 18th International Conference on Medical Image Computing and Computer-Assisted Intervention [C]. Munich: Springer, 2015

[本文引用: 1]

He K M, Zhang X Y, Ren S Q, et al.

Deep residual learning for image recognition

[A]. 2016 IEEE Conference on Computer Vision and Pattern Recognition [C]. Las Vegas: IEEE, 2016: 770

[本文引用: 1]

Shen C G, Wang C C, Huang M H, et al.

A generic high-throughput microstructure classification and quantification method for regular SEM images of complex steel microstructures combining EBSD labeling and deep learning

[J]. J. Mater. Sci. Technol., 2021, 93: 191

DOI      [本文引用: 8]

We present an electron backscattered diffraction (EBSD)-trained deep learning (DL) method integrating traditional material characterization informatics and artificial intelligence for a more accurate classification and quantification of complex microstructures using only regular scanning electron microscope (SEM) images. In this method, EBSD analysis is applied to produce accurate ground truth data for guiding the DL model training. An U-Net architecture is used to establish the correlation between SEM input images and EBSD ground truth data using only small experimental datasets. The proposed method is successfully applied to two engineering steels with complex microstructures, i.e., a dual-phase (DP) steel and a quenching and partitioning (Q&P) steel, to segment different phases and quantify phase content and grain size. Alternatively, once properly trained the method can also produce quasi-EBSD maps by inputting regular SEM images. The good generality of the trained models is demonstrated by using DP and Q&P steels not associated with the model training. Finally, the method is applied to SEM images with various states, i.e., different imaging modes, image qualities and magnifications, demonstrating its good robustness and strong application ability. Furthermore, the visualization of feature maps during the segmenting process is utilised to explain the mechanism of this method's good performance.

Kunselman C, Sheikh S, Mikkelsen M, et al.

Microstructure classification in the unsupervised context

[J]. Acta Mater., 2022, 223: 117434

[本文引用: 1]

Ma X D, Zhang Y Q, Wang C C, et al.

Alloy microstructure segmentation through SAM and domain knowledge without extra training

[J]. Scr. Mater., 2025, 260: 116581

[本文引用: 4]

Ren D, Wang C C, Wei X L, et al.

Building a quantitative composition-microstructure-property relationship of dual-phase steels via multimodal data mining

[J]. Acta Mater., 2023, 252: 118954

[本文引用: 4]

Zhao P L, Wang Y W, Jiang B Y, et al.

Neural network modeling of titanium alloy composition-microstructure-property relationships based on multimodal data

[J]. Mater. Sci. Eng., 2023, A879: 145202

[本文引用: 1]

Wang C C, Ren D, Li Y, et al.

Prediction of deformation-induced martensite start temperature by convolutional neural network with dual mode features

[J]. Materials, 2022, 15: 3495

[本文引用: 1]

Han S Y, Wang C C, Lai Q Q, et al.

Fitting-free mechanical response prediction in dual-phase steels by crystal plasticity theory guided deep learning

[J]. Acta Mater., 2025, Available online, 120936

[本文引用: 1]

Jin L C, Tan F X, Jiang S M.

Generative adversarial network technologies and applications in computer vision

[J]. Comput. Intel. Neurosci., 2020, 2020: 1459107

[本文引用: 1]

Goodfellow I J, Pouget-Abadie J, Mirza M, et al.

Generative adversarial nets

[A]. Proceedings of the 28th International Conference on Neural Information Processing Systems [C]. Montreal: MIT Press, 2014

[本文引用: 1]

Qian C, Tan R K, Ye W J.

Design of architectured composite materials with an efficient, adaptive artificial neural network-based generative design method

[J]. Acta Mater., 2022, 225: 117548

[本文引用: 1]

Narikawa R, Fukatsu Y, Wang Z L, et al.

Generative adversarial networks-based synthetic microstructures for data-driven materials design

[J]. Adv. Theory Simul., 2022, 5: 2100470

[本文引用: 1]

Long T, Zhang Y X, Fortunato N M, et al.

Inverse design of crystal structures for multicomponent systems

[J]. Acta Mater., 2022, 231: 117898

[本文引用: 1]

Yang X.

A machine learning-based approach for materials microstructure analysis and prediction

[D]. Houston City: Rice University, 2020

[本文引用: 2]

Cao Z H, Liu Q, Liu Q C, et al.

A machine learning method to quantitatively predict alpha phase morphology in additively manufactured Ti-6Al-4V

[J]. npj Comput. Mater., 2023, 9: 195

[本文引用: 1]

Yang Z J, Li X L, Brinson L C, et al.

Microstructural materials design via deep adversarial learning methodology

[J]. J. Mech. Des., 2018, 140: 111416

[本文引用: 4]

Kingma D P, Welling M.

Auto-encoding variational Bayes

[A]. 2nd International Conference on Learning Representations [C]. Banff, April 14-16, 2014

[本文引用: 1]

Pei Z R, Rozman K A, Doğan Ö N, et al.

Machine-learning microstructure for inverse material design

[J]. Adv. Sci., 2021, 8: 2101207

[本文引用: 2]

Ma X D, Zhang Y Q, Wang C C, et al.

Creating a microstructure latent space with rich material information for multiphase alloy design

[DB/OL]. arXiv: 2409. 02648, 2024

[本文引用: 4]

Jha D, Choudhary K, Tavazza F, et al.

Enhancing materials property prediction by leveraging computational and experimental data using deep transfer learning

[J]. Nat. Commun., 2019, 10: 5316

DOI      PMID      [本文引用: 1]

The current predictive modeling techniques applied to Density Functional Theory (DFT) computations have helped accelerate the process of materials discovery by providing significantly faster methods to scan materials candidates, thereby reducing the search space for future DFT computations and experiments. However, in addition to prediction error against DFT-computed properties, such predictive models also inherit the DFT-computation discrepancies against experimentally measured properties. To address this challenge, we demonstrate that using deep transfer learning, existing large DFT-computational data sets (such as the Open Quantum Materials Database (OQMD)) can be leveraged together with other smaller DFT-computed data sets as well as available experimental observations to build robust prediction models. We build a highly accurate model for predicting formation energy of materials from their compositions; using an experimental data set of [Formula: see text] observations, the proposed approach yields a mean absolute error (MAE) of [Formula: see text] eV/atom, which is significantly better than existing machine learning (ML) prediction modeling based on DFT computations and is comparable to the MAE of DFT-computation itself.

Yamada H, Liu C, Wu S, et al.

Predicting materials properties with little data using shotgun transfer learning

[J]. ACS Cent. Sci., 2019, 5: 1717

[本文引用: 1]

Wei X L, van der Zwaag S, Jia Z X, et al.

On the use of transfer modeling to design new steels with excellent rotating bending fatigue resistance even in the case of very small calibration datasets

[J]. Acta Mater., 2022, 235: 118103

[本文引用: 2]

Jiang L, Zhang Z H, Hu H, et al.

A rapid and effective method for alloy materials design via sample data transfer machine learning

[J]. npj Comput. Mater., 2023, 9: 26

[本文引用: 1]

Wei X L, Zhang C, Han S Y, et al.

High cycle fatigue S-N curve prediction of steels based on transfer learning guided long short term memory network

[J]. Int. J. Fatigue, 2022, 163: 107050

[本文引用: 1]

Cuomo S, Di Cola V S, Giampaolo F, et al.

Scientific machine learning through physics-informed neural networks: Where we are and what's next

[J]. J. Sci. Comput., 2022, 92: 88

[本文引用: 3]

Liu C, Wu H A.

A variational formulation of physics-informed neural network for the applications of homogeneous and heterogeneous material properties identification

[J]. Int. J. Appl. Mech., 2023, 15: 23500655

[本文引用: 1]

Jin H X, Zhang E R, Espinosa H D.

Recent advances and applications of machine learning in experimental solid mechanics: A review

[J]. Appl. Mech. Rev., 2023, 75: 061001

[本文引用: 1]

Zhang L J, Li K W, Wang H, et al.

MFC-PINN: A method to improve the accuracy and robustness of acoustic emission source planar localization

[J]. Measurement, 2024, 235: 114995

[本文引用: 1]

Liu T Y.

AI for Science: Pursuing the brightest side of human intelligence

[EB/OL]. (2023-01-05).

[本文引用: 1]

刘铁岩.

AI for Science: 追求人类智能最光辉的一面

[EB/OL]. (2023-01-05).

[本文引用: 1]

/