激光金属沉积(LMD)增材制造工艺因能够制造各种工业应用中复杂的组件而越来越受欢迎。然而,确保沉积过程的可靠性已被证明是一个具有挑战性的任务。
尽管在LMD过程中已经设有控制机制,但工艺偏移仍可能发生,并在层生长方向上传播,负面影响组件。仅依赖先前的时间步长来预测后续时间步的沉积可能不足以保证准确性。
为了实现稳健的实时几何控制,本期谷·专栏所分享的研究论文中提出了一种基于时空邻接特征的预测模型。为了验证所提出的方法,制造了九个样本的整体结构。最初,比较了五种不同的机器学习算法,这些算法未使用邻接特征,从中选择了长短时记忆(LSTM)网络进行后续分析。通过三组不同的实验进行了交叉验证,以检查所选预测模型的稳健性。实验结果验证了所提出方法在提高熔池高度预测模型性能方面的有效性。
论文链接:
https://link.springer.com/article/10.1007/s40964-025-01047-y
金属增材制造(AM)作为一种有效的技术,已经成为经济地生产定制化小批量产品的手段,同时与传统的减材制造相比,能够将废料减少约一半。激光金属沉积/激光送粉(LMD)和线弧增材制造(WAAM)都属于定向能量沉积(DED)技术范畴,这是金属增材制造的一种类别,但它们在能量来源和材料类型上有所不同。LMD利用激光束将金属粉末熔化并与基材平面上的焦点熔融,形成精确的复杂几何形状沉积层。
文献中的一个关键空白是缺乏能够融合时空信息的预测模型,特别是对于大体积结构,这些模型捕捉了跨越时间和空间的邻近数据点之间的关系。在实际的LMD过程中,沉积层的几何形状不仅受到先前时间步长的影响(时间依赖性),还受到同一层内和相邻层的邻近区域的影响(空间依赖性)。
DED中沉积层的几何形状受到与前层和邻近区域的相互作用的强烈影响,这些相互作用源于表面条件、热效应和工艺不稳定性。
一个关键因素是球化效应,即喷溅物和部分熔化的颗粒积聚在基材或先前沉积层表面上。这改变了预设的间隙距离,影响了局部能量密度,导致不均匀的熔化。因此,这些不规则性会导致沉积层厚度不均、表面粗糙度增加以及局部缺陷,从而影响尺寸精度。
然而,球化并不是唯一的影响因素。连续路径的热积累会随着时间的推移增加熔池的大小,导致沉积材料的层高逐渐增大。除了层间效应外,层内相互作用——特别是与同一层内沉积轨迹的重叠有关——也会影响沉积层的几何形状。理想情况下,当新形成的熔池与先前沉积的熔池重叠时,它应该形成均匀的融合轮廓,尽管它仍然略微增加新轨迹的高度。然而,预先存在的表面缺陷可能会扰乱润湿角度,导致不一致的融合效率。这增加了诸如缺乏融合和内层孔隙等缺陷的可能性,进一步降低了表面质量。如Imran等人所指出,这些缺陷的组合可能会传播到后续层,导致层高的变化和多次沉积循环中几何不准确的累积。这些相互作用突显了将时空信息集成到预测模型中的必要性,因为它们直接影响着制造过程的稳定性和精度。
据作者所知,本研究首次尝试将时空信息集成到LMD的时间序列熔池高度预测模型中,利用层间和层内相互作用。由于现有相关研究未考虑这些时空特征,限制了它们预测模型在捕捉大体积多层结构真实动态方面的有效性。这一空白凸显了开发新型预测框架的需求,该框架集成了时间和空间信息,为LMD过程的实时监控和控制的进一步发展提供了基础。
因此,在利用双目视觉监控系统捕捉熔池高度的LMD背景下,本研究的突出贡献如下:
研究提出了一种数据驱动时空预测框架,用于预测轨迹级别的层高,而非平均层高度,针对LMD过程中特定应用的体积结构。该框架利用层间和层内邻接特征提高熔池高度预测的准确性,并结合关键的工艺参数(如时间索引、层索引、激光功率、与边界的欧几里得距离等),为预测框架提供全面的数据。层间特征提供了来自底层的信息,捕捉累积效应,而层内特征则反映了同一层内的空间关系。这一方法克服了传统方法的局限性,通过实现体素级别(轨迹级别)的预测,而不是将层或轨迹的高度测量视为独立观察——这种做法本质上忽视了时空信息。
本研究在LMD背景下严格评估了几种先进的基于数据的预测模型的性能。我们比较了门控循环单元(GRU)、长短时记忆(LSTM)、人工神经网络(ANN)、极限梯度提升(XGBoost)和支持向量机(SVM)等模型,并通过均方根误差(RMSE)、平均绝对误差(MAE)和决定系数(R2)等指标定量评估它们的性能。为了展示所提出框架在实时过程控制中的实际应用,预测模型在九个大体积(长方体)结构上进行了测试,使用了三组交叉验证集,确保了不同数据集和实验条件下的稳健性和通用性。
本文的其余部分结构如下:第二节介绍了熔池几何特性及其监控技术的背景信息,并回顾了相关的先进数据驱动预测模型。第三节提供了本文采用的方法,包括数据收集与预处理、特征生成、使用的不同模型以及性能度量的详细信息。第四节对预测结果进行了比较和深入讨论,并给出了实验材料和细节。最后,第五节总结了本研究的主要内容。
2.1 几何感知
熔池监控常用于确保增材制造(AM)部件的质量达到特定标准,因为熔池信息对整体产品的属性至关重要。当监控在尽可能接近制造过程的点进行时,质量控制的效率最大,例如,在机器上和过程中的计量。机器上计量研究的是在AM机器内对部件制造过程的测量。原位测量用于获取信息,同时执行过程中;通过检查正在制造的部件(逐层和/或逐轨迹),并观察LMD机器中与过程相关的其他变量。通常,有两种监控技术用于获得熔池的几何特征:基于激光扫描的方法和基于视觉的方法。
基于激光扫描的方法沿激光线捕捉高度数据,而不仅仅是单个兴趣点,从而产生表面高度的高分辨率扫描,数据以点云数据结构表示。然而,基于激光扫描的方法实时监控熔池存在诸多问题。首先,它仅限于在每层完成后进行逐层扫描。虽然最近的一项研究通过结合具有蓝光特性的激光扫描仪,开发了每个沉积轨迹剖面的实时扫描,但由于blown powder、能量束和熔池辐射的强烈光干扰,仍然存在导致偏差较大的问题。此外,他们的实验仅验证了单轨多层结构,而大多数实际应用涉及具有大体积结构特征的复杂物体。其次,基于激光扫描的系统表面覆盖区域有限,较大的物体可能需要反复扫描,从而导致较长的交付时间和更高的制造成本。本质上,重复扫描之前沉积的区域也可能导致重叠扫描。即使调整扫描宽度,也有可能遗漏某些区域的扫描。对于大体积结构的应用,仍需进一步研究。第三,存在遮挡和阴影效应。前者发生在扫描仪扫描表面时,但探测器无法看到该区域,而后者则发生在部件设计具有复杂形状或表面不规则性,导致激光扫描仪无法到达某些区域时。
相比之下,高度多功能的基于视觉的感知方法提供了许多优势,特别是在通过高速光学成像分析熔池动态和形态学方面,并且适用于闭环控制应用。熔池的特征为典型缺陷提供了重要的见解,这些缺陷包括融合不足、孔洞形成和气孔,所有这些缺陷都源于熔池的复杂动态。例如,喷溅物(即激光与粉末相互作用产生的喷溅物)可以用来检测可能导致部件缺陷的过程不稳定性[61, 62]。
仅依赖单目视觉相机设置可能导致高度估算不准确,因为视线角度发生变化,这些变化可能是由于初始标定过程中的方向变化。为了解决这个问题,专家们已经将多个视觉相机设置与先进的图像处理技术集成。此外,环境因素,包括照明,也可能影响结果,需要通过经验来确定图像处理阈值。虽然调整照明可以提高精度,但也可能破坏特定光谱信号。为了减少LMD过程中文件制造过程中质量波动,Hu等人研究了两种测量方法(基于激光扫描的和基于视觉的)以建立闭环反馈系统。经过详细分析,他们发现使用互补金属氧化物半导体(CMOS)相机捕捉熔池图像具有优势。首先,它不需要复杂的信息捕捉设置。其次,它提供了实时数据,收集效率更高。最后,它在LMD过程中捕捉最完整的熔池图像和动态。相比之下,基于激光扫描的方法仅捕捉部件最上层的固化轨迹。此外,研究人员发现,使用CMOS相机、高分辨率线激光扫描仪和实验部件的横截面尺寸之间的测量误差可以忽略不计,这使得基于CMOS相机的在线测量系统成为可行且有效的。
考虑到这两种几何感知方法的优缺点,基于视觉的方法似乎在捕捉熔池形态学方面更具多功能性和鲁棒性,尤其是在使用多个相机设置时,无论设计的复杂性如何。
2.2 基于数据的熔池几何预测
近年来,研究人员对LMD过程中的熔池几何形状的基于数据的模型给予了大量关注。根据Iravani-Tabrizipour和Toyserkani的研究,由于熔池横截面轮廓形状在过程中不可预测且波动,因此无法通过解析方法计算层高。为了解决这个挑战,他们展示了一个早期的RNN模型示例,该模型预测了单轨/单层结构的熔覆高度。除了RNN架构外,ANN模型也被用于预测。Song等人的研究比较了ANN与响应面模型(回归分析)的预测能力,旨在预测平均轨道宽度和高度。研究表明,ANN模型生成的结果精确且与实验值非常接近。随后,Pant和Chatterjee建议将粒子群优化(PSO)算法——一种进化算法——与ANN模型结合,以通过估计初始权重来提高ANN的收敛速度。他们进行了实验,将他们提出的PSO-ANN模型与标准ANN模型进行了比较,预测了轨道的平均层高、宽度和粉末捕获效率。研究结果显示,PSO-ANN模型的性能更好。Feenstra等人开展了一项研究,研究了不同输入参数对熔池几何特征(包括高度、深度、宽度、面积和稀释)的影响,针对Inconel 625、Hastelloy X和不锈钢316L。他们的发现表明,ANN模型未能产生令人满意的结果,但他们推测数据集的大小限制可能是一个因素。
与前述研究类似,Yang等人预测了薄壁结构中每个轨道的层高——即当前层与先前累积高度之间的平均差异。每层使用了一组固定的变量,包括激光功率、扫描速度、进料速率和层索引。随后,考虑了来自激光扫描仪的先前平均层高、先前累积层高和喷嘴到工件的距离等信息。他们的研究采用了一种基于ANN模型的迁移学习方法,并通过批次更新估算薄壁结构中带有角落特征的层间高度,初始训练时使用直线特征。为了弥补角落特征可能影响局部能量密度的速度损失,修改了扫描速度。作为每层预处理步骤的一部分,从激光扫描仪获取的原始数据通过样条曲线拟合,并细分为多个轨道块,每个块有一个平均层高。每层内的重复层分离也是必要的。然而,他们的研究并未考虑每个子区域沿轨道的空间分辨率。
Kim等人进行了一项研究,探讨了使用ANN预测LMD中多轨/多层结构的层高。为了训练网络,他们利用了包括工艺参数、熔池尺寸和热特性在内的十个不同输入变量。研究人员创建了90个样本,每个样本包含一个由三个轨道组成的单层沉积,层数从0到5,并且使用了15种不同的工艺参数组合。值得注意的是,作者排除了前10%和最后10%的数据,仅使用中间部分80%的数据进行训练,以消除打印时的边缘效应。因此,数据集被划分为48,784个训练数据集和12,200个验证数据集。此外,他们通过激光扫描方法获得了每个轨道的225个高度点。然而,他们并没有利用整个轨道上的高度数据,而是对每个轨道的层高进行了平均,以表示该层的单一代表性高度。作者还声称,他们开发的层高估算系统能够提供实时反馈,每层高度估算时间少于20毫秒。他们建议未来的研究可以结合实时反馈控制系统,基于实时层高估算系统来减少目标组件和尺寸精度。然而,模型评估仅在顶部层进行,该层沉积在预先沉积的大体积结构上,这使得他们模型的性能存在可疑性。此外,这一过程几乎与多轨单层沉积相似,因为它未考虑由于前层的热积累引起的工艺波动,这在打印大体积结构时可能出现。
Hu等人指出,通过利用时间索引和层索引捕捉红外相机图像中的热积累效应,可以更全面地理解LMD过程。为此,研究人员提出了一种名为CNN-BiLSTM的预测方法,这是一个结合了双向LSTM和卷积神经网络(CNN)架构的混合方法,它考虑了熔池几何的CMOS图像中的空间特征。该方法结合了与沉积和热积累现象相关的工艺参数,以提高预测精度。通过在薄壁部件制造中的实验,验证了该数据驱动方法的有效性,表现超过了基于物理的方法,并在预测性能上显著提高了速度。值得注意的是,图像索引从每个轨道/层的1到79不等,每层的初始图像因质量差而被排除。作者还表示,他们的预测模型将为未来设计一个能够自适应控制LMD过程的闭环控制系统奠定基础。
另一项试图解决LMD过程中热积累和逐步沉积的时间特性的研究由Wang等人进行。作者将数据驱动模型和基于物理的分析模型结合起来,推导出了熔池温度。然后,使用工艺参数作为输入,通过1D-CNN模型预测沿轨道的累计层高和熔池宽度。Marangoni指数是提议的研究中的一个参数,它通过规范化沿扫描方向构建的结构的高度得出。然而,该方法仅适用于薄壁结构,可能无法用于复杂结构或多轨多层情况。
Shin等人强调了在进行分析之前对通过线扫描仪获得的熔池图像和高度数据进行预处理的重要性。这个预处理步骤对于对齐两个数据集至关重要,因为通过线扫描仪收集的试样尺寸的变化可能会导致数据行和列的大小不一致。为此,采用了插值方法将输入的熔池数据标准化为每轨道(时间序列×特征)200×10的预定形状,而输出数据集(高度数据)设置为每轨道(时间序列×高度)200×1的形状。所选的预定形状考虑了多轨道分割为单个轨道的情况,适应了相邻轨道之间的重叠。为了使用1D-CNN模型预测数据高度,采用了之字形扫描策略测试了九种不同的情况。
在LMD过程中,控制层高的常见方法是通过对每层的熔池高度进行平均,以得出一个反映沉积过程整体性能的单一代表值,并使用基于激光扫描的感知方法来获取熔池高度。虽然这种方法可能对于简单结构(如单轨单层或薄壁结构)足够,但它可能隐藏了沉积过程中层的真实表现,尤其是在处理大型打印或大体积结构时,层内可能存在的局部缺陷可能无法被检测到。这最终可能会对构建过程产生不利影响,随着层的增长,问题会变得更加严重。直到现在,沿轨道的高度预测仅在简单结构(如单轨/单层、薄壁或多轨单层)中进行过测试,且采用的是基于数据的方法。例如,在他们的研究中,Shin等人为多轨单层结构使用了高度预测模型,在预处理步骤中将每个轨道视为独立的打印轨道。他们假设沉积焦点附近的几何波动不会影响后续沉积焦点的结果。基于这些相关研究和表1中总结的内容,本研究旨在探讨在大体积结构沉积过程中,当前层内的几何变化如何影响后续沉积焦点的预测,跨越空间和时间。这项研究采用了一种新框架,集成了两个额外的空间特征:层间和层内邻接特征,这将在后续章节中详细讨论。
“ 3D Science Valley 白皮书 图文解析
”
本研究引入了创新的空间邻接特征,以增强LMD过程的预测能力:层间特征和层内特征,如图1所示。层间特征指的是当前层兴趣点下方的数据点,增强了模型预测因底层变化而产生的效应的能力。相比之下,层内特征关注来自兴趣点中心的邻近数据点,提供了关于影响熔池动态的即时空间关系的详细洞察。除了这些空间特征外,模型还结合了到边界的欧几里得距离,以考虑熔池的塌缩,并使用时间索引和层索引来有效建模热积累效应,已知这一效应与时间直接相关。这些特征,包括空间邻接特征以及时间和边界相关的因素,提供了一个全面的预测因子集,这些特征在先前的基于数据的高度预测模型中未曾同时考虑过,如表1所列。
本研究采用激光功率作为主要控制参数,其选取依据在于其对控制信号的快速响应特性——可在微秒级时间内实现调控,而当前设备激光脉冲宽度范围为35至120毫秒。这一特性与基于机械运动的位移控制和送粉速率控制形成鲜明对比,后两者受固有机械惯性限制响应较慢,且可能引入显著延时。尽管扫描速度和送粉速率对熔池形貌具有重要影响,但现有模型中二者的主要作用在于预测沉积完成后的平均层高,这恰好符合批量处理或分层控制策略的需求。本研究则致力于实现更精细的预测维度,通过逐体素(voxel-by-voxel)的方式预测熔覆层高度。这种精细化的预测能力对于在沉积过程中实施闭环控制系统至关重要,能够确保实时制造条件下工艺的高精度与自适应调控能力。
为了验证这一假设,研究采用了稳健的实验设置,涉及一种大体积结构类型的固体三维形状。数据预处理包括将一维时间序列数据转换为三维坐标空间内等距采样点。在每层完成后,额外的步骤重新校准了先前层采样点的原始熔覆层高度。这一系列的n个数据点(由输入变量集组成)随后被用于预测处理后的熔覆层高度,在各种预测模型(包括SVM、XGBoost、ANN、GRU和LSTM)中进行预测。通过RMSE、MAE和R2等性能指标对这些模型的表现进行了细致评估。
最终,本研究的主要目标是开发一个复杂的时空相关框架,利用基于数据的预测模型的优势,显著提升金属增材制造中的预测准确性和操作效率。
3.1 数据收集与预处理
数据收集使用了一种集成的双目视觉现场监控系统,如图1所示。
该系统通过一系列图像处理步骤捕捉沉积过程中的熔池高度,进而从像素数据中确定熔池高度。同时,机器还记录了熔覆层高度的原始观测值,以及激光功率和坐标系统,这些数据根据机器日志中的时间索引t进行了同步。
记录的数据点代表熔池,这些数据以四维数据流(x, y, z, t)结构化,其中x、y和z代表三维空间中的空间坐标,t代表时间索引。然而,这种结构化数据存在几个挑战:传感器捕捉到的数据点通常是无序的,并且相邻点之间的采样不均匀,且数据点的数量和位置随着每层的变化而变化。与在三维空间中保持一致的行列深度索引的有序点云(如图2所示)不同,数据点的变化要求一个稳健的预处理策略,以确保数据的可用性和完整性。
为了管理这些挑战,本研究实施了一种预处理方法,将实时数据聚合为有序的点云数据结构,区分每一层的横截面轮廓[52]。每个点云p(t)在给定的时间索引t处封装了x、y、z坐标,∀t ∶ (1 ≤ t ≤ n),其中n是该层的有序点云中的总点数。点云集
包含所有有序点pijk,其中i、j、k分别代表它们的对应索引。此外,每个p(t)还关联一组属性,包括层索引、时间索引、到边界的距离,以及激光功率和处理或重新校正的熔覆层高度。
每层完成后,传感器的基准读数会重新校准为零参考平面,以解决由于先前层的累计偏差导致的熔池高度读数差异。熔池高度校正过程使用以下公式进行,其中hijk和h′ijk分别为P中第i、j、k索引处的处理后的和重新校正的熔池高度实例。常数dz代表用户设置的z轴增量。例如,如果当前第1层的高度hij1 = 300µm,且第0层的先前记录高度为hij0 = 50µm,且z轴增量dz = 250µm,则重新校正后的高度hij1应调整为500µm,以考虑第0层的欠沉积。
3.2 时空邻接特征生成
时空邻接特征旨在捕捉围绕焦点数据点的互相关联特性,这些数据点位于体积结构内。这些特征在两个层面上进行操作:
时间层面:特征涵盖了在与工具路径对齐的移动窗口内的历史数据。该数据集包括时间索引、层号、到边界的欧几里得距离、以及每个体素的设置激光功率和实际激光功率值,捕捉沉积过程随时间的动态演变。
空间层面:在这一层面上,特征分为两类:层间特征和层内特征。层间特征由直接位于焦点下方的不同层的数据点组成,有助于预测由于底层变化而产生的影响。另一方面,层内特征考虑的是在同一层内,立即围绕焦点的邻近数据点,提供了关于影响熔池动态的即时空间关系的见解。
集成时间和空间信息增强了增材制造中高度预测模型的预测性能,促进了实时、逐体素预测熔覆层高度。这一综合方法提供了对空间关系和时间动态的细致理解,显著提高了预测模型的精度和响应速度,超越了传统方法,这些方法依赖于简单的工艺参数,如激光功率、扫描速度和粉末进料速率。
预测模型包含五个默认输入特征:时间索引、层号、到边界的欧几里得距离、设置的激光功率和实际激光功率,并输出当前层在(t+1)时刻的重新校正的沉积高度。层高是我们预测模型的主要输出,受到多层沉积过程中多种因素的影响。控制该输出的关键输入之一是激光功率,这是决定轨迹几何形状的关键参数。激光功率的调整通过补偿热积累、热传导、层间温度变化和表面条件变化等干扰,直接影响层高。此外,到边界的欧几里得距离是检测打印边缘熔池塌缩的关键输入,这对于确保每层的结构完整性至关重要。层号和时间索引也起着重要作用,它们有助于捕捉热积累效应——这一现象对层间的几何一致性产生重要影响。这些输入共同帮助模型考虑并适应沉积过程的复杂动态,从而实现对最终层高的精确控制。
除了五个默认输入特征外,模型还考虑了两类邻近区域的高度,这些区域邻近处理后的沉积高度:层间邻接和层内邻接。pijk ∈ P的层间邻接可以在集合Nijk中汇总:
自然地,矩阵中的非零元素总数会根据当前的位置和工具路径而变化。靠近边缘的点,其矩阵中的非零元素比内部点少。类似地,在过程开始时,由于历史点数量有限,这个矩阵中的零元素相对较多。图3展示了体素化结构的表示,突出了围绕待预测的中心体素在 t + 1 时刻的层内和层间邻接体素关系,有助于理解预测过程中使用的索引约定。
3.3 模型选择
预测模型的选择是精心定制的,符合本研究的独特需求,每个模型的选择都基于其在处理特定类型数据和问题中的优异表现。选择支持向量机(SVM),因为它已被作为与其他机器学习模型比较的方法来解决回归问题。XGBoost 和递归神经网络(RNN)架构,包括门控递归单元(GRU)和长短期记忆(LSTM),由于它们在时间序列预测中的优异表现以及对噪声的抗干扰能力,也被选中。此外,选择人工神经网络(ANN)是因为它在相关的基于数据的高度预测研究中具有广泛的应用,如表1所述。这些模型的任务是处理之前识别的复杂时空特征,这些特征对于准确预测增材制造过程中的层高变化至关重要。
3.3.1 支持向量机(SVM)
支持向量机(SVM)是一种强大的机器学习工具,可用于分类和回归任务。其通过在高维空间中构建超平面来工作,该超平面有效地以最大的可能边距分离不同类别的数据。该边距定义为超平面与每个类别的最近数据点之间的距离,确保超平面尽可能远离任何数据点,从而增强模型的泛化能力。SVM 的多功能性使其能够使用各种类型的核函数来适应线性或非线性关系。常用的核函数包括径向基函数(RBF)、双曲正切和多项式核,每种核函数都适应不同的数据特性。这种适应性使得 SVM 特别适用于小型数据集,能够在相对较少的训练数据下提供高准确度。
为了确保在选择的数据集上达到最佳性能,SVM 模型经过了精心的微调。通过网格搜索方法系统地优化了超参数,如核函数类型(RBF、线性),决策边界值(0.01、0.1、1)和最大迭代次数(1000、5000、10,000)。这一精细的调整过程对于将 SVM 适应数据集所面临的特定挑战和复杂性至关重要,旨在实现最佳的预测准确性。
3.3.2 极限梯度提升(XGBoost )
XGBoost 是“极限梯度提升”(Extreme Gradient Boosting)的简称,由 Friedman 提出,描述了传统梯度提升框架的一个高级扩展。这一强大的算法通过集成方法克服了单个决策树的局限性,其中每棵树都是顺序构建的,旨在优化和改进前一棵树留下的残差。这种方法增强了模型捕捉数据中复杂模式和细微差别的能力,使其在广泛的预测任务中非常有效,包括分类、回归和排名。XGBoost 的一个关键优势是其能够处理线性和非线性关系,适用于不同的数据集。它特别因其计算效率而受到重视,因为它支持并行处理,允许在单台机器上更快地执行学习任务。这种效率使得它在处理大量数据时成为一种非常有吸引力的选择,尤其是在快速模型训练至关重要的情况下。
在优化阶段,XGBoost 模型的特定超参数经过了精心调整,以最大化在选定数据集上的性能。这些参数包括树的最大深度(测试了深度为 5 和 7)、子样本率(试验了 0.1 和 0.7,以确定每棵树生长时使用数据集的最佳比例)、以及最小子节点权重(设定为 1 和 5,以控制树内的决策过程)。通过网格搜索过程系统地探索了这些调整,确保对每个配置进行了严格评估,以找出最有效的设置,确保最佳的预测准确性。
3.3.3 人工神经网络(ANN)
人工神经网络(ANN)是一种多功能的机器学习模型,由输入层、输出层、一个或多个隐藏层组成,使其在各种预测和分类任务中都非常适用。作为通用函数逼近器,ANN 擅长建模大型且多样化数据集中的复杂非线性关系。优化 ANN 涉及调整其架构和微调多个超参数,以增强其在特定数据集上的性能。此过程包括选择合适的神经元数和层数,这对于网络捕捉数据中的详细模式至关重要。模型测试了128和512个神经元,以及一到三层隐藏层,允许根据数据集的复杂性采取量身定制的方法。此外,还探索了包括“Adagrad”和“随机梯度下降”(SGD)等不同优化器选项,以确定它们对网络学习动态的影响。学习率设为 0.01,以确保在训练过程中平稳收敛,不会超过最小误差点。为了高效地在可能的配置范围内导航,本研究采用了贝叶斯优化,目标是最小化 RMSE,作为性能评估的目标函数。此外,Rectified Linear Unit(ReLU)激活函数被集成到网络中。ReLU 在神经网络中特别有用,因为它可以防止梯度消失问题,从而在学习过程中保持有效的梯度流,特别是在更深的网络结构中。这一功能对于确保 ANN 从典型的预测建模数据集中持续而有效地学习至关重要。
3.3.4 长短期记忆(LSTM)
长短期记忆(LSTM)模型是传统 RNN 的一个高级变种,专门设计用于更有效地分析时间序列数据。与标准的 RNN 不同,LSTM 通过独特的门控机制解决了梯度消失或爆炸的问题。这个机制由忘记门、输入门和输出门组成,允许 LSTM 有选择地保留或丢弃信息,使其在处理涉及序列数据的任务时非常高效。LSTM 的操作核心包括几个互联的门,这些门管理信息在网络中的流动。忘记门使用 sigmoid 函数决定要保留前一状态的哪些部分,范围从完全忘记(0)到完全记住(1)。然后,输入门处理新输入数据,将其与保留的信息整合,以更新网络的记忆单元。这个更新通过 tanh 函数实现,该函数将值规范化到 -1 和 1 之间,结合通过逐点乘法得到的sigmoid 输出,确保只有相关信息影响网络的状态。最后,输出门决定当前记忆单元的哪一部分将贡献到输出,从而影响时间步长的下一状态。LSTM 架构的详细公式和技术细节可以在 Yu 等人的综述研究中找到,该研究提供了有关其操作框架的深入见解。
优化 LSTM 模型涉及微调多个超参数,以使其性能适应特定的数据集。调整的关键参数包括学习率(0.01,0.001)、每层神经元数(128,512)、LSTM 层数(1,3)以及是否包含额外的 ANN 层(0,1,2)。为了优化这些设置,采用了贝叶斯优化,进行了最多 12 次试验,目标是最小化 RMSE。该模型还集成了 0.2 的丢弃率,并使用 Adagrad 优化器来提高学习效率并防止过拟合。LSTM 的全面设置使其能够有效捕捉并利用数据集的时间动态,确保准确预测并在不同时间尺度下保持强大的性能。
3.3.5 门控循环单元(GRU)
门控循环单元(GRU)是 LSTM 模型的一种简化替代品,旨在减少计算量。由于 LSTM 模型的计算需求较大,Cho 等人提出了 GRU,通过减少单元内的门数量(从三个减少到两个)来简化架构,从而减轻了计算负担并提高了处理速度。GRU 修改了传统的 RNN 架构,通过引入重置门和更新门,消除了单独的忘记门。重置门决定需要忘记多少过去的信息,而更新门定义新信息有多少会被用来更新当前的隐藏状态。这一配置允许 GRU 决定哪些信息在过去的时间步骤中是相关的,从而提高模型处理序列数据时的能力,尤其是当较早的输入对于未来预测仍然重要时。与 LSTM 类似,GRU 在任何时刻 t 的隐藏状态输出是基于该时刻的输入和之前的隐藏状态计算的,从而有效捕捉时间依赖性。GRU 内部的操作旨在解决标准 RNN 中常见的梯度消失和爆炸问题,从而在较长的序列上实现更加稳定和高效的训练。有关 GRU 功能的详细解释和公式,请参见 Yu 等人的综述。
GRU 模型的优化过程与 LSTM 相似,包括对超参数的微调,如学习率、神经元数和层数。这一系统的方法确保 GRU 模型能够最好地处理数据集的特定特征,最大化模型的效率和准确性。
3.4 性能评估
模型性能的评估被系统地分为三个不同的阶段。最初,使用五个默认特征(时间索引、层号、到边界的欧几里得距离、设置的激光功率和实际激光功率)评估了五个预测模型。这一初步比较旨在确定最适合进行详细分析的模型。随后,纳入了层间邻接特征,检验了这一额外的空间信息如何与默认特征一起影响模型准确性。最后,测试阶段采用了全面的实验设计,将层间和层内邻接特征与原始的五个特征结合起来。通过这种综合方法,可以评估每个因素在不同水平上的影响,邻接特征的参数范围从零到三。
为了评估每个预测模型在准确确定重新校正的熔池高度方面的精度和可靠性,采用了几种统计指标。这些指标是量化模型性能的关键工具,包括均方根误差(RMSE)、平均绝对误差(MAE)和决定系数(R²)。
04 结果
4.1 实验设置与数据准备
在本研究中,实验设置使用了Hwacheon Machinery Co. Ltd的商业LMD打印机,具体型号为DLMF DMX 1,如图4a所示。该打印机配备了一台1 kW的镱光纤激光器,激光器对熔化过程至关重要,并配有屏蔽气体系统,以减少沉积过程中的氧化。实验中使用了氩气作为载气,将金属粉末输送到激光焦点区域,以进行熔化并沉积到基材或先前沉积的层上。标准DLMF打印模块800的工作设置为喷嘴与工件之间的9毫米偏移的间隙距离。
为了实时监控熔池高度,采用了分辨率为800×600像素、采样频率为60 Hz的双CMOS相机,并由系统内置软件进行管理。实验中使用的材料为Inconel 718金属粉末,这是一种由Sandvik生产的镍合金,粒度范围为53–150μm,因其在航空航天工业中的广泛应用而被选择。基材材料为20毫米厚的不锈钢(S45C)板。
进行了一共9次实验,使用长方体样本进行单轨多层配置实验,以模拟大体积结构的沉积过程。这些实验设计用来收集在不同激光功率下的熔池高度数据,即基于(t-1)时刻的熔池高度动态控制激光功率。激光功率作为主要控制参数被使用,因为它响应外部控制信号非常迅速,可实时调整。实验中的所有其他工艺参数保持恒定,包括850 mm/min的扫描速度、4.5g/min的粉末进料速率、0.25mm的层高增量、0.5mm的扫描间距和6.8l/min的保护气体和载气流量。每个长方体样本的尺寸为8.5mm×44mm,采用单轨多层双向锯齿形扫描策略(交替层)构建,最多可进行32层,如图4b和4c所示。每个样本引入了层号和时间索引,以精确捕捉每层中的熔池高度测量。相邻时间索引之间的时间间隔为0.036秒,确保以高时间分辨率记录熔池高度的动态变化。这些实验步骤确保了数据在受控条件下系统地收集,从而能够详细分析不同配置下的熔池行为。
数据收集后,记录的数据经过预处理,整理成有序结构以便进行模型训练。预处理包括将时间索引测量数据组织成结构化格式,反映每个长方体样本的熔池高度时空演变,使后续的机器学习模型能够有效学习层间和层内的依赖关系。在预测模型的训练中,数据主要来自7个涉及长方体结构的实验。其余实验用于模型验证和测试。为了确保全面评估,来自这些实验的数据被分为三种不同的数据集/案例,作为交叉验证策略的一部分,以测试模型的稳健性。这些数据集详细信息见表2。
表2
每个数据集包含了五个常见的默认输入变量,常用于现有研究:层索引、时间索引、设置和实际激光功率以及到边界的欧几里得距离,输出变量为基于公式(1)的重新校正熔池高度。每个案例都经历了三个测试条件,以评估空间特征对模型性能的影响。测试条件包括:
- 无层间和层内邻接特征(默认特征),
- 有层间邻接但没有层内邻接,
- 同时包含层间和层内邻接特征。
这种全面的测试方法评估了预测模型在不同数据集上的表现,突显了其适应性以及对大体积结构熔池动态的泛化能力。图5展示了本研究中用于预测过程熔覆层高度的整体流程。
4.2 熔池高度预测模型的比较分析
评估了五种不同的预测模型:SVM、XGBoost、ANN、GRU和LSTM。每个模型都使用来自案例1的数据进行严格训练,该案例涉及仅使用默认特征(不包括提出的层间和层内邻接特征)的长方体结构。此阶段对于评估模型的适用性至关重要。在训练之前,所有输入和输出变量都进行了标准化,以提高性能并加速收敛。
对于传统机器学习模型,包括SVM和XGBoost,采用了网格搜索方法来选择最优的超参数。网格搜索方法仔细测试了搜索空间中每个超参数组合,以找出能够产生最佳性能的设置。相比之下,神经网络架构(包括ANN、GRU和LSTM)采用了贝叶斯优化方法。这种方法采用概率模型,将超参数映射到其达到最佳性能的可能性,通过收敛到最有效的参数,避免了对每种可能性进行穷尽测试。
经过初步训练和超参数调整后,模型根据其在预测熔池高度方面的表现进行了评估。评估重点关注三个关键指标:RMSE、MAE和R²值。表3呈现了这一评估的详细结果。此比较对于确定最适合进一步分析和优化的基础模型至关重要,特别是在结合时空邻接特征后。
表3中的结果显示,SVM模型表现不佳,预测能力最弱,其RMSE和MAE分别为43.331和33.806,明显低于其他模型。类似地,ANN模型由于将每个观察值视为独立实体,处理时间序列数据时表现不佳,未能准确捕捉到顺序数据点之间的关联。XGBoost相比ANN和SVM表现更好,RMSE为31.046,MAE为23.724,R²为0.348,这得益于其抗噪声的能力。两种RNN架构,GRU和LSTM,展示了良好的性能指标,其中LSTM最终超越了所有其他模型。LSTM模型凭借其出色的处理时间序列数据的能力,获得了最低的RMSE(29.931)和MAE(23.065),以及最高的R²值(0.394)。这一结果为选择LSTM模型作为进一步研究的基础,特别是在加入层间和层内邻接特征后提供了依据。
表3 采用不同模型进行长方体结构沉积时,其预测模型的(性能/效能)评估指标
通过根据这些性能指标选择LSTM模型,证明该模型非常适合进入研究的下一阶段,在这一阶段中将引入时空依赖性,以进一步提高预测准确性。在后续部分中,基于这些发现,通过将时空邻接特征应用于LSTM模型,旨在提高其捕捉数据集中的空间和时间关系的能力。
总之,本研究在LMD过程中的层沉积行为和预测方面得出了几个重要发现。以下是本研究的关键点总结:
- 大多数研究使用了简单的结构,如单轨/单层、薄壁或多轨单层(表面熔覆层)配置。
- 大多数传统的数据驱动预测模型侧重于预测轨道的平均层高,而非沿轨道的详细层高剖面。这些模型往往忽视了单层或轨道内部的变异性,这种变异性可能由潜在的或外部因素引起,包括热积累或环境因素,未能有效地表示大面积范围内的完整高度谱。
- LMD过程与热积累密切相关,因为在添加层时,先前层的残余热量未能在沉积后续层之前完全散失。为了解决这一问题,本研究引入了时空邻接特征,旨在捕捉与预测的体素在t+1时刻相关的空间和时间变化。
- 此外,RNN/LSTM架构在提取与时间相关数据方面的有效性得到了证明。该模型擅长结合与热积累和沉积相关的时间特征,展示了热历史如何随着时间推移持续影响熔池。然而,随着时间的推移,先前热积累对熔池的影响逐渐减弱,RNN/LSTM模型能够逐步将这一变化纳入考虑。
来源:筑基手册
知之既深,行之则远。基于全球范围内精湛的制造业专家智囊网络,3D科学谷为业界提供全球视角的增材与智能制造深度观察。有关增材制造领域的更多分析,请关注3D科学谷发布的白皮书系列。
白皮书下载 l 加入3D科学谷QQ群:106477771
网站投稿 l 发送至2509957133@qq.com
欢迎转载 l 转载请注明来源3D科学谷 l 链接到3D科学谷网站原文
















