文档详情

基于主成分分析的随机森林钢材缺陷检测算法.pdf

发布:2024-04-15约1.33万字共6页下载文档
文本预览下载声明

第45卷第1期吉林师范大学学报(自然科学版)Vol.45ꎬNo.1

2024年2月JournalofJilinNormalUniversity(NaturalScienceEdition)Feb.ꎬ2024

doi:10.16862/j.cnki.issn1674 ̄3873.2024.01.007

基于主成分分析的随机森林钢材缺陷检测算法

王纯杰ꎬ张钺ꎬ谭佳伟

(长春工业大学数学与统计学院ꎬ吉林长春130012)

摘要:钢材在原材料生产、冶炼加工等过程中会出现划痕、污渍等缺陷问题ꎬ而缺陷检测是生产过程中把控

产品质量和生产效率不可或缺的一环.传统的分类算法对缺陷检测来说效率较低ꎬ因此本文提出了一种基于

主成分分析和SMOTE的随机森林算法.通过融合SMOTE、主成分分析和随机森林算法ꎬ实现对钢材缺陷的有

效检测.结果表明ꎬ相较于传统分类算法如Logistic回归、决策树等ꎬ本文提出的方法有效提升了缺陷检测效率.

关键词:缺陷检测ꎻSMOTEꎻ主成分分析ꎻ随机森林算法

中图分类号:O212文献标志码:A文章编号:1674 ̄3873 ̄(2024)01 ̄0039 ̄06

0引言

钢材是广泛应用于汽车、建筑等行业的重要材料ꎬ具有高强度和强耐久性等特点.然而ꎬ在生产加工

过程中ꎬ钢材往往会出现划痕、污渍等缺陷.这些缺陷不仅影响钢材的整体质量ꎬ还对产品的安全和性能

产生巨大影响.缺陷检测是制造生产过程中的关键步骤ꎬ对于质量控制和生产效率来说至关重要.传统

[1 ̄2]

的缺陷检测算法往往效率较低且准确性有限.因此ꎬ本文提出一种基于主成分分析(Principal

[3]

ComponentAnalysisꎬPCA)和随机森林(RandomForest)的钢材缺陷检测方法ꎬ提高对不同类型的钢材

缺陷的检测效率和准确性.

本文首先利用PCA方法ꎬ对钢材数据进行特征提取ꎬ然后利用随机森林算法ꎬ对PCA提取的特征

进行快速准确分类ꎬ最后为了进一步提高模型缺陷检测的性能ꎬ引入合成少数类过采样算法[4]

(SyntheticMinorityOver ̄samplingTechniqueꎬSMOTE)ꎬ用于解决在钢材缺陷检测数据集中的样本类别不

均衡问题.

1缺陷检测方法

1.1主成分分析

PCA是一种经典的降维方法ꎬ常用于特征提取和去除数据冗余信息ꎬ其主要通过线性变换将数据

映射到一组新的正交特征上ꎬ使这些特征能够最大程度地解释原始数据的方差ꎬ保留信息最大化.PCA

的算法步骤如下:

()

(1)数据标准化.假设有n个样本ꎬp个指标ꎬ此时大小为n×p的样本矩阵为x=xꎬxꎬꎬx.由

12p

此计算数据的均值x和方差S分别为jj

-1n

x=xꎬS=-2(n-1).

jn∑ijj∑(x-x)ijj

i=1i=1

标准化后的数据X和样本矩阵X分别为ij

收稿日期:2023 ̄12 ̄18

基金项目:国家自然科学基金项目12271060)ꎻ吉林省

显示全部
相似文档