发布时间:2024-07-16 浏览量: 作者:尹娜 来源: 电信学院
近日,天津科技大学电子信息与自动化学院林丽媛博士和研究生赵姝娴在计算机科学领域国际顶级期刊《ieee transactions on industrial informatics》(中国科学院一区top,if="12.3)发表题为“purposive" data augmentation strategy and lightweight classification model for small sample industrial defect dataset”(doi: 10.1109/tii.2024.3404053)的最新研究成果。该研究由天津科技大学、曙光信息产业股份有限公司、天津大学合作完成。我校为第一完成单位,林丽媛博士为第一作者。
文章指出,实际工业环境具有复杂性,在进行缺陷检测时,大量获取类别均衡的样本十分困难。常规解决方法是对所有小样本类别统一应用数据增强算法,以生成高质量的缺陷样本,但这样做却忽略了样本类别和数量分布会对分类效果产生影响。作者研究发现,如果对所有类别都统一应用数据增强算法会导致极大的资源浪费,并可能影响实际的分类效果;而一些具有鲜明特征的少数类在不进行数据增强的情况下,也能取得良好的分类效果。
因此,该文章系统地分析了小样本缺陷数据集中不均衡率、错分率、错分比例对分类效果的影响,提出了少数类不均衡率(micir)和一种基于micir的小样本类间不均衡数据增强策略,可以在数据增强前确定需增强的缺陷类别和有效增强数据量,实现有目的的有效数据增强,解决因类别样本数量少引起的错分问题。此外,针对数据集中样本量多的类别错分的情况,该文章设计了一种轻量级的分类模型shcnet,进一步提升了分类性能。
文章所提出的数据增强策略和分类模型在实际的工业缺陷数据集上显著提升了分类准确率,显示出较高的泛化能力,填补了工业生产中如何确定各类别样本量增加的空白,有助于推动工业缺陷检测技术的发展。
林丽媛博士主要从事计算机视觉、人工智能技术及其应用等研究。近年来她参与多项国家级科研项目、主持省级科研项目2项、横向项目2项,被评为天津市优秀特派员,指导研究生获得2020-2021年度天津市工程专业学位研究生优秀学位论文,研究生电子设计大赛华北赛区二等奖,中国国际“互联网 ”大学生创新创业大赛天津市铜奖。在国际期刊上发表sci论文10余篇,授权发明专利2项,担任ieee transactions on industrial informatics(1q top),caai transactions on intelligence technology,the visual computer,communication and image representation, measurement science and technology,the journal of supercomputing,ieee access, sensors, journal of electronic imaging等国际英文sci期刊审稿人。
编辑:赵天桐