想了解更多相关内容,可以下载报告《2022年AI工业视觉解决方案白皮书》查看,以下内容都是根据该报告总结的,仅供参考。
缺陷检测显然是AI工业视觉解决方案最大的用武之地,机器视觉技术诞生以来,最大的 使命就是执行检查任务,例如检测制造产品中的缺陷、污染物、功能缺陷等异常。相 比人类视觉,机器视觉因其速度、准确性和可重复性而在结构化场景的定量测量中具 有优势。利用适当的相机分辨率和光学件配置制造的机器视觉系统可以轻松检测人眼 难以看到的物体细节,并且检测的可靠性较高,错误也较少。在生产线上,机器视觉 系统可以可靠且重复地每分钟检查数百或数千个部件,远远超过人类的检测能力。但 是与传统的机器视觉不同,人类擅长区分细微的表面和功能缺陷,以及区分可能影响 感知质量的部分外观变化。虽然人类处理信息的速度有限,但人类有特殊的概念化和 概括的能力。人类擅长通过实例学习,并且在部件有小异常时,能够区分真正重要的 部分。在很多情况下,这使人类视觉成为定性解释复杂、非结构化场景的理想选择, 尤其是那些有微小缺陷和不可预测缺陷的场景。
图像分类技术在民用领域最典型的应用是人脸识别,人脸识别目前已经是计算机视觉中 非常成熟的技术了,完成不同人脸的识别后,算法工程师又把目光转向了更为复杂的“表 情识别”。表情相对于人脸的特征来说,其变化更加微小,不同人的表情差别是很大的。 比如:A的“微笑”有可能和B的“哭泣”类似。所以表情识别对神经网络模型的架构要求非 常高,模型训练的挑战更大。
神经网络是基于感知机发展而来,感知机是一个有若干输入和一个输出的模型。深度神 经网络可以有更复杂的输入数据和多个输出结果。所以,它可以把不同人群的相同表情 归一到一个输出结果上。
基于深度学习的表情识别相对于工业场景的分类来说,实现难度是比较小的,因为表 情差异的特征在图片上的数据差异是非常大的。以1000万像素的手机图片来说,同一 个人的“高兴”和“哭泣”图像的差别可以达到800万个像素点。如果用传统算法是无法承 受之重,但是对于神经网络模型来说却是大有可为的。 而真正的难点是工业领域的分类。以目前算法比较成熟的红枣分类检测举例,以500万 像素的工业相机来说,不同类型红枣之间的特征差异,可能只有几百个像素,而且差 异的像素深度很低。这个时候要准确的进行分类,就很难了。
OCR (Optical Character Recognition,光学字符识别)是指对图片中的文字进行查找、提 取、识别的一种技术,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状 翻译成计算机文字的过程。OCV则是在OCR的基础上对提取出的内容进行比对,从而判 断图片中的文字内容是否符合要求。由于文字(字母数字等)可能产生自激光雕刻、喷 码印刷、油墨印刷等不同渠道,一致性不能保证,且存在文本大小、长度不固定,文本 存在多个方向、多种字体、语言混合等各种挑战,准确的进行字符识别一直是图像处理 领域的难题之一。
基于深度学习的字符识别可以比较有效的解决这一问题,字符识别也是深度学习技术 典型的应用场景之一。在工业生产尤其是包装生产线上,存在大量的包装袋、包装盒 体上的生产日期、批号字符需要进行检测,利用深度学习进行小样本的训练即可获得 一个比较理想的深度学习模型,可以获得良好的落地效果。
由于视觉检测场景的复杂性,往往需要传统算法和深度学习相互结合才能很好的解决具 体场景问题。从项目实施的角度来说,深度学习在复杂性和成本方面要比传统算法高很 多,所以在项目选型来看,深度学习一般都用来解决传统算法无法解决的场景问题。 缺陷检测的原理就是就是检测产品表面异常的“点、线、块”特征,这些特征往往表现的比 “背景”颜色“深”(黑色)或比“背景”颜色“浅”(白色),我们通过图像处理的方式把这些“ 点、线、块”量化出来,如果量化结果超过某个阈值(要求检测精度)则判定为NG。
无论是定位、读取、检测还是分类感兴趣的功能特征,相比于传统机器视觉,深度学 习型图像分析能根据独特的特征概念化和概括部件外观,即使这些特征有微小的变化 或时有偏差也可以。深度学习为一些采用传统视觉系统面临挑战的应用带来了希望。 例如有机食品检查、种子分选等,随着AI在机器视觉方面的兴起,该技术将适用于更多 的检查任务,最终超越工业自动化领域。有理由相信,深度学习在医疗、生命科学、 食品、假冒检验和木材分级等行业都将有很好的发展前景。
未来,在医疗诊断、监视、自动驾驶和智慧农业等领域将会更多地引入深度学习技术, 以实现检查或地图分析等功能。在工业应用领域,我国机器视觉行业仍有较大的成长空 间,是黄金成长赛道。人口老龄化+人工成本提升+机器视觉先天优势+政策扶持智能制 造给我国机器视觉行业持续发展提供了重要驱动力,而下游不断成熟的机器视觉产品 技术以及持续的国产化趋势,反过来又给我国机器视觉行业发展提供了重要支撑。深 度学习技术的诞生将原来对产品一致性要求高的应用场景进行了数倍的扩展,必将在 短时间内带来工业视觉的爆发式增长。