<返回更多

计算机视觉研究新趋势:下一次突破会是什么?

2023-09-28  51CTO  
加入收藏

译者 | 布加迪

20世纪50年代的计算机视觉首批用例可以分析键入文本和手写文本。早期的商业应用程序致力于单个图像,包括光学字符识别、图像分割和对象检测。人脸识别方面的开创性工作始于20世纪60年代,科技巨头们在2010年左右开始推出相关功能。

计算机视觉研究新趋势:下一次突破会是什么?

计算机视觉市场规模在2022年估计为140亿美元,预计从2023年到2030年将以19.6%的年复合增长率增长。虽然有许多新的计算机视觉突破和初创公司,但与其他人工智能技术相比,市场规模还是很小。比如说,到2032年,生成式人工智能的市场规模估计将达到1.3万亿美元。

计算机视觉的新兴用例

如今无论您走到哪里,摄像头都可能在扫描您,计算机视觉算法执行实时分析。计算机视觉的主要用例包括文档扫描、视频监控、医疗成像和交通流量检测。实时计算机视觉方面的突破促进了自动驾驶汽车的发展,并推动了无收银员商店和库存管理等零售用例的发展。

您可能碰到过或读到过诸如此类的面向消费者的用例,特别是汽车和消费者市场中的计算机视觉主要应用。

您可能不太了解制造业、建筑业及其他工业企业在如何使用计算机视觉技术。这些行业的企业通常迟迟不愿投入于技术,但制造、数字建筑和智能农业等行业的工业4.0计划正在帮助行业领导者更好地了解新兴技术带来的机遇。

减少制造过程中的浪费

计算机视觉在制造业带来了重大的机会,计算机视觉算法达到了99%的准确率。考虑到只有10%的公司使用这项技术,这方面的潜力尤其惊人。工业领域正在酝酿一场数字革命,还是这些企业在采用计算机视觉技术方面继续落后?

IndustrialML首席执行官Arjun Chandar表示,在制造业中,识别动态材料的产品质量是主要的用例。“借助高帧率的相机和逐帧运用机器学习模型,就可以快速识别生产线上的瑕疵。”

全球制造商每年浪费高达8万亿美元,计算机视觉可以帮助监控设备、制造部件和环境因素,从而帮助制造商减少这些损失。

Chandar表示,许多制造业用例的底层技术是主流技术。“这些主要使用2D相机,不过拥有高分辨率和每秒20帧或更高的帧率,还使用卷积神经网络(CNN)。”

为了提高准确性,制造商需要一种策略来充实这些数据。Chandar补充道:“要像在典型的制造环境中那样增强训练能力,具有良好产品质量的图像数量需远远超过瑕疵。”

消除这个缺口的一种方法是使用合成数据,这是开发团队用来增加测试数据多样性的一种方法。

Syntax数据管理和创新合伙人Jens Beck表示,制造商可以从基本的视觉检查步骤入手,随后寻求更大的自动化机会。他说:“我们看到计算机视觉和人工智能结合用于视觉检查,比如在汽车上检查胶水痕迹。对客户来说,商业价值不仅仅在于通过自动化手动步骤来提高整体设备有效性(OEE),还在于将检查记入文档,然后将计算机视觉集成到制造执行系统(MES)中,最终集成到企业资源规划系统(ERP)中。”

提高工厂车间的安全性

除了质量和效率外,计算机视觉还有助于提高工人的安全性,减少工厂车间及其他工作场所的事故。据美国劳工统计局声称,2021年制造业有近40万人受伤和患病。

Synthesis AI的首席执行官兼创始人Yashar Behzadi说:“计算机视觉可以比人员监管体系更快速更高效地不断识别员工面临的潜在风险和威胁,从而提高工人的安全性。计算机视觉要准确可靠地做到这点,机器学习模型就要使用大量的数据进行训练;在这些特定的用例中,非结构化数据常常以原始、未标记的形式出现在机器学习工程师的面前。”

使用合成数据对于安全相关的用例也很重要,因为制造商不太可能有着重显示潜在安全因素的图像。Behzadi补充道:“合成数据等技术通过提供准确标记的高质量数据,减轻了机器学习工程师的压力。这些数据可以解释极端情况,从而节省时间和金钱,并避免不准确的数据导致的棘手问题。”

Gramener的物流和供应链SBU负责人Sunil Kardam表示:“计算机视觉的好处包括实时分析、提高效率和改进决策。”Kardam分享了另外几个典型的用例:

Kardam认为,计算机视觉依赖摄像头和先进的算法,比如YOLO、Faster R-CNN和OpenCV。他表示,计算机视觉的机器学习模型“可以在边缘设备或云端处理,智能摄像头和基于云的API提供了强大的功能。”

监测电网

大多数制造都在室内进行,工程师对环境有一定的控制,包括在哪里放置摄像头以及何时添加照明设施。需要使用安装的相机、无人机、飞机和卫星分析室外区域和景观时,计算机视觉用例会比较复杂。

Buzz Solutions的首席技术官、首席运营官兼联合创始人Vik Chaudry分享了一个使用无人机的例子。他说:“计算机视觉被用来监测和识别电网、公用事业公司和变电站的故障,以确保美国各地有可靠互联的电网。依靠从美国各地众多公用事业公司收集的数千个图像,计算机视觉可以准确识别威胁、故障和异常情况。”

电力线火灾是一个值得关注的重要领域。据美国国家跨部门消防中心声称,从1992年到2020年,美国各地发生了3.2万多起电线引燃的野火,加州的第二大野火是由电线太靠近一棵树引起的。公用事业公司现正在评估人工智能的机会,以优化维修,尽量降低风险。

Chaudry说:“由于该软件使用来自现有公用事业公司的真实数据和图像,因此它极其准确,可以识别来自天气、维护不良的基础设施和气温上升的一系列威胁。这项技术可以实现快速高效的维护,同时防止大面积停电和电网引发的灾难。”

脑机接口

展望未来,AAVAA的首席技术官Naeem Komeilipoor透露了计算机视觉和新兴技术设备的新前沿。他说:“在工业环境中使用的脑机接口(BCI)技术可以作为某些工业计算机视觉用例的补充方法,特别是在低能见度、极端温度或摄像头使用受限制的危险环境中。”

在危险条件下完成维修是一种用例,但更常见的用例是当建筑施工、炼油厂工作或其他现场工作需要使用双手来检查或操控机械设备时。

“以工地上进行维修为例。智能眼镜中使用的BCI技术提供了一种替代方法,无需外部摄像头即可跟踪眼球运动,因此工人在艰苦的条件下仍可以正常工作,”Komeilipoor说。“BCI不依赖摄像头,而是通过解读大脑和眼电图(EOG)等生物信号来监测眼球运动。这项技术需要先进的信号处理和机器学习算法,以分析通过专门传感器捕获的眼球运动。”

原文标题:Computer vision's next breakthrough,作者:Isaac Sacolick

关键词:计算机视觉      点击(2)
声明:本站部分内容来自互联网,如有版权侵犯或其他问题请与我们联系,我们将立即删除或处理。
▍相关推荐
更多计算机视觉相关>>>