今日消息,电商巨头亚马逊准备消灭“条形码”。
机器人也许是未来,但机械臂显然不擅长使用一种古老而又稳定的技术形式:条形码。电商巨头亚马逊本周五表示,条形码很难找到,而且可能会被贴在奇形怪状的产品上,这是机器人无法很好地解决的问题。于是,亚马逊准备消灭掉这项技术。
用“图片训练计算机模型”解决
对于亚马逊即将舍弃“条形码”后给出的解决方案是:利用亚马逊仓库里物品的图片训练计算机模型。
据悉,该公司开发了一种摄像头系统,可以逐个监控从传送带上经过的物品,以确保它们与图片相符。最终,亚马逊的人工智能专家和机器人专家希望将这项技术与机器人结合起来,让机器人在拾取和翻转物品的同时识别物品。
亚马逊的人工智能专家必须首先建立一个产品图像库,在这个项目之前,该公司没有理由这样做。图像本身以及有关产品尺寸的数据为早期版本的计算机视觉算法提供了素材,摄像机不断捕捉产品的新图像来训练模型。
“解决这个问题,让机器人可以在不需要查找和扫描条形码的情况下拾取物品并进行处理,这是最根本的,”亚马逊柏林计算机视觉部门的应用科学经理诺塔斯・安东纳克斯(Nontas Antonakos)表示,“这将帮助我们更快、更准确地将包裹送到客户手中。”
这个被称为多模式识别的系统不会很快完全取代条形码。亚马逊表示,目前,该系统已在西班牙巴塞罗那和德国汉堡的仓库中投入使用,已经加快了那里处理包裹的时间。这项技术将在亚马旗下各个业务部门共享,所以它未来可能会被用于全食超市或其他亚马逊实体连锁店。
亚马逊表示,该系统的错误率不高,把不正确的商品发送给客户的问题不经常出现。但是考虑到一个仓库一天要处理许多物品,即使是不常见的错误叠加起来也会导致严重误工。
亚马逊算法第一次使用时的准确率在75%到80%之间,这被亚马逊视为一个不错的开始。亚马逊表示,目前的准确率已达到99%。不过该系统在最初使用时遇到了故障,无法捕捉颜色差异。在Prime Day促销期间,这个系统无法区分两种不同颜色的Echo Dots智能音箱。
亚马逊人工智能团队表示,微调多模式识别系统来评估由人处理的产品将是一个挑战,这就是为什么其最终目标是让机器人来处理这些产品的原因。
那么,人类的视觉系统可以复制吗?
答案是肯定的。
复制“人类的视觉系统”
计算机视觉技术的不断普及,让机器识别和处理图像就像人的大脑一样,且速度更快、更准确。机器・像人类一样去“思考”。
计算机视觉是近年来人工智能增长最快的领域之一。计算机视觉技术集数字图像处理、数字信号处理、光学、物理学、几何学、应用数学、模式识别及人工智能等知识于一体,其应用已经涉及到计算机和、计算机图形学、图像处理、机器人学等领域。
许多计算机视觉应用已经投入使用,且正在以更快的速度、更大的规模去尝试模仿人类观察和理解周围世界的能力。
在自动驾驶领域,计算机视觉的图像识别功能使汽车能够识别行人、道路标志及行进路线中的其他重要特征;在医疗领域,医生利用计算机视觉技术支持来自CT、放射线图像和其他成像工具的诊断;在电子商务领域,企业依靠计算机视觉推动广告投放和识别不安全的品牌内容等等。
不可否认的是,各行各业的企业都将受益于计算机视觉解决方案,助力其准确高效地实现业务流程自动化。而用于计算机视觉的深度学习基于神经网络,它需要大量的高质量训练数据并适当调整变量,以达到让机器学会识别目标对象、而无需其他指导的目的。
图像的识别功能
图像的识别过程实际上可以看作是一个标记过程,即利用识别算法来辨别景物中已分割好的各个物体,给这些物体赋予特定的标记,它是计算机视觉系统必须完成的一个任务。
按照图像识别从易到难,可分为三类问题。第一类识别问题中,图像中的像素表达了某一物体的某种特定信息。
第二类问题中,待识别物是有形的整体,二维图像信息已经足够识别该物体,如文字识别、某些具有稳定可视表面的三维体识别等。
第三类问题是由输入的二维图、要素图、2×5 维图等,得出被测物体的三维表示。这里存着如何将隐含的三维信息提取出来的问题,是当今研究的热点。
目前用于图像识别的方法主要分为决策理论和结构方法。决策理论方法的基础是决策函数,利用它对模式向量进行分类识别,是以定时描述(如统计纹理)为基础的;结构方法的核心是将物体分解成了模式或模式基元,而不同的物体结构有不同的基元串(或称字符串),通过对未知物体利用给定的模式基元求出编码边界,得到字符串,再根据字符串判断它的属类。这是一种依赖于符号描述被测物体之间关系的方法。