基于视觉识别的无人零售柜作为无人零售发展的一个重要方向,已经有越来上下游企业参与到产品开发、方案完善、生产制造的环节中。
摄像头作为视觉识别无人零售柜的核心组件,它的图像效果、兼容性、稳定性、可靠性、成本等方面受到各家重视,目前主要分为USB摄像头、IP网络摄像头两大类,其兼容性、稳定性、可靠性与硬件连接、软件传输方式有很大关系。
USB摄像头的优势,在于看视频简单、取流方便快捷,且市面上不同价位的USB摄像头可选型较多。
IP摄像头的优势在于,连接稳定、无兼容性问题、无可靠性问题,应用层开发方便快捷,可较好的实现多路扩展、OSD叠加等业务必须性功能。

笔者以USB、IP两种传输方式的优缺点为切入点,分析摄像头选型的关键。
首先是图像与编码,普通USB摄像头在安防监控、工业视觉、军工、航天等场景应用,对图像及编码要求差异比较大。一些厂家在选型时,大多参考专用视频会议产品,因此我们也纳入专用视频会议方案一起来对比。分析对比详见下表所列:
项目 | MJPEG USB方案 | H264/H265 IP/USB方案 | 4K 高清视频会议方案 IP/USB 3.0 |
成本 | 很低 | 较低 | 很高 |
编码能力 | MJPEG 最简单的编码方式,数据量大一般2MP以上帧率需大幅降低,否则无法通过USB2.0传输 | MJPEG/H264/H265 H264.265转为百万像素高清视频编码设计,大幅提升编码效率、降低码流数据量、节省上传带宽 | H265为主。H265为五百万像素及更高清4K高清视频编码设计,大幅提升编码效率降低码流数据量,节省上传带宽。需注意H265 解码依赖专用解码器 |
图像ISP | 简单2A,AWB,Sharpness,饱和度处理。算法本身硬件固化,不可调。适用与家用普通 USB cam场景 | 3A、AWB、多级锐化、饱和度处理、 WDR、HDR、3DNR 宽动态,3D降噪等等,其中的若干算法模块可以支持二次编程,专门用于行业应用 | 3A,AWB,多级锐化,饱和度处理、WDR.HDR,3DNR 宽动态,3D降噪,其中若干算法模块可以支持二次编程,专门用于行业应用 |
因此,在成本极其敏感的无人零售柜行业,专用视频会议方案的摄像头因为太贵而无法被选择。性价比相对较高的,则是带高清H264编码的IP摄像头。特别是随着视觉AI算法在该领域越来越多的替代人工,对图像的要求也是越来越高。
其次,从图像数据传输的角度来分析,标准ONVIF协议或私有网络协议的IP摄像头的成熟度,比绝大部分UVC协议USB摄像头要高很多。分析对比详见下表所列:
项目 | USB接口传输 | IP网络接口传输 |
硬件连接稳定性与可靠性 | USB接口通用性强,即插即用。但USB-A、USB 4pin端子、USB 5pin端子等接口较多,且USB接口设计之初多用于消费类PC电脑应用场景,未考虑工业应用的复杂场景,抗震动干扰能力差、实际工业应用需要考虑航空插口、卡扣式设计等来提高连接运行稳定和可靠性性 | 标准以太网RJ45接口,行业通用。采用整体锁定机制,连接牢固可靠。可避免衰减、近端串扰、插入损耗、回波损耗和远端串扰等 |
硬件兼容性 | 主板USB口标准,阻抗不统一;更换主板需要与摄像头进行适配 | 标准以太网口设计,硬件统一 |
软件兼容性 | USB传输协议偏重于驱动层。很多安卓主控会在驱动层擅自修改图像参数,导致本来已经在PC机上调试好的图像改变掉 | 底层TCP、UDP协议兼容性完善,参数修改在应用层完成,可控 |
供电 | USB接口供电,主板、HUB供电可能存在隐患 | 标准DC 12V独立电源供电,稳定 |
Android系统安全性 | USB方案大多需要 安卓板root,对系统安全是个隐患 | 与Android主板之间通过应用层通信,无需root |
上层协议开发 | UVC协议主要用来传输视频码流,应用层开发该协议支持的不完善。 多路抓图:USB 主控端 带宽限制问题 导致接入多路USB 摄像头时运行不起来或者抓图缓慢、超时等。 视频流二次开发:USB 摄像头主流支持的格式是MJPG/YUY2 格式,不支持H.264。主流USB摄像头安卓端接入需借助开源库 uvc Camera,但获取MJPG视频流太大,需要解码再编码为H264格式,浪费安卓端资源且安卓底层有些编码参数不开放会造成H264编码文件过大;开源库 uvcCamera 自身代码比较冗杂,需要用户同时具备 C/C++、安卓JNI、java等开放能力才能改动。 | 网络应用层协议开发较为方便快捷。且不需要客户了解onvif,rtsp协议等,可以SDK形式接入,基本不需要用户开发; 多路抓图:可在应用层实现多路抓图业务,亦可多路扩展。 视频流二次开发:IP摄像头普遍支持H.264格式,应用层开发较为方便 |
应用广泛性 | USB多用于消费类场景,工业应用传输视频较少。USB摄像头方案多路接入应用实例不多,接入超过4路稳定性难以把控 | 通信、安防ICT行业应用广泛,工业应用成熟。尽可能的屏蔽硬件因素给客户带来的接入问题,用户只要使用带有线网的任意主控即可接入。从工业应用角度看,通过网络多路接入方案比较成熟 |
由此可见,对相对比安防要求要更严格的7*24H运营的无人零售柜来说,高稳定性意味着更低的货损与运维费用。这笔帐算下来,IP摄像头要划算的多。
综上所述,IP摄像头的性价比,在视觉识别无人零售柜上是相对最高的。
一些厂家早期大部分以MJPEG编码的USB摄像头为主,后来从业内大运营商X宝开始逐步转向IP H264编码摄像头方案开始,如今行业内中出货量越大的厂家越关注底层技术、使用IP摄像头进行产品更新迭代,从而推动无人零售柜行业技术不断向前发展。