在视觉算法落地应用产业的过程中,通常伴随着碎片化的算法定制需求,在这里,我们阐述一下哪些因素是决定算法定制难度的关键点,如下(表格描述的要素能覆盖99%的算法定制需求):
要素 | 描述 | 举例说明 |
---|---|---|
目标在画面中的大小占比 | 目标大的容易定制;目标小的难度高 | 假设相同视距,识别车辆容易,识别老鼠困难 |
判断目标有无还是判断目标状态 | 判断目标有无,容易;判断目标状态,困难 | 识别区域内是否存在一个人,则是判断目标有无,容易;识别区域内人体是否处于跌倒状态,困难 |
颜色特征 | 颜色特征丰富的好识别;颜色特征单调的,不好识别 | 火焰,颜色鲜艳;烟雾,颜色特征单调且不鲜艳 |
外形特征 | 外形特征丰富且固定的,容易;外形特征不丰富或多变的,困难 | 人体有四肢、头部、躯干,属于外形特征丰富,包括车辆,也算丰富;烟雾,外形特征不丰富且外形不固定 |
目标大小

正如上文中表格所描述的,其实在人工智能视觉领域,小目标检测一直是一个重要的技术课题,虽然业界一直有各种的论文致力于解决该类问题,如金字塔神经网络结构等,但是直到今天,仍然没有较好的解决方案。更多的是在产业实践过程中,拉近镜头举例,以便提高目标物体在画面的占比。最最典型的小目标识别就是老鼠检测,业界没有好的解决方案来攻克常规安防相机识别老鼠的问题。
目标是否存在还是目标状态判断

当我们判断一个目标是否在视野中存在的时候,是容易定制的。比如人员入侵、抽烟识别、安全帽检测,都是比较容易定制的。但是如果需要识别目标物体的状态,则属于难度较高的定制,比如判断人体是否处于跌倒状态等。 定制难度高的根本原因,源自于视觉算法的理论基础CNN,也就是通常所说的卷积神经网络,卷积神经网络最大的特点是不区分目标物体的方向。也就是在训练一个视觉算法模型的时候,给与神经网络结构的图片无论是正的、反的、斜的,都不影响模型的学习训练。
颜色特征

颜色特征不丰富的如烟雾、老鼠(保护色)等,在视觉算法定制任务重,难度都颇高。当然了,与其说是颜色特征不丰富,倒不如说目标物体和背景色的对比度,如果将烟雾放在纯黑色的背景或者将老鼠放在纯白色的灶台,则会变得好识别。
外形特征
外形特征不丰富且形状多变,最典型的目标就是烟雾,相当于颜色特征和外形特征已经无法在模型训练的过程中起到重要的作用。定制识别起来显得尤为困难
总结
本文只是罗列了最常见的判断算法定制难度的依据,当然,用户的需求是千变万化的,仍然有一部分并不在本文的讨论范围之中,比如有的需要定制识别人员工序化流程合规性等,都要单独评估分析。 读者朋友们通过学习本文,可以量化的判断算法模型的定制难度和成本,同时,也送给大家一个定性的判断标准,就一句话:肉眼容易分辨的,容易定制;肉眼辨认困难的,成本高。
回复