为更加清晰的描述定制化算法需求,保证算法开发准确性与交付质量。请仔细阅读需求说明文档的撰写要求。
0. 定制须知
- 定制算法前需确认算法需求是否属于【图像处理】【视频分析】【机器视觉】【多模态大模型】领域。如果是,请继续阅读以下文档。如果不是,请联系销售人员评估。
- 定制算法是运行于智驱力智能分析盒子或智能分析服务器产品上。目标设备非智驱力产品,联系销售人员评估。
- 定制算法的开发周期是需求明确且数据到位后1-2周,紧急上线的客户需加快需求沟通与数据采集进度。
- 定制算法是以算法包的形式交付,无需联调与现场调试。
- 定制算法初次上线可能存在误报,对于误报情况,需迭代2-3轮达到目标效果。
1. 需求说明
1.1. 整体描述
需清晰描述算法的业务需求。业务需求与算法逻辑依次说明。建议使用以下方式。
需求点 | 需求描述 | 业务逻辑 |
---|---|---|
轨道障碍物检测 | 识别矿车轨道上的人员、大石块、前方机车三种障碍物。并输出障碍物到车头的距离。 | 摄像头安装于矿车车头上方。前向捕获轨道画面。当识别到画面中的轨道上存在人员、大石块、前方机车三种障碍物,触发告警,并计算障碍物到车头的距离。告警数据可通过http接口推送。 |
大块矿石检测 | 识别下料口放矿机上的大块矿石。 | 摄像头视角可清晰覆盖下料口。当识别到下料口放矿机上的大块矿石触发告警。告警数据可通过http接口推送。 |
1.2. 附图说明
提供每个需求点的附图,并详细说明业务需求。如检测的目标、正样本(正常状态)、负样本(异常状态)以及告警触发时刻等。以轨道障碍物检测算法为例进行说明。
1.2.1. 轨道障碍物检测算法
对检测场景进行描述。举例说明,如上,摄像头安装于矿车车头顶部。检测位于轨道上的障碍物。并输出障碍物到车头的距离。
图文结合,说明算法检测业务逻辑与需求点。举例说明。提供需求中的人员、大石块、前方机车三种目标障碍物的【摄像头视角下】的现场画面(不要使用手机拍摄)。并说明整体逻辑与需求要点。
详细需求描述:
- 整体逻辑:检测到位于轨道上的人员、大石块、前方机车产生告警,输出障碍物至机车距离。
- 需求点1: 算法自动检测轨道(直道、弯道)。
- 需求点2: 位于轨道内的障碍物告警,其余位置无需关注。
- 需求点3: 告警时标注轨道目标、障碍物目标与距离。
1.2.2. 大块矿石检测算法
图文结合,说明算法检测业务逻辑与需求点。举例说明。提供大块矿石【摄像头视角下】的现场画面。并说明整体逻辑与需求要点。
详细需求描述:
- 整体逻辑:在蓝色框内检测到大块矿石告警。肉眼观测超过上图红色框大小的矿石,判定为大块矿石。
- 需求点1: 只关注下料口位置的大块矿石。
- 需求点2: 可设置大块矿石的像素阈值,超过像素阈值的告警。
1.3. 能力要求
详细描述每个定制化需求的能力要求,智驱力进行技术可行性评估。使用如下例子进行说明。
需求1:轨道障碍物检测算法
- 可检测出30m以内,肉眼可见的人员、大石块、前方矿车目标。
- 检测准确率不低于90%。
- 检测帧率不低于10帧/秒。
需求2:大块矿石检测算法
- 可检测出10m以内,肉眼可见的放矿机下料口大块矿石。
- 检测准确率不低于90%。
- 检测帧率不低于2帧/秒。
1.4. 补充资料
为更加高效的评估定制算法的可行性与开发费用。除以上说明外,需提供如下内容。
- 提供需求点中多场景的摄像头视角下视频或图像素材(需求评估用,不是开发用)
比如:轨道障碍物检测算法。提供不同场景下轨道与障碍物素材。比如,
- 隧道内光线明亮视频或图片素材。
- 隧道内光线不足视频或图片素材。
- 隧道外光线明亮视频或图片素材。
- 隧道外光线不足视频或图片素材。
- 技术补充资料(需求评估用,不是开发用)
比如,额外的告警推送字段需求。提前告知智驱力,以便评估可行性。比如,
- 希望在轨道障碍物检测算法告警推送中,增加障碍物距离的字段。
- 希望在告警快照的障碍物label中增加距离显示。
2. 开发说明
完成需求文档的技术评估、双方签订技术服务合同、款项到位且数据到位后。智驱力将启动定制算法开发工作。各部分的详情如下。
2.1. 数据采集
2.1.1 采集要求
安装完成摄像头并调整完成角度采集如下视频素材。每个场景采集5-10段,3-5分钟的有效视频片段。(注:在摄像头安装或角度调试过程中,可申请智驱力技术支持),采集场景尽量覆盖全场景,且具备多样性。
- 场景1:不同光线、距离下的5-10段3-5分钟有效视频。
- 场景2:不同光线、距离下的5-10段3-5分钟有效视频。
- ...
注:有效视频是指包含需求中检测目标的视频。视频应当包含正负样本,即正常的与异常的,建议正常与异常数量比例1: 1。
视频采集方式如下。
- 在浏览器中输入摄像头IP地址,登录摄像头管理页面;
- 点击①处【录制】按钮,再次点击【录制】按钮保存素材;
2.1.2 数据发送
将采集的视频文件进行整理。文件夹建议结构如下。
将采集的视频压缩成zip文件,通过【网盘链接】的方式分享至算法定制群,有技术人员负责对接与视频质量验证。
2.2. 算法开发
数据集到位后,智驱力将负责数据处理、数据标注、模型训练、算法开发&测试全部工作。整个开发周期是数据到位后1-2周。
2.3. 算法交付
算法开发完成后,将进行算法交付,包括如下内容。
- 算法包。开发完成的算法包,直接从【算法仓库】-【算法导入】中导入,并在【视频接入】中绑定算法生效。
- 使用说明。提供定制化算法的使用说明文档,指导算法配置与使用。
2.4. 算法优化
若视频数据场景多样性不足,初次上线可能存在漏报或误报。如出现以上问题。处理方法如下。
结语
每个算法需严格按照场景要求与工勘约束配置使用。为此,我方在技术评估后,会明确给出算法的使用条件与能力上限,以便在现场投产中达到使用预期。因此,定制算法在需求沟通中需保持清晰、明确、高效的沟通,从而确保算法快速、精准落地。
回复