1、目标检测目标检测(Object Detection)是人工智能最基础的应用,不论是我们常见的人脸识别,还是高大上的自动驾驶,都离不开目标检测。目标检测不仅要用算法判断图片中是不是一只狗,还要在图片中标记出它的位置,用边框或红色方框把狗圈起来。R-CNNR-CNN原理原理R-CNN(SelectiveSearch+CNN+SVM)利用候选区域与CNN结合做目标定位,借鉴了滑动窗口思想,R-CNN采用对区域进行识别分为三个步骤:给定一张输入图片,从图片中提取2000个类别独立的候选区域。对于每个区域利用卷积神经网络(CNN)抽取一个固定长度的特征向量。再对每个区域利用支持向量机SVM进行目标分类。
2、YOLOYOLO原理原理YOLO预测步骤:1.对输入图像进行缩放。2.将图片送入到卷积神经网络中进行预测。3.对预测的结果进行置信度的阈值处理,得到最终的结果。YOLO预测过程YOLO是单阶段检测算法,整张图片被分割成7*7=49个格子(Cell)每个bbox都对应一个置信度,置信度分数反映了该模型对框内是否包含目标的信心,以及它对自己预测的准确度的估量。选择一个格子作为代表,这个格子就负责(responsible)此物体对象的预测。预测矢量每个网格预测2个bbox位置以及20个类别的概率。每个bbox要预测(x,y,w,h)和置信度共5个值,因此网络模型输出变量维度为7x7x(5*2+20)=30Keras口罩检测项目实战使用YOLOv3框架训练一个口罩检测模型,使用该模型进行预测。YOLOv3是由JosephRedmon和AliFarhadi提出的单阶段检测器,该检测器与达到同样精度的传统目标检测方法相比,推断速度能达到接近两倍。项目使用基于keras的YOLOv3版本,代码网址:https:/