您现在的位置是:首页 > 正文

object detection

2024-04-01 05:22:37阅读 1

1.yolo

2.RCNN

步骤:

1.采用selective search生成候选区域(region proposal)

2.将候选区域输入到一个预训练的网络(fine-tuning)

3.每个类别训练一个SVM分类器,用regressor对候选框进行回归

缺点:

时间和内存消耗太大,训练SVM和回归的时候都需要用网络生成的特征作为输入

3.Fast R-CNN

4.Faster R-CNN

faster r-cnn示意图
https://github.com/yhenon/keras-frcnn(deprecated)

https://github.com/softberries/keras-frcnn

https://github.com/small-yellow-duck/keras-frcnn

https://github.com/fizyr/keras-retinanet

vgg中,con3_64,表示卷积核为(3, 3),filters数目为64
vgg
SPP-net: spatial pyramid pooling ,空间金字塔池化层,放置在卷积层和全连接层之间,对特征图像进行压缩处理,避免了在进入卷积层之前要对图像进行截取(crop warp),卷积层对图像的尺寸没有限制,但全连接层对尺寸有限制。

bag of words: 词袋模型,常用于语言识别,句子是由多个关键词构成,通过关键词可以对句子进行表示。应用在图像识别中,整体图像可以由局部的图像组成。局部的图像组合在一起即为词袋,可以用于表示整体图像。

loss function

对两类anchors会打上正标签:(1)与实际(ground-truth)box的IoU(Intersection-over-Union)值最大,(2)与实际box的IoU值超过0.7
以第二个条件为依据可以满足大多数情况

如果IoU值低于0.3则为负标签

如果某个anchors即非正也非负,则不会作为训练对象

anchors

对于1000 x 600的图片,大概有20000(≈ 60 x 40 x 9)个anchors,9是3种纵横比,3种分辨率之积,60是1000/16,40是600/16,经过vgg后,图片会从(A,B,3)变为(A/16,B/16,512),详情见VGG-16

忽略掉跨过边界的anchors,每张图片还剩余6000个anchors,进过NMS(非最大抑制,阈值为0.7),剩余2000张候选区域(proposal regions)

5.Mask R-CNN

https://github.com/matterport/Mask_RCNN

案例
点击
点击

网站文章

  • MultiProcess进程池的设计(三)主进程和子进程间的通信

    在前面的章节我们已经详细介绍了多进程的用途及多进程的启动关闭。这个章节是多进程的一个核心章节,主要是介绍多进程的通信。一个大型的平台或者一个大型的系统往往具备一个多个进程,但是有些进程未必是在启动时候就有一定的任务,有时候它会空闲下来,在主进程没有下放任务的时候,子进程会空闲等待。但是在主进程有工作任务的时候,子进程必须要启动,完成相关的操作。    还有在子进程完成任务时候也要告知主进程相关

    2024-04-01 05:21:55
  • pyecharts简单实用,折线图,箱型图,多饼图/玫瑰图,世界图

    pyecharts简单实用,折线图,箱型图,多饼图/玫瑰图,世界图

    pycharts简单使用前言一、折线图二、箱型图三、饼图/玫瑰图四、世界图总结 前言 借一次小项目(小到练手的,嘿嘿),第一次接触到pyecharts,使用感觉嘎嘎舒服,在这里记录一下,一共四张图,折...

    2024-04-01 05:21:47
  • 软件设计七大原则

    软件设计七大原则http://c.biancheng.net/view/8508.html

    2024-04-01 05:21:38
  • Java中的UDP通信(网络编程 一) 最新发布

    Java中使用UDP通信的基本原理

    2024-04-01 05:20:58
  • Spring注入:配置与注解 热门推荐

    之前在某电商公司的时候也接触过一点Spring,不过了解不深,只是大概知道这个东西的存在。现在在一家公司实习的时候,才系统的看了一下Spring,这个框架网上的解释都很多,但主要都会介绍一下关于spring注入这一点,其实spring还有拦截的功能,而spring本身又是可以通过注解来使用,也可以通过配置文件使用,比较复杂,这里粗略介绍spring的注入层面,后面也许会写一篇关于spring MV

    2024-04-01 05:20:51
  • LambdaTest

    LambdaTest

    真机测试

    2024-04-01 05:20:42
  • linux的网卡配置device,linux网卡配置讲解

    ifconfig 网卡名称 (查看网卡信息,不加则为查看所有up状态网卡信息)ifconfig 网卡名称 IP地址/掩码ifdown 网卡名称ifup 网卡名称service network rest...

    2024-04-01 05:20:35
  • Ext学习1——登录页面

    Ext学习1——登录页面

    学习Ext 组件使用,描绘一个登陆页面。 1. 首先在页面中心放置一个window 窗口,窗口不可拖动,不可放大缩小,不能关闭。 2. 在窗体内部放置一个 Form,form使用水平布局( layout: { type:'vbox',align:'stretch' } ) ,使用flex 比例将Form水平

    2024-04-01 05:19:57
  • C++多线程:创建两个线程,其中一个输出1-52,另外一个输出A-Z。输出格式要求:12A 34B 56C 78D

    【代码】C++多线程:创建两个线程,其中一个输出1-52,另外一个输出A-Z。输出格式要求:12A 34B 56C 78D。

    2024-04-01 05:19:50
  • Spring Cache

    Spring Cache

    spring cache的简单使用

    2024-04-01 05:19:42