Skip to content

一种轻量型的抓取检测网络模型,基于康奈尔抓取检测数据集,平均准确率90%,速度70FPS

Notifications You must be signed in to change notification settings

missFuture/light-weight_grasp_detection

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 

Repository files navigation

light-weight_grasp_detection

一种轻量型的抓取检测网络模型,基于康奈尔抓取检测数据集,平均准确率90%,速度70FPS

抓取检测概述

本课题主要研究复杂场景下的多目标机器人抓取检测问题,抓取检测指的是给定一个物体,找到一种满足抓取任务需求的夹具抓取配置。该课题属于计算机视觉中目标检测范围,大部分目标检测研究的是物体 种类以及物体的具体位置信息, 抓取检测一般不需要对物体进行识别,给出有效的抓取框即可,该抓取框一般是带有角度(见下图所标注)。抓取配置可以由五参数法表示:

g = {θ, x, y, w, h}

具体的示意图可参考:

数据集概述

抓取检测唯一公开的是2011年康奈尔大学提出的Cornell Grasping Dataset。该数据集包含240中物品,885张图片,每一个样本中标注了若干有效抓取框和无效抓取框。部分样本可见下图:

数据集预处理

数据增强

由于数据集较为匮乏,为了防止过拟合, 需要对数据集进行数据增强。主要是对原始图像进行旋转,平移,裁剪,像素级变换等处理,每一个样本经过增强后大致能得到100个样本。

角度变换

如果沿用直接回归五参数的方法,模型的泛化性能收到很大影响。同时,考虑到抓取检测模型对角度的要求并非十分苛刻,角度相差一点还可以正常进行抓取,然后对于位置信息却不行,所以对角度信息做了分类处理。

抓取检测模型

采用一种轻量型目标识别网络SqueezeNet.该网络的特点在于:采用模块化的设计思想,模块有Squeeze层和Expand层,极大的减少参数量。设计原则如下:

  • 1.使用1∗11∗1卷积代替3∗33∗3 卷积:参数减少为原来的1/9
  • 2.减少输入通道数量:这一部分使用squeeze layers来实现
  • 3.将欠采样操作延后,可以给卷积层提供更大的激活图:更大的激活图保留了更多的信息,可以提供更高的分类准确率
    抓取模型如图所示:

抓取检测结果

在CGD上面进行测试,得到最后的平均准确率是90%, 速度超过50帧(GTX Titanx)。部分测试结果如图所示(左侧:正确,右侧:错误)。

About

一种轻量型的抓取检测网络模型,基于康奈尔抓取检测数据集,平均准确率90%,速度70FPS

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published