lstm-rcnn-pedestrian-detection, 在TensorFlow中,使用更快的R CNN进行行人检测

分享于 

3分钟阅读

GitHub

  繁體 雙語
Pedestrian Detection with Faster R-CNN in TensorFlow
  • 源代码名称:lstm-rcnn-pedestrian-detection
  • 源代码网址:http://www.github.com/buffer51/lstm-rcnn-pedestrian-detection
  • lstm-rcnn-pedestrian-detection源代码文档
  • lstm-rcnn-pedestrian-detection源代码下载
  • Git URL:
    git://www.github.com/buffer51/lstm-rcnn-pedestrian-detection.git
    Git Clone代码到本地:
    git clone http://www.github.com/buffer51/lstm-rcnn-pedestrian-detection
    Subversion代码到本地:
    $ svn co --depth empty http://www.github.com/buffer51/lstm-rcnn-pedestrian-detection
    Checked out revision 1.
    $ cd repo
    $ svn up trunk
    
    lstm-rcnn-pedestrian-detection

    这个库包含了支持我在UC伯克利的研究实习,为所有( 矿井 Paristech ) 和Berkeley深驱动联盟的工业座椅驱动器。

    基于深度学习方法的行人检测研究。 虽然由于时间限制,我没有时间得到广泛的结果,但是代码处于工作状态。 查看下面的结构。

    方法

    我所探索的方法是基于更快的r cnn框架( 请参见这里的: 使用的caffe的python 代码)的primarly。

    在统一神经网络中,第一部分称区域提议网络为感兴趣区域生成建议,然后一个分类器为它的生成标签。

    当关注行人检测时,由于生成建议已经在'背景'和'行人'之间进行分类,所以分类器变得。 在本文中,我尝试删除分类器并训练一个更深的来处理变化。 这已经在微软的另一个研究论文 studied了,即使只有,也能取得良好的结果。

    我计划调查的另一方面是在的输出中使用LSTM单元来包含上下文,这有希望改善结果。 这里代码中不存在。

    数据集

    我的实验是在 Caltech的行人数据集上做的。 它是由 250k 张带有行人annoted的图像组成的数据集。 在他们的网站上可以找到更多信息。

    代码结构

    有关处理数据集(。从图像和注释生成输入&输出)的代码可以在 caltech-dataset/ 下找到。 这包括 python 代码以及我用来读取数据集( 查看 caltech-dataset/README.md )的几个存储库。

    vgg16/ 文件夹包含将卷积神经网络 VGG16的pretrained模型转换为 / 格式的代码。

    最后,主要脚本建立了神经网络,训练&日志为 region_proposal.py。 它可以用于训练 caltech-dataset/caltech.py 中参数的模型,从而节省每几个时期。 它还可以期望的格式为Caltech数据集的预期格式生成结果,从训练的模型中评估。


    fast  Detect  检测  faster  
    相关文章