Giter VIP home page Giter VIP logo

darknet_demo's Introduction

darknet

Darknet Logo

项目介绍

refer from the https://github.com/pjreddie/darknet, use the yolov3-tiny.cfg prototxt to train own captche detector 本项目使用https://github.com/pjreddie/darknet, 基于darknet yolov3-tiny.cfg

软件架构

基于深度学习框架darknet,使用darknet训练的模型,自由切换cpu模型或者gpu模式处理代码

文件夹说明

  • cfg - 模型定义文件所在,类似网络的结构定义
    • deploy.cfg - 部署的模型定义文件
    • train.cfg - 训练的模型网络定义文件
    • yolov3-tiny.cfg - 原始小网络定义文件
    • yolov3.cfg - 大网络文件
  • data - 训练配置,实际训练数据所有
    • char.names - 分类列表文件
    • train.data - 训练的配置文件,包含各种选项
    • train.txt - 实际训练数据,整体数据的80%
    • val.txt - 验证数据集,一般整体数据的20%
  • imgs - 训练图片所在
    • 1.jpg - 图片实际地址
    • 1.txt - 图片标的框
      • 0 0.2984375 0.553125 0.115625 0.24375000000000002 - 类别 x,y ,w ,h
  • label - xml 文件,标的那些框所在
  • session - 训练保存的文件夹所在
  • weights - 迁移学习的原始框架所在,原始的训练的权重文件
  • config.py - data.py的配置文件
  • data.py - 输入 image , label 文件夹,输出train.txt 训练文件

使用说明

  1. 准备原始的验证码数据图片文件
  2. 下载 https://github.com/tzutalin/labelImg 标注工具,生成到本地的label文件夹下,图片文件要与标注的xml文件一致
  3. 使用data.py 生成训练文件
  4. 进入weights文件夹,sh darknet53.sh 下载好预训练的权重文件
  5. 使用train.sh 开始训练

darknet_demo's People

Contributors

brucedone avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar

darknet_demo's Issues

训练出的模型检测不到物体

大神你好!
我也在用Yolo V3来做一个class的物体识别。我的项目是在一个页面里面找手写的签名。我看了一下我们的数据应该比较相似。

但我有个问题不知道能不能麻烦您解答一下:我的数据差不多是10000张图片,现在训练了6000步 (GPU),avg loss什么的也都是0.3左右比较稳定了。它的输出在这里:
Region 82 Avg IOU: 0.851243, Class: 0.999658, Obj: 0.751877, No Obj: 0.003065, .5R: 1.000000, .75R: 1.000000, count: 1
Region 94 Avg IOU: 0.922397, Class: 0.999154, Obj: 0.857456, No Obj: 0.000260, .5R: 1.000000, .75R: 1.000000, count: 1
Region 106 Avg IOU: -nan, Class: -nan, Obj: -nan, No Obj: 0.000000, .5R: -nan, .75R: -nan, count: 0
6239: 0.343649, 0.314431 avg, 0.000100 rate, 30.336593 seconds, 399296 images Loaded: 0.000050 seconds

我的Yolo模型配置是按照这里改的:https://www.cnblogs.com/codefish/p/10104320.html, 只不过测试的时候就是用YOLO自带的测试工具:
./darknet detector test cfg/signature.data cfg/yolov3-signature.data.cfg yolov3-signature.data.weights data/test.png

但是我用Yolo V3标配的test来测试的时候总是检测不到任何物体,predictions.png那个文件就是我上面的test.png,并没有识别出任何物体,不知道您有没有遇到过类似的问题?谢谢!

关于[yolo]层数

train.cfg 中filters=(class+5)*3 这里面的3是有三层yolo层的意思吗?

为什么train.cfg只有两层【yolo】函数 ,这个会有影响吗,多谢指点

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.