用darknet训练自己的数据

本篇博客采用darknet训练自己的数据，那么在训练自己的数据之前，我们得先拥有自己数据，怎么得到呢?只能自己做了

安装labelImg

我用过精灵标注助手和labelImg两款标注工具，标注后得出得XML不一样。本篇博客采用labelImg工具标注图片。

环境：python3、ubuntu18.04

sudo apt-get install pyqt5-dev-tools
sudo pip3 install lxml

下载labelImg源码

git clone https://github.com/tzutalin/labelImg.git

进入labelImg目录下

cd labelImg

再make qt5py3，建议不要make all。出现下面这种结果即为成功

然后python3 labelImg.py。出现界面即为成功。woc，这是我最顺利的一次。

制作自己的数据集

首先进入darknet目录下，再目录下新建文件夹VOC2019，并在VOC2019下新建Annotations，ImageSets，JPEGImages三个文件夹。在ImageSets新建Main文件夹。

将自己的数据集图片放到JPEGImages目录下，将标注文件放到Annotations目录下。接着开始标注数据。过程就随便说以下。[Open Dir]或Ctrl+u选择要标注的图片所在的根目录，[CreateRectBox]或w开始标注，鼠标框选目标区域后选择对应的标签类别,按空格或Ctrl+s保存，[Next Image]或d切换到下一张图片，标注错误的选框可选中后按[Delete]删除。要注意的是，如果不是使用原有的目标检测物体的类别，我们要打开data/predefined_classes.txt，修改默认类别为要检测的类别。

接着再VOC2019下新建test.py文件，将以下代码拷贝进去。在ImageSets的Maxin文件夹下将生成四个文件：train.txt，val.txt，test.txt，trainval.txt。

import random
import os
trainval_percent = 0.1
train_percent = 0.9
xmlfilepath = 'Annotations'
txtsavepath = 'ImageSets\Main'
total_xml = os.listdir(xmlfilepath)

num = len(total_xml)
list = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list, tv)
train = random.sample(trainval, tr)

ftrainval = open('ImageSets/Main/trainval.txt', 'w')
ftest = open('ImageSets/Main/test.txt', 'w')
ftrain = open('ImageSets/Main/train.txt', 'w')
fval = open('ImageSets/Main/val.txt', 'w')

for i in list:
    name = total_xml[i][:-4] + '\n'
    if i in trainval:
        ftrainval.write(name)
        if i in train:
            ftest.write(name)
        else:
            fval.write(name)
    else:
        ftrain.write(name)

ftrainval.close()
ftrain.close()
fval.close()
ftest.close()

YOLOV3的label标注的一行五个数分别代表类别（从 0 开始编号）， BoundingBox 中心 X 坐标，中心 Y 坐标，宽，高。这些坐标都是 0～1 的相对坐标。和我们刚才标注的label不同，因此我们需要下面的py文件帮我们转换label。

wget https://pjreddie.com/media/files/voc_label.py

也可以在windows下好了拷到ubuntu下。总之把这个文件放到darknet文件夹下。打开voc_label.py文件，修改sets和classes。sets如下，classes根据自己的类别需要修改。

打开终端输入python voc_label.py，于是在当前目录生成三个txt文件2019_train.txt，2019_val.txt，2019_test.txt。在VOCdevkit文件夹下的VOC2019也会多生成一个文件夹labels。点开里面的文件就会发现以及转化成YOLOv3需要的格式了。数据集的制作完成，bingo！！！