跑tangent convolution代码笔记

前期准备工作

首先clone一下代码

git clone https://github.com/tatarchm/tangent_conv.git

根据Pre-prequisites：

python == 3.6
tensorflow >= 1.3
joblib

用docker pull下tensorflow的镜像

docker pull tensorflow/tensorflow:1.3.0-gpu-py3

用nvidia-docker创建容器，将tangent convolution的代码挂载进去，可以同时挂载自己需要的数据集

nvidia-docker run -it \
-e DISPLAY -e="QT_X11_NO_MITSHM=1" -e GDK_SCALE -e GDK_DPI_SCALE \
-v /tmp/.X11-unix:/tmp/.X11-unix \
-v '/home/youkenhou/tangent_conv':/tangent_conv \
tensorflow/tensorflow:1.3.0-gpu-py3 bash

打开容器之后安装joblib 更新：这里需要安装joblib 0.11版，否则跑semantic3d会出错。

pip3 install joblib

根据说明进行下一步，clone作者提供的Open3D

git clone https://github.com/tatarchm/Open3D.git

cd Open3D
util/scripts/install-deps-ubuntu.sh

经过以上步骤会装好Open3D编译所需的环境。但是在这里install-deps-ubuntu.sh会安装python2，导致之后的cmake会默认使用python2，而无法正确编译，之后会报No module named 'py3d'错误，所以要进行以下的步骤。

首先安装cmake

apt-get install -y cmake automake

再稍微修改作者提供的步骤，指定python3的位置

mkdir build
cd build
cmake -DPYTHON_EXECUTABLE:FILEPATH=/usr/bin/python3.5 ../src
make

以上修改参照这里。

编译好之后进入build/lib，确认是否成功编译了py3d

python3
>>> from py3d import *
>>>

能够import py3d说明成功了，接下来按照说明添加Open3D以及tangent convolution的路径。

打开tangent_conv/util/path_config.py，修改两行代码

open3d_path = '/tangent_conv/Open3D/build/lib/'
tc_path = '/tangent_conv/'

接下来就可以利用作者提供的脚本下载数据集并处理，这里下载了semantic3d的数据，一点小修改，需要把python改成python3，否则就会提示No module named 'py3d'

python3 get_data.py <directory_for_downloaded_files> <desired_output_directory> semantic3d

运行过程中可能会提示No module named 'wget'，只要安装wget就可以了

pip3 install wget

脚本运行过程中还会出现sh: 1: 7z: not found的错误，是因为没有安装解压软件

apt-get install p7zip-full

再次运行脚本，就可以开始下载semantic3d数据集了。注意这个数据集很大，要留好硬盘空间。

precompute.py中有旋转数据集以扩大的代码rotation，会把一个数据旋转八次，占巨大空间。

作者的semantic3d数据读取部分有些bug，所以没有跑通。更新：上面装好joblib==0.11就不会有bug了

上述容器配置好之后，可以使用commit将容器保存为新的镜像

commit $container id$ tangent_conv:v1

之后再进行实验就可以利用新的命令

nvidia-docker run -it --rm --cpus=6 -m 24576M -p 6006:6006 \
-e DISPLAY -e="QT_X11_NO_MITSHM=1" -e GDK_SCALE -e GDK_DPI_SCALE \
-v /tmp/.X11-unix:/tmp/.X11-unix \
-v '/home/youkenhou/tangent_conv':/tangent_conv \
tangent_conv:v1 bash

--cpus可以限制容器使用的cpu数，-m可以限制容器使用的内存量，-p可以映射端口，进行tensorboard查看。

将阿里点云分割比赛的数据集转换为网络输入的数据格式

阿里点云分割比赛的训练集数据格式：pts文件夹包含了点云xyz坐标信息，intensity文件夹包含了点云强度信息，label文件夹包含了点云的分类，这三个文件夹中的文件名、文件个数都是对应的。

假设一个文件为12345.csv，pts/12345.csv是一个n行3列的数组，intensity/12345.csv是一个n行1列的数组，label/12345.csv是一个n行1列的数组。

tangent convolution的输入格式是n个文件夹，根据文件夹的名字来定义每一个输入文件，每个文件夹中包含了一个scan.pcd文件和一个scan.labels文件，根据作者的数据处理代码可以将阿里的数据pts转换为scan.pcd，label文件可以直接复制为scan.labels，改个名字就可以。脚本文件参考data_pre-process.py。

按照作者提供的步骤，下一步应该编写config.json文件，参照semantic3d的格式修改一些参数。记录一些参数的含义：

"pre_min_cube_size"：室内场景为0.05，室外场景为0.1，应该是点云分割块的大小；
"pre_num_rotations"：precompute时旋转的次数，如果数据集够大的话，可以把值改为1；
"pre_dataset_dir"：训练集所在的位置，如果进行测试的话需要改为测试集的位置；
"pre_output_dir"：保存precompute结果的位置，同样，测试的话需要改为测试集precompute的位置；
"pre_dataset_param"：类别的名字，可以随便取，但是之后在model.py等文件中也要改成同样的名字；
"co_train_file"：包含训练集中每个点云名称的txt文件；
"co_test_file"：包含验证集/测试集中每个点云名称的txt文件；
"co_experiment_dir"：主要与其他参数连接，比如与接下来的"co_output_dir"；
"co_output_dir"：测试结果存放的文件夹；
"tt_max_iter_count"：迭代轮数；
"tt_batch_size"：batch size，根据显存进行调整其他参数基本上和作者提供的一样就可以。

下一步是对训练数据进行分割，选出训练集和测试集，这个可以自行决定。

接下来需要修改tangent_conv/util/dataset_params.py，添加阿里数据集的参数设定。

self.class_freq中填写每个类别的占比，用于初始化权重；
self.color_map中写上类别个数+1种颜色，第一个应该为unlabel的类别，其他自行定义。

最后在model.py的if dataset_type ==部分加上自己定义的阿里数据的param，应该就没有问题了。

放个训练之后的效果图留个纪念，虽然交上去的结果很差，给小车类别的点上了红色：

youkenhou / note-about-tangent_conv Goto Github PK

note-about-tangent_conv's Introduction

跑tangent convolution代码笔记

前期准备工作

将阿里点云分割比赛的数据集转换为网络输入的数据格式

note-about-tangent_conv's People

Contributors

Stargazers

Watchers

Forkers

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent