- train.txt: 训练集的场景名(54)
- test.txt: 测试集的场景名(8)
- fuse_fragments_3DMatch.py: 如何由多帧深度图融合得到点云数据(ply)
- trainset_fcgf.py: 3DMatch训练集(FCGF)的统计分析代码
- trainset_d3feat.py: 3DMatch训练集(D3Feat)的统计分析代码
- test_set.py: 测试集的统计分析代码
- images: 可视化截图
3DMatch数据集收集了来自于62个场景的数据,其中54个场景的数据用于训练,8个场景的数据用于评估,其具体名称查看train.txt
和test.txt
。3DMatch数据常用于3D点云的关键点,特征描述子,点云配准等任务。
官方主页 | 3DMatch: Learning Local Geometric Descriptors from RGB-D Reconstructions [CVPR 2017]
3DMatch原始数据集: 下载地址,共包括64个.zip文件。
以其中一个场景7-scenes-stairs
为例,介绍其数据格式,如下截图所示,原始的3DMatch数据集包括两个.txt
文件,多个seq
文件夹,每个seq
文件夹下包括多帧的.color.png
, .depth.png
, .pose.txt
,可以看到,
其本身是不包括点云数据的,但是可以由这些数据生成点云数据(ply),一般是50帧-100帧生成一个点云数据,生成点云的代码可以参考fuse_fragments_3DMatch.py
。
下面介绍3DMatch的训练集,包括FCGF和D3Feat处理的训练集。
3DMatch训练集来自54个场景,详细类别名称参见train.txt
。每个场景均由1个seq或者多个seq的数据组成。这里以FCGF
网络使用的数据格式为例介绍3DMatch数据集。
首先,从这里下载训练集,下载解压后可以得到401个txt
文件和2189个npz
文件。2189个npz
对应每个点云数据,包括(x, y, z)及对应的(r, g, b)信息,其中命名规则是场景@seqid-id
,例如7-scenes-chess@seq-01_000.npz,表示此数据来自7-scenes-chess场景的seq-01,编号为000。401个txt表示这些npz的点云数据是如何关联的,其命名规则为场景@seqid-overlap
,如[email protected]表示7-scenes-chess场景的seq-01下的overlap大于0.30的数据,打开此文件后,可以看到如下信息:
7-scenes-chess@seq-01_000.npz 7-scenes-chess@seq-01_001.npz 0.886878
7-scenes-chess@seq-01_000.npz 7-scenes-chess@seq-01_002.npz 0.636459
7-scenes-chess@seq-01_000.npz 7-scenes-chess@seq-01_003.npz 0.825012
7-scenes-chess@seq-01_000.npz 7-scenes-chess@seq-01_004.npz 0.783642
每一行表示点云之间的对应关系,如第一行表示点云7-scenes-chess@seq-01_000.npz和7-scenes-chess@seq-01_001.npz具有0.886878的overlap。可视化结果如下,第一个图中的红色的点云是7-scenes-chess@seq-01_000.npz,蓝色的点云是7-scenes-chess@seq-01_001.npz,可以看到两者是对齐的;第二个图是这两个点云的rgb信息的可视化。
统计了一下,54个场景总共提供了7960对点云。
上述的统计信息的相关代码在trainset_fcgf.py
下载D3Feat训练使用的3DMatch数据集,解压后是6个.pkl
文件,分别是
3DMatch_train_0.030_keypts.pkl
, 3DMatch_train_0.030_overlap.pkl
, 3DMatch_train_0.030_points.pkl
, 3DMatch_val_0.030_keypts.pkl
, 3DMatch_val_0.030_overlap.pkl
和
3DMatch_val_0.030_points.pkl
,可以通过这里查看这些.pkl
文件是如何产生的。
-
3DMatch_train_0.030_keypts.pkl
存储了什么信息 ?点云名(str, 如
sun3d-brown_bm_1-brown_bm_1/seq-01/cloud_bin_0
) -> 点云(ndarray, n x 3)。总共有
3933
个点云数据,点云点最少的是850
个,点云点最多的是197343
,平均点云点数量是27127
。 -
3DMatch_train_0.030_overlap.pkl
存储了什么信息 ?点云对(str, 如
7-scenes-pumpkin/seq-07/cloud_bin_11@7-scenes-pumpkin/seq-08/cloud_bin_2
) -> overlap值(float)总共有
35297
个点云对,overlap的最小值为0.30
,最大值0.995
,平均值为0.515
。 -
3DMatch_train_0.030_points.pkl
存储了什么信息 ?点云对(str, 如
analysis-by-synthesis-office2-5b/seq-01/cloud_bin_34@analysis-by-synthesis-office2-5b/seq-01/cloud_bin_35
) -> 映射关系(ndarray, m x 2) -
可视化pairs中的点云和对应关键点
左图为两个具有overlap的点云的可视化,中间和右边的可视化是分别在红色和绿色点云上添加了对应点(蓝色区域)(来自于3DMatch_train_0.030_points.pkl
)的可视化结果。
上述相关代码在trainset_d3feat.py
。(为什么D3Feat的训练集中点云和点云对数量比FCGF中的点云和点云对数量多这么多 ?还待验证。)
3DMatch的测试集包括以下8个场景,其中每个场景对应两个文件夹。以7-scenes-redkitchen
为例,它包括7-scenes-redkitchen和7-scenes-redkitchen-evaluation两个文件夹,7-scenes-redkitchen文件夹下存放的是点云数据,命名格式均为cloud_bin_*.ply
,共包括60个点云数据;7-scenes-redkitchen-evaluation/gt.log存放了correspondences点云对,组织格式为:
0 1 60
9.96926560e-01 6.68735757e-02 -4.06664421e-02 -1.15576939e-01
-6.61289946e-02 9.97617877e-01 1.94008687e-02 -3.87705398e-02
4.18675510e-02 -1.66517807e-02 9.98977765e-01 1.14874890e-01
0.00000000e+00 0.00000000e+00 0.00000000e+00 1.00000000e+00
0 2 60
9.54999224e-01 1.08859481e-01 -2.75869135e-01 -3.41060560e-01
-9.89491703e-02 9.93843326e-01 4.96360476e-02 -1.78254668e-01
2.79581388e-01 -2.01060700e-02 9.59896612e-01 3.54627338e-01
0.00000000e+00 0.00000000e+00 0.00000000e+00 1.00000000e+00
0 1 60
中的0和1表示cloud_bin_0.ply和cloud_bin_1.ply点云是成对的,60表示总共包括有60个点云数据(前面也提到过),下面四列表示cloud_bin_1.ply -> cloud_bin_0.ply的变换矩阵。
可视化变换后的点云,红色的表示cloud_bin_0.ply点云,蓝色的表示对cloud_bin_1.ply变换后的点云,可视化结果显示两者基本重叠:
其它场景的统计数据如下,可视化和统计信息的代码均可通过test_set.py
实现。
名称 | 点云数量 | Pairs数量 |
---|---|---|
7-scenes-redkitchen | 60 | 506 |
sun3d-home_at-home_at_scan1_2013_jan_1 | 60 | 156 |
sun3d-home_md-home_md_scan9_2012_sep_30 | 60 | 208 |
sun3d-hotel_uc-scan3 | 55 | 226 |
sun3d-hotel_umd-maryland_hotel1 | 57 | 104 |
sun3d-hotel_umd-maryland_hotel3 | 37 | 54 |
sun3d-mit_76_studyroom-76-1studyroom2 | 66 | 292 |
sun3d-mit_lab_hj-lab_hj_tea_nov_2_2012_scan1_erika | 38 | 77 |
总计 | 433 | 1623 |
上述的统计信息的相关代码在test_set.py
评估指标主要基于FCGF [ICCV 2019],评估代码请参考https://github.com/chrischoy/FCGF/blob/master/scripts/benchmark_3dmatch.py。但Registration Recall的实现我感觉有问题,待日后再做补充吧。
-
Feature-match Recall
$$R = \frac{1}{M} \Sigma_{s=1}^M 1([\frac{1}{|\Omega_s|}\Sigma_{(i, j) \in \Omega_s}1(||T^* \text{x}_i - \text{y}_j|| < \tau_1) ] > \tau_2)$$ $M$ 表示pairs点云对的数量,$1$表示指示函数,$\Omega_s$是第$s$个pair的correspondences,$T^*$表当前pair点云的G.T.的R,t变换。$\text{y}_j$是$\text{x}_i$在$Y$中选择的Feature Distance最小的点,即$\text{y}j = \arg \min{\text{y}j} ||F{\text{x}i} - F{\text{y}_j}||, \text{y}_j \in Y$。$\tau_1$和$\tau_2$是两个超参数,常取值$\tau_1 = 0.1$,$\tau_2 = 0.05$。简单的说,就是有M个点云对,对每一个点云对做一个是特征好/坏的判断: 在真实R,t的情况下,计算$(\text{x}_i, \text{y}_j)$距离小于$\tau_1$的比例r,如果r大于$\tau_2$,则表示这个点云特征好,否则特征是坏的。
-
Registration Recall
$$E_{\text{RMSE}} = \sqrt {\frac{1}{\Omega_}\Sigma_{(\text{x}^, \text{y}^) \in \Omega_} ||\hat T_{i, j}\text{x}^* - \text{y}^*||^2}$$
$\Omega_$表示$(i, j)$点云对中correspondences的数量,$(\text{x}^, \text{y}^*)$表示G.T.的pair,$\hat T_{i, j}$表示基于$(i, j)$点云对预测的R,t变换。
对于具有至少30% overlap的点云对,如果$E_\text{RMSE} < 0.2$,则表示这是一个正确的点云对。