Bobholamovic 5a6f19da8b Add tools and experimental results		2 jaren geleden
..
configs	5a6f19da8b Add tools and experimental results	2 jaren geleden
scripts	5a6f19da8b Add tools and experimental results	2 jaren geleden
tools	5a6f19da8b Add tools and experimental results	2 jaren geleden
.gitignore	e637b92c0c Update rs_research example	2 jaren geleden
README.md	5a6f19da8b Add tools and experimental results	2 jaren geleden
attach_tools.py	5f353e6c51 Update examples/rs_research	2 jaren geleden
config_utils.py	5f353e6c51 Update examples/rs_research	2 jaren geleden
custom_model.py	5a6f19da8b Add tools and experimental results	2 jaren geleden
custom_trainer.py	5a6f19da8b Add tools and experimental results	2 jaren geleden
params_versus_f1.png	5f353e6c51 Update examples/rs_research	2 jaren geleden
predict_cd.py	5a6f19da8b Add tools and experimental results	2 jaren geleden
run_task.py	5a24513136 Refactor run_task.py	2 jaren geleden

PaddleRS科研实战：设计深度学习变化检测模型

本案例演示如何使用PaddleRS设计变化检测模型，并开展消融实验和对比实验。

1 环境配置

根据教程安装PaddleRS及相关依赖。在本项目中，GDAL库并不是必需的。

配置好环境后，在PaddleRS仓库根目录中执行如下指令切换到本案例所在目录：

cd examples/rs_research

请注意，本文档仅所提供的所有指令遵循bash语法。

2 数据准备

本案例在LEVIR-CD数据集[1]和synthetic images and real season-varying remote sensing images（SVCD）数据集[2]上开展实验。请在LEVIR-CD数据集下载链接和SVCD数据集下载链接分别下载这两个数据集，解压至本地目录，并执行如下指令：

mkdir data/
python ../../tools/prepare_dataset/prepare_levircd.py \
    --in_dataset_dir "{LEVIR-CD数据集存放目录路径}" \
    --out_dataset_dir 'data/levircd' \
    --crop_size 256 \
    --crop_stride 256
python ../../tools/prepare_dataset/prepare_svcd.py \
    --in_dataset_dir "{SVCD数据集存放目录路径}" \
    --out_dataset_dir 'data/svcd'

以上指令利用PaddleRS提供的数据集准备工具完成数据集切分、file list创建等操作。具体而言，对于LEVIR-CD数据集，使用官方的训练/验证/测试集划分，并将原始的1024x1024大小的影像切分为无重叠的256x256的小块（参考[3]中的做法）；对于SVCD数据集，使用官方的训练/验证/测试集划分，不做其它额外处理。

3 模型设计

3.1 问题分析与思路拟定

随着深度学习技术应用的不断深入，近年来，变化检测领域涌现了许多基于全卷积神经网络（fully convolutional network, FCN）的遥感影像变化检测算法。与基于特征和基于影像块的方法相比，基于FCN的方法具有处理效率高、依赖超参数少等优势，但其缺点在于参数量往往较大，因而对训练样本的数量更为依赖。尽管中、大型变化检测数据集的数量与日俱增，训练样本日益丰富，但深度学习变化检测模型的参数量也越来越大。下图显示了从2018年到2021年一些已发表的文献中提出的基于FCN的变化检测模型的参数量与其在SVCD数据集上取得的F1分数（柱状图中bar的高度与模型参数量成正比）：

诚然，增大参数数量在大多数情况下等同于增加模型容量，而模型容量的增加意味着模型拟合能力的提升，从而有助于模型在实验数据集上取得更高的精度指标。但是，“更大”一定意味着“更好”吗？答案显然是否定的。在实际应用中，“更大”的遥感影像变化检测模型常常遭遇如下问题：

巨大的参数量意味着巨大的存储开销。在许多实际场景中，硬件资源往往是有限的，过多的模型参数将给部署造成困难。
在数据有限的情况下，大模型更易遭受过拟合，其在实验数据集上看起来良好的结果也难以泛化到真实场景。

本案例认为，上述问题的根源在于参数量与数据量的失衡所导致的特征冗余。既然模型的特征存在冗余，也即存在一部分“无用”的特征，是否存在某种手段，能够在固定模型参数量的前提下对特征进行优化，从而“榨取”小模型的更多潜力，获取更多更加有效的特征？基于这个观点，本案例的基本思路是为现有的变化检测模型添加一个“插件式”的特征优化模块，在仅引入较少额外的参数数量的情况下，实现变化特征增强。本案例计划以变化检测领域经典的FC-Siam-conc[4]为baseline网络，利用通道和时间注意力模块对网络的中间层特征进行优化，从而减小特征冗余，提升检测效果。在具体的模块设计方面，选用论文[5]中提出的通道注意力模块实现通道和时间维度的特征增强。

3.2 模型定义

本小节基于PaddlePaddle框架与PaddleRS库实现3.1节中提出的想法。

3.2.1 自定义模型组网

在custom_model.py中定义模型的宏观（macro）结构以及组成模型的各个微观（micro）模块。本案例在custom_model.py中定义了改进后的FC-Siam-conc结构，其核心部分实现如下：

...
# PaddleRS提供了许多开箱即用的模块，其中有对底层基础模块的封装（如conv-bn-relu结构等），也有注意力模块等较高层级的结构
from paddlers.rs_models.cd.layers import Conv3x3, MaxPool2x2, ConvTransposed3x3, Identity
from paddlers.rs_models.cd.layers import ChannelAttention

from attach_tools import Attach

attach = Attach.to(paddlers.rs_models.cd)

@attach
class CustomModel(nn.Layer):
    def __init__(self,
                 in_channels,
                 num_classes,
                 att_types='ct',
                 use_dropout=False):
        super().__init__()
        ...
        # 构建一个混合注意力模块att4，用于处理两个编码器最终输出的特征
        self.att4 = MixedAttention(C4, att_types)

        self.init_weight()

    def forward(self, t1, t2):
        ...
        x4d = self.upconv4(x4p)
        pad4 = (0, x43_1.shape[3] - x4d.shape[3], 0,
                x43_1.shape[2] - x4d.shape[2])
        x4d = F.pad(x4d, pad=pad4, mode='replicate')
        # 将注意力模块接入第一个解码单元
        x43_1, x43_2 = self.att4(x43_1, x43_2)
        x4d = paddle.concat([x4d, x43_1, x43_2], 1)
        x43d = self.do43d(self.conv43d(x4d))
        x42d = self.do42d(self.conv42d(x43d))
        x41d = self.do41d(self.conv41d(x42d))
        ...


class MixedAttention(nn.Layer):
    def __init__(self, in_channels, att_types='ct'):
        super(MixedAttention, self).__init__()

        self.att_types = att_types

        # 从`att_types`参数中获取要使用的注意力类型
        # 每个注意力模块都是可选的
        if self.has_att_c:
            self.att_c = ChannelAttention(in_channels, ratio=1)
            # 在时间注意力模块之后增加归一化层
            # 利用BN层中的可学习参数增强模型的拟合能力
            self.norm_c1 = nn.BatchNorm(in_channels)
            self.norm_c2 = nn.BatchNorm(in_channels)
        else:
            self.att_c = Identity()
            self.norm_c1 = Identity()
            self.norm_c2 = Identity()

        # 时间注意力模块部分复用通道注意力的逻辑，在`forward()`中将具体解释
        if has_att_t:
            self.att_t = ChannelAttention(2, ratio=1)
        else:
            self.att_t = Identity()

    def forward(x1, x2):
        # x1和x2分别是FC-Siam-conc的两路编码器提取的特征

        if self.has_att_c:
            # 首先使用通道注意力模块对特征进行优化
            # 两个时相的编码特征共享通道注意力模块，但使用各自的归一化层
            x1 = self.att_c(x1) * x1
            x1 = self.norm_c1(x1)
            x2 = self.att_c(x2) * x2
            x2 = self.norm_c2(x2)

        if self.has_att_t:
            b, c = x1.shape[:2]
            # 为了复用通道注意力模块执行时间维度的注意力操作，首先将两个时相的特征堆叠
            y = paddle.stack([x1, x2], axis=2)
            # 堆叠后的y形状为[b, c, t, h, w]，其中b表示batch size，c为特征通道数，t为2（时相数目），h和w分别为特征图高宽
            # 将b和c两个维度合并，输出tensor形状为[b*c, t, h, w]
            y = paddle.flatten(y, stop_axis=1)
            # 此时，时间维度已经替代了原先的通道维度，将四维tensor输入ChannelAttention模块进行处理
            y = self.att_t(y) * y
            # 从处理结果中分离两个时相的信息
            y = y.reshape((b, c, 2, *y.shape[2:]))
            y1, y2 = y[:, :, 0], y[:, :, 1]
        else:
            y1, y2 = x1, x2

        return y1, y2

    @property
    def has_att_c(self):
        return 'c' in self.att_types

    @property
    def has_att_t(self):
        return 't' in self.att_types

在编写组网相关代码时请注意以下两点：

所有模型必须为paddle.nn.Layer的子类；
包含模型整体逻辑结构的最外层模块须用@attach装饰；
对于变化检测任务，forward()方法除self参数外还接受两个参数t1、t2，分别表示第一时相和第二时相影像。

关于模型定义的更多细节请参考文档。

3.2.2 自定义训练器

在custom_trainer.py中定义训练器。例如，本案例中，custom_trainer.py中定义了与CustomModel模型对应的训练器：

@attach
class CustomTrainer(BaseChangeDetector):
    def __init__(self,
                 num_classes=2,
                 use_mixed_loss=False,
                 losses=None,
                 in_channels=3,
                 att_types='ct',
                 use_dropout=False,
                 **params):
        params.update({
            'in_channels': in_channels,
            'att_types': att_types,
            'use_dropout': use_dropout
        })
        super().__init__(
            model_name='CustomModel',
            num_classes=num_classes,
            use_mixed_loss=use_mixed_loss,
            losses=losses,
            **params)

在编写训练器定义相关代码时请注意以下两点：

对于变化检测任务，训练器必须为paddlers.tasks.cd.BaseChangeDetector的子类；
与模型一样，训练器也须用@attach装饰；
训练器和模型可以同名。

在本案例中，仅仅重写了训练器的__init__()方法。在实际科研过程中，可以通过重写train()、evaluate()、default_loss()等方法定制更加复杂的训练、评估策略或更换默认损失函数。

关于训练器的更多细节请参考API文档。

4 对比实验

为了验证模型设计的有效性，通常需要开展对比实验，在一个或多个数据集上比较所提出模型与其它模型的精度和性能。在本案例中，将自定义模型与FC-EF、FC-Siam-diff、FC-Siam-conc三种结构进行比较，这三个模型均来自论文[4]。

4.1 实验过程

使用如下指令在LEVIR-CD与SVCD数据集上执行对所有参与对比的模型的训练：

bash scripts/run_benchmark.sh

或者，可以按照以下格式执行对某个模型在某一数据集上的训练：

python run_task.py train cd \
    --config "configs/{数据集名称}/{配置文件名称}" \
    2>&1 | tee "{日志路径}"

训练完成后，使用如下指令对验证集上最优的模型在测试集上计算指标：

python run_task.py eval cd \
    --config "configs/{数据集名称}/{配置文件名称}" \
    --datasets.eval.args.file_list "data/{数据集名称}/test.txt" \
    --resume_checkpoint "exp/{数据集名称}/{模型名称}/best_model"

训练程序默认开启VisualDL日志记录功能。训练过程中或训练完成后，可使用VisualDL观察损失函数和精度指标的变化情况。在PaddleRS中使用VisualDL的方式请参考使用教程。

在训练和精度指标验证完成后，可以通过如下指令保存模型输出的二值变化图：

python predict_cd.py \
    --model_dir "exp/{数据集名称}/{模型名称}/best_model" \
    --data_dir "data/{数据集名称}" \
    --file_list "data/{数据集名称}/test.txt" \
    --save_dir "exp/predict/{数据集名称}/{模型名称}"

之后，可在exp/predict/{数据集名称}/{模型名称}目录查看保存的输出结果。

可以通过tools/collect_imgs.py脚本将输入图像、真值标签以及多个模型的预测结果放置在一个目录下以便于观察比较。该脚本接受三个命令行选项：

使用--globs指定一系列通配符（可用于Python的glob.glob()函数，用于匹配需要收集的图像；
使用--tags为--globs中的每一项指定一个别名，在存储目录中，相应的图像名将被替换为存储的别名；
使用--save_dir指定输出目录路径，若目录不存在将被自动创建。

例如，对于LEVIR-CD数据集，执行如下指令：

python tools/collect_imgs.py \
    --globs "data/levircd/LEVIR-CD/test/A/*/*.png" "data/levircd/LEVIR-CD/test/B/*/*.png" "data/levircd/LEVIR-CD/test/label/*/*.png" \
        "exp/predict/levircd/fc_ef/*.png" "exp/predict/levircd/fc_siam_conc/*.png" "exp/predict/levircd/fc_siam_diff/*.png" \
        "exp/predict/levircd/custom_model/*.png" \
    --tags 'A' 'B' 'GT' \
        'fc_ef' 'fc_siam_conc' 'fc_siam_diff' \
        'custom_model' \
    --save_dir "exp/collect/levircd"

执行完毕后，可在exp/collect/levircd目录中找到两个时相的输入影像、真值标签以及各个模型的预测结果。当新增模型后，可以再次调用tools/collect_imgs.py脚本补充结果到exp/collect/levircd目录中：

python tools/collect_imgs.py --globs "exp/predict/levircd/{新增模型名称}/*.png" --tags '{新增模型名称}' --save_dir "exp/collect/levircd"

对于SVCD数据集，执行如下指令：

python tools/collect_imgs.py \
    --globs "data/svcd/ChangeDetectionDataset/Real/subset/test/A/*.jpg" "data/svcd/ChangeDetectionDataset/Real/subset/test/B/*.jpg" "data/svcd/ChangeDetectionDataset/Real/subset/test/OUT/*.jpg" \
        "exp/predict/svcd/fc_ef/*.png" "exp/predict/svcd/fc_siam_conc/*.png" "exp/predict/svcd/fc_siam_diff/*.png" \
        "exp/predict/svcd/custom_model/*.png" \
    --tags 'A' 'B' 'GT' \
        'fc_ef' 'fc_siam_conc' 'fc_siam_diff' \
        'custom_model' \
    --save_dir "exp/collect/svcd"

此外，为了从精度和性能两个方面综合评估变化检测算法，可以通过如下指令计算变化检测模型的浮点计算数（floating point operations, FLOPs）和模型参数量：

python tools/analyze_model.py --model_dir "exp/{数据集名称}/{模型名称}/best_model"

4.2 实验结果

本案例使用变化类的交并比（intersection over union, IoU）和F1分数作为定量评价指标。在每个数据集上，从目视效果和定量指标两个方面对算法效果进行评判。

4.2.1 LEVIR-CD数据集上的对比结果

目视效果对比

时相1影像	时相2影像	FC-EF	FC-Siam-diff	FC-Siam-conc	CustomModel	真值标签
![]()	![]()	![]()	![]()	![]()	![]()	![]()

定量指标对比

模型名称	FLOPs（G）	参数量（M）	IoU%	F1%
FC-EF	3.57	1.35	79.05	88.30
FC-Siam-diff	4.71	1.35	81.33	89.70
FC-Siam-conc	5.31	1.55	81.31	89.69
CustomModel	5.31	1.58	82.27	90.27

4.2.2 SVCD数据集上的对比结果

目视效果对比

时相1影像	时相2影像	FC-EF	FC-Siam-diff	FC-Siam-conc	CustomModel	真值标签
![]()	![]()	![]()	![]()	![]()	![]()	![]()

定量指标对比

模型名称	FLOPs（G）	参数量（M）	IoU%	F1%
FC-EF	3.57	1.35	84.11	91.37
FC-Siam-diff	4.71	1.35	88.75	94.04
FC-Siam-conc	5.31	1.55	88.29	93.78
CustomModel	5.31	1.58

5 消融实验

在科研过程中，为了验证在baseline上所做修改的有效性，常常需要开展消融实验。例如，在本案例中，自定义模型在FC-Siam-conc模型的基础上添加了通道和时间两种注意力模块，因此需要通过消融实验探讨各个注意力模块对最终精度的贡献。具体而言，包括以下4种实验情形（配置文件均存储在configs/levircd/ablation目录）：

基础情况：不使用任何注意力模块，即baseline模型FC-Siam-conc。
仅添加通道注意力模块，对应的配置文件名称为custom_model_c.yaml。
仅添加时间注意力模块，对应的配置文件名称为custom_model_t.yaml。
标准情况：同时添加通道和时间注意力模块的完整模型。

其中第1和第4个模型，即baseline和完整模型，在第4节中已经得到了训练、验证和测试。因此，本节只需要关注情形2、3。

5.1 实验过程

使用如下指令执行全部消融模型的训练：

bash scripts/run_ablation.sh

或者，可以按照以下格式执行对某一个模型的训练：

python run_task.py train cd \
    --config "configs/levircd/ablation/{配置文件名称}" \
    2>&1 | tee {日志路径}

训练完成后，使用如下指令对验证集上最优的模型在测试集上计算指标：

python run_task.py eval cd \
    --config "configs/levircd/ablation/{配置文件名称}" \
    --datasets.eval.args.file_list data/levircd/test.txt \
    --resume_checkpoint "exp/levircd/ablation/{消融模型名称}/best_model"

注意，形如custom_model_c.yaml的配置文件默认对应的消融模型名称为att_c。

5.2 实验结果

实验得到的定量指标如下表所示：

通道注意力模块	时间注意力模块	IoU%	F1%
		81.31	89.69
✓		81.32	89.70
	✓	81.61	89.88
✓	✓	82.27	90.27

其中，最高的指标用粗体表示。从表中数据可知，有限。

6 特征可视化实验

为了更好地探究。

5 总结与展望

5.1 总结

本案例以为经典的FC-Siam-conc模型添加注意力模块为例，演示了使用PaddleRS开展科研实验的典型流程。

精度提升十分有限，算法设计。

5.2 展望

本案例对所有参与比较的算法使用了相同的训练超参数，但由于模型之间存在差异，使用统一的超参训练往往难以保证所有模型都能取得较好的效果。在后续工作中，可以对每个对比算法进行调参，使其获得最优精度。
本案例只作为

参考文献

[1] Chen, Hao, and Zhenwei Shi. "A spatial-temporal attention-based method and a new dataset for remote sensing image change detection." Remote Sensing 12.10 (2020): 1662.
[2] Lebedev, M. A., et al. "CHANGE DETECTION IN REMOTE SENSING IMAGES USING CONDITIONAL ADVERSARIAL NETWORKS." International Archives of the Photogrammetry, Remote Sensing & Spatial Information Sciences 42.2 (2018).
[3] Chen, Hao, Zipeng Qi, and Zhenwei Shi. "Remote sensing image change detection with transformers." IEEE Transactions on Geoscience and Remote Sensing 60 (2021): 1-14.
[4] Daudt, Rodrigo Caye, Bertr Le Saux, and Alexandre Boulch. "Fully convolutional siamese networks for change detection." 2018 25th IEEE International Conference on Image Processing (ICIP). IEEE, 2018.
[5] Woo, Sanghyun, et al. "Cbam: Convolutional block attention module." Proceedings of the European conference on computer vision (ECCV). 2018.

README.md