2 years ago · ff928ecb80
--- a/deploy/export/export_model.py
+++ b/deploy/export/export_model.py
@@ -73,5 +73,4 @@ if __name__ == '__main__':
 
															     model = load_model(args.model_dir)
														
 
															     # Do dynamic-to-static cast
														
 
															-    # XXX: Invoke a protected (single underscore) method outside of subclasses.
														
 
															-    model._export_inference_model(args.save_dir, fixed_input_shape)
														
 
															+    model.export_inference_model(args.save_dir, fixed_input_shape)
														
--- a/examples/README.md
+++ b/examples/README.md
@@ -5,6 +5,7 @@ PaddleRS提供从科学研究到产业应用的丰富示例，希望帮助遥感
 
															 ## 1 官方案例
														
 
															 - [PaddleRS科研实战：设计深度学习变化检测模型](./rs_research/)
														
 
															+- [基于PaddleRS的遥感图像小目标语义分割优化方法](./c2fnet/)
														
 
															 ## 2 社区贡献案例
														
--- a/paddlers/.version
+++ b/paddlers/.version
@@ -0,0 +1 @@
 
															+0.0.0.dev0
														
--- a/paddlers/__init__.py
+++ b/paddlers/__init__.py
@@ -12,10 +12,13 @@
 
															 # See the License for the specific language governing permissions and
														
 
															 # limitations under the License.
														
 
															-__version__ = '0.0.0.dev0'
														
 
															+import os
														
 
															 from paddlers.utils.env import get_environ_info, init_parallel_env
														
 
															 from . import tasks, datasets, transforms, utils, tools, models, deploy
														
 
															 init_parallel_env()
														
 
															 env_info = get_environ_info()
														
 
															+
														
 
															+with open(os.path.join(os.path.dirname(__file__), ".version"), 'r') as fv:
														
 
															+    __version__ = fv.read().rstrip()
														
--- a/paddlers/datasets/base.py
+++ b/paddlers/datasets/base.py
@@ -15,11 +15,15 @@
 
															 from copy import deepcopy
														
 
															 from paddle.io import Dataset
														
 
															+from paddle.fluid.dataloader.collate import default_collate_fn
														
 
															 from paddlers.utils import get_num_workers
														
 
															+from paddlers.transforms import construct_sample_from_dict
														
 
															 class BaseDataset(Dataset):
														
 
															+    _collate_trans_info = False
														
 
															+
														
 
															     def __init__(self, data_dir, label_list, transforms, num_workers, shuffle):
														
 
															         super(BaseDataset, self).__init__()
														
@@ -30,6 +34,15 @@ class BaseDataset(Dataset):
 
															         self.shuffle = shuffle
														
 
															     def __getitem__(self, idx):
														
 
															-        sample = deepcopy(self.file_list[idx])
														
 
															-        outputs = self.transforms(sample)
														
 
															-        return outputs
														
 
															+        sample = construct_sample_from_dict(self.file_list[idx])
														
 
															+        # `trans_info` will be used to store meta info about image shape
														
 
															+        sample['trans_info'] = []
														
 
															+        outputs, trans_info = self.transforms(sample)
														
 
															+        return outputs, trans_info
														
 
															+
														
 
															+    def collate_fn(self, batch):
														
 
															+        if self._collate_trans_info:
														
 
															+            return default_collate_fn(
														
 
															+                [s[0] for s in batch]), [s[1] for s in batch]
														
 
															+        else:
														
 
															+            return default_collate_fn([s[0] for s in batch])
														
--- a/paddlers/datasets/cd_dataset.py
+++ b/paddlers/datasets/cd_dataset.py
@@ -12,12 +12,12 @@
 
															 # See the License for the specific language governing permissions and
														
 
															 # limitations under the License.
														
 
															-import copy
														
 
															 from enum import IntEnum
														
 
															 import os.path as osp
														
 
															 from .base import BaseDataset
														
 
															 from paddlers.utils import logging, get_encoding, norm_path, is_pic
														
 
															+from paddlers.transforms import construct_sample_from_dict
														
 
															 class CDDataset(BaseDataset):
														
@@ -44,6 +44,8 @@ class CDDataset(BaseDataset):
 
															             Defaults to False.
														
 
															     """
														
 
															+    _collate_trans_info = True
														
 
															+
														
 
															     def __init__(self,
														
 
															                  data_dir,
														
 
															                  file_list,
														
@@ -58,8 +60,6 @@ class CDDataset(BaseDataset):
 
															         DELIMETER = ' '
														
 
															-        # TODO: batch padding
														
 
															-        self.batch_transforms = None
														
 
															         self.file_list = list()
														
 
															         self.labels = list()
														
 
															         self.with_seg_labels = with_seg_labels
														
@@ -130,7 +130,8 @@ class CDDataset(BaseDataset):
 
															             len(self.file_list), file_list))
														
 
															     def __getitem__(self, idx):
														
 
															-        sample = copy.deepcopy(self.file_list[idx])
														
 
															+        sample = construct_sample_from_dict(self.file_list[idx])
														
 
															+        sample['trans_info'] = []
														
 
															         sample = self.transforms.apply_transforms(sample)
														
 
															         if self.binarize_labels:
														
@@ -142,7 +143,7 @@ class CDDataset(BaseDataset):
 
															         outputs = self.transforms.arrange_outputs(sample)
														
 
															-        return outputs
														
 
															+        return outputs, sample['trans_info']
														
 
															     def __len__(self):
														
 
															         return len(self.file_list)
														
--- a/paddlers/datasets/clas_dataset.py
+++ b/paddlers/datasets/clas_dataset.py
@@ -43,8 +43,6 @@ class ClasDataset(BaseDataset):
 
															                  shuffle=False):
														
 
															         super(ClasDataset, self).__init__(data_dir, label_list, transforms,
														
 
															                                           num_workers, shuffle)
														
 
															-        # TODO batch padding
														
 
															-        self.batch_transforms = None
														
 
															         self.file_list = list()
														
 
															         self.labels = list()
														
--- a/paddlers/datasets/coco.py
+++ b/paddlers/datasets/coco.py
@@ -23,7 +23,7 @@ import numpy as np
 
															 from .base import BaseDataset
														
 
															 from paddlers.utils import logging, get_encoding, norm_path, is_pic
														
 
															-from paddlers.transforms import DecodeImg, MixupImage
														
 
															+from paddlers.transforms import DecodeImg, MixupImage, construct_sample_from_dict
														
 
															 from paddlers.tools import YOLOAnchorCluster
														
@@ -78,7 +78,6 @@ class COCODetDataset(BaseDataset):
 
															                     self.num_max_boxes *= 2
														
 
															                     break
														
 
															-        self.batch_transforms = None
														
 
															         self.allow_empty = allow_empty
														
 
															         self.empty_ratio = empty_ratio
														
 
															         self.file_list = list()
														
@@ -243,7 +242,7 @@ class COCODetDataset(BaseDataset):
 
															         self._epoch = 0
														
 
															     def __getitem__(self, idx):
														
 
															-        sample = copy.deepcopy(self.file_list[idx])
														
 
															+        sample = construct_sample_from_dict(self.file_list[idx])
														
 
															         if self.data_fields is not None:
														
 
															             sample = {k: sample[k] for k in self.data_fields}
														
 
															         if self.use_mix and (self.mixup_op.mixup_epoch == -1 or
														
@@ -253,15 +252,16 @@ class COCODetDataset(BaseDataset):
 
															                 mix_pos = (mix_idx + idx) % self.num_samples
														
 
															             else:
														
 
															                 mix_pos = 0
														
 
															-            sample_mix = copy.deepcopy(self.file_list[mix_pos])
														
 
															+            sample_mix = construct_sample_from_dict(self.file_list[mix_pos])
														
 
															             if self.data_fields is not None:
														
 
															                 sample_mix = {k: sample_mix[k] for k in self.data_fields}
														
 
															             sample = self.mixup_op(sample=[
														
 
															                 DecodeImg(to_rgb=False)(sample),
														
 
															                 DecodeImg(to_rgb=False)(sample_mix)
														
 
															             ])
														
 
															-        sample = self.transforms(sample)
														
 
															-        return sample
														
 
															+        sample['trans_info'] = []
														
 
															+        sample, trans_info = self.transforms(sample)
														
 
															+        return sample, trans_info
														
 
															     def __len__(self):
														
 
															         return self.num_samples
														
--- a/paddlers/datasets/res_dataset.py
+++ b/paddlers/datasets/res_dataset.py
@@ -36,6 +36,8 @@ class ResDataset(BaseDataset):
 
															             restoration tasks. Defaults to None.
														
 
															     """
														
 
															+    _collate_trans_info = True
														
 
															+
														
 
															     def __init__(self,
														
 
															                  data_dir,
														
 
															                  file_list,
														
@@ -45,7 +47,6 @@ class ResDataset(BaseDataset):
 
															                  sr_factor=None):
														
 
															         super(ResDataset, self).__init__(data_dir, None, transforms,
														
 
															                                          num_workers, shuffle)
														
 
															-        self.batch_transforms = None
														
 
															         self.file_list = list()
														
 
															         with open(file_list, encoding=get_encoding(file_list)) as f:
														
--- a/paddlers/datasets/seg_dataset.py
+++ b/paddlers/datasets/seg_dataset.py
@@ -35,6 +35,8 @@ class SegDataset(BaseDataset):
 
															         shuffle (bool, optional): Whether to shuffle the samples. Defaults to False.
														
 
															     """
														
 
															+    _collate_trans_info = True
														
 
															+
														
 
															     def __init__(self,
														
 
															                  data_dir,
														
 
															                  file_list,
														
@@ -44,8 +46,6 @@ class SegDataset(BaseDataset):
 
															                  shuffle=False):
														
 
															         super(SegDataset, self).__init__(data_dir, label_list, transforms,
														
 
															                                          num_workers, shuffle)
														
 
															-        # TODO: batch padding
														
 
															-        self.batch_transforms = None
														
 
															         self.file_list = list()
														
 
															         self.labels = list()
														
--- a/paddlers/deploy/predictor.py
+++ b/paddlers/deploy/predictor.py
@@ -26,6 +26,8 @@ from paddlers.tasks import load_model
 
															 from paddlers.utils import logging, Timer
														
 
															 from paddlers.tasks.utils.slider_predict import slider_predict
														
 
															+# TODO: Refactor
														
 
															+
														
 
															 class Predictor(object):
														
 
															     def __init__(self,
														
@@ -148,44 +150,32 @@ class Predictor(object):
 
															         return predictor
														
 
															     def preprocess(self, images, transforms):
														
 
															-        preprocessed_samples = self._model.preprocess(
														
 
															+        preprocessed_samples, batch_trans_info = self._model.preprocess(
														
 
															             images, transforms, to_tensor=False)
														
 
															         if self.model_type == 'classifier':
														
 
															-            preprocessed_samples = {'image': preprocessed_samples[0]}
														
 
															+            preprocessed_samples = {'image': preprocessed_samples}
														
 
															         elif self.model_type == 'segmenter':
														
 
															-            preprocessed_samples = {
														
 
															-                'image': preprocessed_samples[0],
														
 
															-                'ori_shape': preprocessed_samples[1]
														
 
															-            }
														
 
															+            preprocessed_samples = {'image': preprocessed_samples[0]}
														
 
															         elif self.model_type == 'detector':
														
 
															             pass
														
 
															         elif self.model_type == 'change_detector':
														
 
															             preprocessed_samples = {
														
 
															                 'image': preprocessed_samples[0],
														
 
															-                'image2': preprocessed_samples[1],
														
 
															-                'ori_shape': preprocessed_samples[2]
														
 
															+                'image2': preprocessed_samples[1]
														
 
															             }
														
 
															         elif self.model_type == 'restorer':
														
 
															-            preprocessed_samples = {
														
 
															-                'image': preprocessed_samples[0],
														
 
															-                'tar_shape': preprocessed_samples[1]
														
 
															-            }
														
 
															+            preprocessed_samples = {'image': preprocessed_samples[0]}
														
 
															         else:
														
 
															             logging.error(
														
 
															                 "Invalid model type {}".format(self.model_type), exit=True)
														
 
															-        return preprocessed_samples
														
 
															-
														
 
															-    def postprocess(self,
														
 
															-                    net_outputs,
														
 
															-                    topk=1,
														
 
															-                    ori_shape=None,
														
 
															-                    tar_shape=None,
														
 
															-                    transforms=None):
														
 
															+        return preprocessed_samples, batch_trans_info
														
 
															+
														
 
															+    def postprocess(self, net_outputs, batch_restore_list, topk=1):
														
 
															         if self.model_type == 'classifier':
														
 
															             true_topk = min(self._model.num_classes, topk)
														
 
															             if self._model.postprocess is None:
														
 
															                 self._model.build_postprocess_from_labels(topk)
														
 
															-            # XXX: Convert ndarray to tensor as self._model.postprocess requires
														
 
															+            # XXX: Convert ndarray to tensor as `self._model.postprocess` requires
														
 
															             assert len(net_outputs) == 1
														
 
															             net_outputs = paddle.to_tensor(net_outputs[0])
														
 
															             outputs = self._model.postprocess(net_outputs)
														
@@ -199,9 +189,7 @@ class Predictor(object):
 
															             } for l, s, n in zip(class_ids, scores, label_names)]
														
 
															         elif self.model_type in ('segmenter', 'change_detector'):
														
 
															             label_map, score_map = self._model.postprocess(
														
 
															-                net_outputs,
														
 
															-                batch_origin_shape=ori_shape,
														
 
															-                transforms=transforms.transforms)
														
 
															+                net_outputs, batch_restore_list=batch_restore_list)
														
 
															             preds = [{
														
 
															                 'label_map': l,
														
 
															                 'score_map': s
														
@@ -214,9 +202,7 @@ class Predictor(object):
 
															             preds = self._model.postprocess(net_outputs)
														
 
															         elif self.model_type == 'restorer':
														
 
															             res_maps = self._model.postprocess(
														
 
															-                net_outputs[0],
														
 
															-                batch_tar_shape=tar_shape,
														
 
															-                transforms=transforms.transforms)
														
 
															+                net_outputs[0], batch_restore_list=batch_restore_list)
														
 
															             preds = [{'res_map': res_map} for res_map in res_maps]
														
 
															         else:
														
 
															             logging.error(
														
@@ -248,7 +234,8 @@ class Predictor(object):
 
															     def _run(self, images, topk=1, transforms=None):
														
 
															         self.timer.preprocess_time_s.start()
														
 
															-        preprocessed_input = self.preprocess(images, transforms)
														
 
															+        preprocessed_input, batch_trans_info = self.preprocess(images,
														
 
															+                                                               transforms)
														
 
															         self.timer.preprocess_time_s.end(iter_num=len(images))
														
 
															         self.timer.inference_time_s.start()
														
@@ -257,11 +244,7 @@ class Predictor(object):
 
															         self.timer.postprocess_time_s.start()
														
 
															         results = self.postprocess(
														
 
															-            net_outputs,
														
 
															-            topk,
														
 
															-            ori_shape=preprocessed_input.get('ori_shape', None),
														
 
															-            tar_shape=preprocessed_input.get('tar_shape', None),
														
 
															-            transforms=transforms)
														
 
															+            net_outputs, batch_restore_list=batch_trans_info, topk=topk)
														
 
															         self.timer.postprocess_time_s.end(iter_num=len(images))
														
 
															         return results
														
--- a/paddlers/tasks/base.py
+++ b/paddlers/tasks/base.py
@@ -61,6 +61,9 @@ class ModelMeta(type):
 
															 class BaseModel(metaclass=ModelMeta):
														
 
															+
														
 
															+    find_unused_parameters = False
														
 
															+
														
 
															     def __init__(self, model_type):
														
 
															         self.model_type = model_type
														
 
															         self.in_channels = None
														
@@ -98,6 +101,7 @@ class BaseModel(metaclass=ModelMeta):
 
															                 if osp.exists(save_dir):
														
 
															                     os.remove(save_dir)
														
 
															                 os.makedirs(save_dir)
														
 
															+            # XXX: Hard-coding
														
 
															             if self.model_type == 'classifier':
														
 
															                 pretrain_weights = get_pretrain_weights(
														
 
															                     pretrain_weights, self.model_name, save_dir)
														
@@ -214,10 +218,7 @@ class BaseModel(metaclass=ModelMeta):
 
															         info = dict()
														
 
															         info['pruner'] = self.pruner.__class__.__name__
														
 
															         info['pruning_ratios'] = self.pruning_ratios
														
 
															-        pruner_inputs = self.pruner.inputs
														
 
															-        if self.model_type == 'detector':
														
 
															-            pruner_inputs = {k: v.tolist() for k, v in pruner_inputs[0].items()}
														
 
															-        info['pruner_inputs'] = pruner_inputs
														
 
															+        info['pruner_inputs'] = self.pruner.inputs
														
 
															         return info
														
@@ -266,7 +267,11 @@ class BaseModel(metaclass=ModelMeta):
 
															         open(osp.join(save_dir, '.success'), 'w').close()
														
 
															         logging.info("Model saved in {}.".format(save_dir))
														
 
															-    def build_data_loader(self, dataset, batch_size, mode='train'):
														
 
															+    def build_data_loader(self,
														
 
															+                          dataset,
														
 
															+                          batch_size,
														
 
															+                          mode='train',
														
 
															+                          collate_fn=None):
														
 
															         if dataset.num_samples < batch_size:
														
 
															             raise ValueError(
														
 
															                 'The volume of dataset({}) must be larger than batch size({}).'
														
@@ -291,7 +296,7 @@ class BaseModel(metaclass=ModelMeta):
 
															         loader = DataLoader(
														
 
															             dataset,
														
 
															             batch_sampler=batch_sampler,
														
 
															-            collate_fn=dataset.batch_transforms,
														
 
															+            collate_fn=dataset.collate_fn if collate_fn is None else collate_fn,
														
 
															             num_workers=dataset.num_workers,
														
 
															             return_list=True,
														
 
															             use_shared_memory=use_shared_memory)
														
@@ -312,6 +317,7 @@ class BaseModel(metaclass=ModelMeta):
 
															                    use_vdl=True):
														
 
															         self._check_transforms(train_dataset.transforms, 'train')
														
 
															+        # XXX: Hard-coding
														
 
															         if self.model_type == 'detector' and 'RCNN' in self.__class__.__name__ and train_dataset.pos_num < len(
														
 
															                 train_dataset.file_list):
														
 
															             nranks = 1
														
@@ -319,17 +325,17 @@ class BaseModel(metaclass=ModelMeta):
 
															             nranks = paddle.distributed.get_world_size()
														
 
															         local_rank = paddle.distributed.get_rank()
														
 
															         if nranks > 1:
														
 
															-            find_unused_parameters = getattr(self, 'find_unused_parameters',
														
 
															-                                             False)
														
 
															             # Initialize parallel environment if not done.
														
 
															             if not paddle.distributed.parallel.parallel_helper._is_parallel_ctx_initialized(
														
 
															             ):
														
 
															                 paddle.distributed.init_parallel_env()
														
 
															                 ddp_net = to_data_parallel(
														
 
															-                    self.net, find_unused_parameters=find_unused_parameters)
														
 
															+                    self.net,
														
 
															+                    find_unused_parameters=self.find_unused_parameters)
														
 
															             else:
														
 
															                 ddp_net = to_data_parallel(
														
 
															-                    self.net, find_unused_parameters=find_unused_parameters)
														
 
															+                    self.net,
														
 
															+                    find_unused_parameters=self.find_unused_parameters)
														
 
															         if use_vdl:
														
 
															             from visualdl import LogWriter
														
@@ -488,12 +494,13 @@ class BaseModel(metaclass=ModelMeta):
 
															         assert criterion in {'l1_norm', 'fpgm'}, \
														
 
															             "Pruning criterion {} is not supported. Please choose from {'l1_norm', 'fpgm'}."
														
 
															         self._check_transforms(dataset.transforms, 'eval')
														
 
															+        # XXX: Hard-coding
														
 
															         if self.model_type == 'detector':
														
 
															             self.net.eval()
														
 
															         else:
														
 
															             self.net.train()
														
 
															         inputs = _pruner_template_input(
														
 
															-            sample=dataset[0], model_type=self.model_type)
														
 
															+            sample=dataset[0][0], model_type=self.model_type)
														
 
															         if criterion == 'l1_norm':
														
 
															             self.pruner = L1NormFilterPruner(self.net, inputs=inputs)
														
 
															         else:
														
@@ -618,7 +625,10 @@ class BaseModel(metaclass=ModelMeta):
 
															     def _build_inference_net(self):
														
 
															         raise NotImplementedError
														
 
															-    def _export_inference_model(self, save_dir, image_shape=None):
														
 
															+    def _get_test_inputs(self, image_shape):
														
 
															+        raise NotImplementedError
														
 
															+
														
 
															+    def export_inference_model(self, save_dir, image_shape=None):
														
 
															         self.test_inputs = self._get_test_inputs(image_shape)
														
 
															         infer_net = self._build_inference_net()
														
@@ -696,4 +706,4 @@ class BaseModel(metaclass=ModelMeta):
 
															         raise NotImplementedError
														
 
															     def postprocess(self, *args, **kwargs):
														
 
															-        raise NotImplementedError
														
 
															+        raise NotImplementedError
														
--- a/paddlers/tasks/change_detector.py
+++ b/paddlers/tasks/change_detector.py
@@ -13,7 +13,6 @@
 
															 # limitations under the License.
														
 
															 import math
														
 
															-import os
														
 
															 import os.path as osp
														
 
															 from collections import OrderedDict
														
 
															 from operator import attrgetter
														
@@ -29,7 +28,7 @@ import paddlers.models.paddleseg as ppseg
 
															 import paddlers.rs_models.cd as cmcd
														
 
															 import paddlers.utils.logging as logging
														
 
															 from paddlers.models import seg_losses
														
 
															-from paddlers.transforms import Resize, decode_image
														
 
															+from paddlers.transforms import Resize, decode_image, construct_sample
														
 
															 from paddlers.utils import get_single_card_bs
														
 
															 from paddlers.utils.checkpoint import cd_pretrain_weights_dict
														
 
															 from .base import BaseModel
														
@@ -63,7 +62,6 @@ class BaseChangeDetector(BaseModel):
 
															         if params.get('with_net', True):
														
 
															             params.pop('with_net', None)
														
 
															             self.net = self.build_net(**params)
														
 
															-        self.find_unused_parameters = True
														
 
															     def build_net(self, **params):
														
 
															         # TODO: add other model
														
@@ -112,11 +110,11 @@ class BaseChangeDetector(BaseModel):
 
															         ]
														
 
															     def run(self, net, inputs, mode):
														
 
															+        inputs, batch_restore_list = inputs
														
 
															         net_out = net(inputs[0], inputs[1])
														
 
															         logit = net_out[0]
														
 
															         outputs = OrderedDict()
														
 
															         if mode == 'test':
														
 
															-            batch_restore_list = inputs[-1]
														
 
															             if self.status == 'Infer':
														
 
															                 label_map_list, score_map_list = self.postprocess(
														
 
															                     net_out, batch_restore_list)
														
@@ -137,7 +135,6 @@ class BaseChangeDetector(BaseModel):
 
															             outputs['score_map'] = score_map_list
														
 
															         if mode == 'eval':
														
 
															-            batch_restore_list = inputs[-1]
														
 
															             if self.status == 'Infer':
														
 
															                 pred = paddle.unsqueeze(net_out[0], axis=1)  # NCHW
														
 
															             else:
														
@@ -560,10 +557,8 @@ class BaseChangeDetector(BaseModel):
 
															             images = [img_file]
														
 
															         else:
														
 
															             images = img_file
														
 
															-        batch_im1, batch_im2, batch_trans_info = self.preprocess(
														
 
															-            images, transforms, self.model_type)
														
 
															+        data = self.preprocess(images, transforms, self.model_type)
														
 
															         self.net.eval()
														
 
															-        data = (batch_im1, batch_im2, batch_trans_info)
														
 
															         outputs = self.run(self.net, data, 'test')
														
 
															         label_map_list = outputs['label_map']
														
 
															         score_map_list = outputs['score_map']
														
@@ -631,10 +626,10 @@ class BaseChangeDetector(BaseModel):
 
															                 im1 = decode_image(im1, read_raw=True)
														
 
															                 im2 = decode_image(im2, read_raw=True)
														
 
															             # XXX: sample do not contain 'image_t1' and 'image_t2'.
														
 
															-            sample = {'image': im1, 'image2': im2}
														
 
															+            sample = construct_sample(image=im1, image2=im2)
														
 
															             data = transforms(sample)
														
 
															-            im1, im2 = data[:2]
														
 
															-            trans_info = data[-1]
														
 
															+            im1, im2 = data[0][:2]
														
 
															+            trans_info = data[1]
														
 
															             batch_im1.append(im1)
														
 
															             batch_im2.append(im2)
														
 
															             batch_trans_info.append(trans_info)
														
@@ -645,55 +640,7 @@ class BaseChangeDetector(BaseModel):
 
															             batch_im1 = np.asarray(batch_im1)
														
 
															             batch_im2 = np.asarray(batch_im2)
														
 
															-        return batch_im1, batch_im2, batch_trans_info
														
 
															-
														
 
															-    @staticmethod
														
 
															-    def get_transforms_shape_info(batch_ori_shape, transforms):
														
 
															-        batch_restore_list = list()
														
 
															-        for ori_shape in batch_ori_shape:
														
 
															-            restore_list = list()
														
 
															-            h, w = ori_shape[0], ori_shape[1]
														
 
															-            for op in transforms:
														
 
															-                if op.__class__.__name__ == 'Resize':
														
 
															-                    restore_list.append(('resize', (h, w)))
														
 
															-                    h, w = op.target_size
														
 
															-                elif op.__class__.__name__ == 'ResizeByShort':
														
 
															-                    restore_list.append(('resize', (h, w)))
														
 
															-                    im_short_size = min(h, w)
														
 
															-                    im_long_size = max(h, w)
														
 
															-                    scale = float(op.short_size) / float(im_short_size)
														
 
															-                    if 0 < op.max_size < np.round(scale * im_long_size):
														
 
															-                        scale = float(op.max_size) / float(im_long_size)
														
 
															-                    h = int(round(h * scale))
														
 
															-                    w = int(round(w * scale))
														
 
															-                elif op.__class__.__name__ == 'ResizeByLong':
														
 
															-                    restore_list.append(('resize', (h, w)))
														
 
															-                    im_long_size = max(h, w)
														
 
															-                    scale = float(op.long_size) / float(im_long_size)
														
 
															-                    h = int(round(h * scale))
														
 
															-                    w = int(round(w * scale))
														
 
															-                elif op.__class__.__name__ == 'Pad':
														
 
															-                    if op.target_size:
														
 
															-                        target_h, target_w = op.target_size
														
 
															-                    else:
														
 
															-                        target_h = int(
														
 
															-                            (np.ceil(h / op.size_divisor) * op.size_divisor))
														
 
															-                        target_w = int(
														
 
															-                            (np.ceil(w / op.size_divisor) * op.size_divisor))
														
 
															-
														
 
															-                    if op.pad_mode == -1:
														
 
															-                        offsets = op.offsets
														
 
															-                    elif op.pad_mode == 0:
														
 
															-                        offsets = [0, 0]
														
 
															-                    elif op.pad_mode == 1:
														
 
															-                        offsets = [(target_h - h) // 2, (target_w - w) // 2]
														
 
															-                    else:
														
 
															-                        offsets = [target_h - h, target_w - w]
														
 
															-                    restore_list.append(('padding', (h, w), offsets))
														
 
															-                    h, w = target_h, target_w
														
 
															-
														
 
															-            batch_restore_list.append(restore_list)
														
 
															-        return batch_restore_list
														
 
															+        return (batch_im1, batch_im2), batch_trans_info
														
 
															     def postprocess(self, batch_pred, batch_restore_list):
														
 
															         if isinstance(batch_pred, (tuple, list)) and self.status == 'Infer':
														
@@ -717,7 +664,7 @@ class BaseChangeDetector(BaseModel):
 
															                     x, y = item[2]
														
 
															                     pred = pred[:, :, y:y + h, x:x + w]
														
 
															                 else:
														
 
															-                    pass
														
 
															+                    raise RuntimeError
														
 
															             results.append(pred)
														
 
															         return results
														
@@ -756,7 +703,7 @@ class BaseChangeDetector(BaseModel):
 
															                         label_map = label_map[:, y:y + h, x:x + w, :]
														
 
															                         score_map = score_map[:, y:y + h, x:x + w, :]
														
 
															                 else:
														
 
															-                    pass
														
 
															+                    raise RuntimeError
														
 
															             label_map = label_map.squeeze()
														
 
															             score_map = score_map.squeeze()
														
 
															             if not isinstance(label_map, np.ndarray):
														
--- a/paddlers/tasks/classifier.py
+++ b/paddlers/tasks/classifier.py
@@ -12,26 +12,23 @@
 
															 # See the License for the specific language governing permissions and
														
 
															 # limitations under the License.
														
 
															-import math
														
 
															 import os.path as osp
														
 
															 from collections import OrderedDict
														
 
															 from operator import itemgetter
														
 
															 import numpy as np
														
 
															 import paddle
														
 
															-import paddle.nn.functional as F
														
 
															 from paddle.static import InputSpec
														
 
															 import paddlers
														
 
															 import paddlers.models.ppcls as ppcls
														
 
															 import paddlers.rs_models.clas as cmcls
														
 
															 import paddlers.utils.logging as logging
														
 
															-from paddlers.utils import get_single_card_bs, DisablePrint
														
 
															 from paddlers.models.ppcls.metric import build_metrics
														
 
															 from paddlers.models import clas_losses
														
 
															 from paddlers.models.ppcls.data.postprocess import build_postprocess
														
 
															 from paddlers.utils.checkpoint import cls_pretrain_weights_dict
														
 
															-from paddlers.transforms import Resize, decode_image
														
 
															+from paddlers.transforms import Resize, decode_image, construct_sample
														
 
															 from .base import BaseModel
														
 
															 __all__ = ["ResNet50_vd", "MobileNetV3", "HRNet", "CondenseNetV2"]
														
@@ -64,7 +61,6 @@ class BaseClassifier(BaseModel):
 
															         if params.get('with_net', True):
														
 
															             params.pop('with_net', None)
														
 
															             self.net = self.build_net(**params)
														
 
															-        self.find_unused_parameters = True
														
 
															     def build_net(self, **params):
														
 
															         with paddle.utils.unique_name.guard():
														
@@ -459,10 +455,8 @@ class BaseClassifier(BaseModel):
 
															             images = [img_file]
														
 
															         else:
														
 
															             images = img_file
														
 
															-        batch_im, batch_origin_shape = self.preprocess(images, transforms,
														
 
															-                                                       self.model_type)
														
 
															+        data, _ = self.preprocess(images, transforms, self.model_type)
														
 
															         self.net.eval()
														
 
															-        data = (batch_im, batch_origin_shape, transforms.transforms)
														
 
															         if self.postprocess is None:
														
 
															             self.build_postprocess_from_labels()
														
@@ -488,69 +482,19 @@ class BaseClassifier(BaseModel):
 
															     def preprocess(self, images, transforms, to_tensor=True):
														
 
															         self._check_transforms(transforms, 'test')
														
 
															         batch_im = list()
														
 
															-        batch_ori_shape = list()
														
 
															         for im in images:
														
 
															             if isinstance(im, str):
														
 
															                 im = decode_image(im, read_raw=True)
														
 
															-            ori_shape = im.shape[:2]
														
 
															-            sample = {'image': im}
														
 
															-            im = transforms(sample)
														
 
															+            sample = construct_sample(image=im)
														
 
															+            data = transforms(sample)
														
 
															+            im = data[0][0]
														
 
															             batch_im.append(im)
														
 
															-            batch_ori_shape.append(ori_shape)
														
 
															         if to_tensor:
														
 
															             batch_im = paddle.to_tensor(batch_im)
														
 
															         else:
														
 
															             batch_im = np.asarray(batch_im)
														
 
															-        return batch_im, batch_ori_shape
														
 
															-
														
 
															-    @staticmethod
														
 
															-    def get_transforms_shape_info(batch_ori_shape, transforms):
														
 
															-        batch_restore_list = list()
														
 
															-        for ori_shape in batch_ori_shape:
														
 
															-            restore_list = list()
														
 
															-            h, w = ori_shape[0], ori_shape[1]
														
 
															-            for op in transforms:
														
 
															-                if op.__class__.__name__ == 'Resize':
														
 
															-                    restore_list.append(('resize', (h, w)))
														
 
															-                    h, w = op.target_size
														
 
															-                elif op.__class__.__name__ == 'ResizeByShort':
														
 
															-                    restore_list.append(('resize', (h, w)))
														
 
															-                    im_short_size = min(h, w)
														
 
															-                    im_long_size = max(h, w)
														
 
															-                    scale = float(op.short_size) / float(im_short_size)
														
 
															-                    if 0 < op.max_size < np.round(scale * im_long_size):
														
 
															-                        scale = float(op.max_size) / float(im_long_size)
														
 
															-                    h = int(round(h * scale))
														
 
															-                    w = int(round(w * scale))
														
 
															-                elif op.__class__.__name__ == 'ResizeByLong':
														
 
															-                    restore_list.append(('resize', (h, w)))
														
 
															-                    im_long_size = max(h, w)
														
 
															-                    scale = float(op.long_size) / float(im_long_size)
														
 
															-                    h = int(round(h * scale))
														
 
															-                    w = int(round(w * scale))
														
 
															-                elif op.__class__.__name__ == 'Pad':
														
 
															-                    if op.target_size:
														
 
															-                        target_h, target_w = op.target_size
														
 
															-                    else:
														
 
															-                        target_h = int(
														
 
															-                            (np.ceil(h / op.size_divisor) * op.size_divisor))
														
 
															-                        target_w = int(
														
 
															-                            (np.ceil(w / op.size_divisor) * op.size_divisor))
														
 
															-
														
 
															-                    if op.pad_mode == -1:
														
 
															-                        offsets = op.offsets
														
 
															-                    elif op.pad_mode == 0:
														
 
															-                        offsets = [0, 0]
														
 
															-                    elif op.pad_mode == 1:
														
 
															-                        offsets = [(target_h - h) // 2, (target_w - w) // 2]
														
 
															-                    else:
														
 
															-                        offsets = [target_h - h, target_w - w]
														
 
															-                    restore_list.append(('padding', (h, w), offsets))
														
 
															-                    h, w = target_h, target_w
														
 
															-
														
 
															-            batch_restore_list.append(restore_list)
														
 
															-        return batch_restore_list
														
 
															+        return batch_im, None
														
 
															     def _check_transforms(self, transforms, mode):
														
 
															         super()._check_transforms(transforms, mode)
														
@@ -559,7 +503,11 @@ class BaseClassifier(BaseModel):
 
															             raise TypeError(
														
 
															                 "`transforms.arrange` must be an ArrangeClassifier object.")
														
 
															-    def build_data_loader(self, dataset, batch_size, mode='train'):
														
 
															+    def build_data_loader(self,
														
 
															+                          dataset,
														
 
															+                          batch_size,
														
 
															+                          mode='train',
														
 
															+                          collate_fn=None):
														
 
															         if dataset.num_samples < batch_size:
														
 
															             raise ValueError(
														
 
															                 'The volume of dataset({}) must be larger than batch size({}).'
														
@@ -571,7 +519,8 @@ class BaseClassifier(BaseModel):
 
															                 batch_size=batch_size,
														
 
															                 shuffle=dataset.shuffle,
														
 
															                 drop_last=False,
														
 
															-                collate_fn=dataset.batch_transforms,
														
 
															+                collate_fn=dataset.collate_fn
														
 
															+                if collate_fn is None else collate_fn,
														
 
															                 num_workers=dataset.num_workers,
														
 
															                 return_list=True,
														
 
															                 use_shared_memory=False)
														
--- a/paddlers/tasks/object_detector.py
+++ b/paddlers/tasks/object_detector.py
@@ -24,7 +24,7 @@ from paddle.static import InputSpec
 
															 import paddlers
														
 
															 import paddlers.models.ppdet as ppdet
														
 
															 from paddlers.models.ppdet.modeling.proposal_generator.target_layer import BBoxAssigner, MaskAssigner
														
 
															-from paddlers.transforms import decode_image
														
 
															+from paddlers.transforms import decode_image, construct_sample
														
 
															 from paddlers.transforms.operators import _NormalizeBox, _PadBox, _BboxXYXY2XYWH, Resize, Pad
														
 
															 from paddlers.transforms.batch_operators import BatchCompose, BatchRandomResize, BatchRandomResizeByShort, \
														
 
															     _BatchPad, _Gt2YoloTarget
														
@@ -38,6 +38,8 @@ __all__ = [
 
															     "YOLOv3", "FasterRCNN", "PPYOLO", "PPYOLOTiny", "PPYOLOv2", "MaskRCNN"
														
 
															 ]
														
 
															+# TODO: Prune and decoupling
														
 
															+
														
 
															 class BaseDetector(BaseModel):
														
 
															     def __init__(self, model_name, num_classes=80, **params):
														
@@ -307,6 +309,8 @@ class BaseDetector(BaseModel):
 
															         self.num_max_boxes = train_dataset.num_max_boxes
														
 
															         train_dataset.batch_transforms = self._compose_batch_transform(
														
 
															             train_dataset.transforms, mode='train')
														
 
															+        train_dataset.collate_fn = self._build_collate_fn(
														
 
															+            train_dataset.batch_transforms)
														
 
															         # Build optimizer if not defined
														
 
															         if optimizer is None:
														
@@ -372,6 +376,17 @@ class BaseDetector(BaseModel):
 
															             early_stop_patience=early_stop_patience,
														
 
															             use_vdl=use_vdl)
														
 
															+    def _build_collate_fn(self, compose):
														
 
															+        def _collate_fn(batch):
														
 
															+            # We drop `trans_info` as it is not required in detection tasks
														
 
															+            samples = [s[0] for s in batch]
														
 
															+            return compose(samples)
														
 
															+
														
 
															+        return _collate_fn
														
 
															+
														
 
															+    def _compose_batch_transform(self, transforms, mode):
														
 
															+        raise NotImplementedError
														
 
															+
														
 
															     def quant_aware_train(self,
														
 
															                           num_epochs,
														
 
															                           train_dataset,
														
@@ -534,9 +549,13 @@ class BaseDetector(BaseModel):
 
															         if nranks < 2 or local_rank == 0:
														
 
															             self.eval_data_loader = self.build_data_loader(
														
 
															-                eval_dataset, batch_size=batch_size, mode='eval')
														
 
															+                eval_dataset,
														
 
															+                batch_size=batch_size,
														
 
															+                mode='eval',
														
 
															+                collate_fn=self._build_collate_fn(
														
 
															+                    eval_dataset.batch_transforms))
														
 
															             is_bbox_normalized = False
														
 
															-            if eval_dataset.batch_transforms is not None:
														
 
															+            if hasattr(eval_dataset, 'batch_transforms'):
														
 
															                 is_bbox_normalized = any(
														
 
															                     isinstance(t, _NormalizeBox)
														
 
															                     for t in eval_dataset.batch_transforms.batch_transforms)
														
@@ -604,7 +623,7 @@ class BaseDetector(BaseModel):
 
															         else:
														
 
															             images = img_file
														
 
															-        batch_samples = self.preprocess(images, transforms)
														
 
															+        batch_samples, _ = self.preprocess(images, transforms)
														
 
															         self.net.eval()
														
 
															         outputs = self.run(self.net, batch_samples, 'test')
														
 
															         prediction = self.postprocess(outputs)
														
@@ -619,16 +638,17 @@ class BaseDetector(BaseModel):
 
															         for im in images:
														
 
															             if isinstance(im, str):
														
 
															                 im = decode_image(im, read_raw=True)
														
 
															-            sample = {'image': im}
														
 
															+            sample = construct_sample(image=im)
														
 
															             sample = transforms(sample)
														
 
															-            batch_samples.append(sample)
														
 
															+            data = sample[0]
														
 
															+            batch_samples.append(data)
														
 
															         batch_transforms = self._compose_batch_transform(transforms, 'test')
														
 
															         batch_samples = batch_transforms(batch_samples)
														
 
															         if to_tensor:
														
 
															             for k in batch_samples:
														
 
															                 batch_samples[k] = paddle.to_tensor(batch_samples[k])
														
 
															-        return batch_samples
														
 
															+        return batch_samples, None
														
 
															     def postprocess(self, batch_pred):
														
 
															         infer_result = {}
														
@@ -705,6 +725,14 @@ class BaseDetector(BaseModel):
 
															             raise TypeError(
														
 
															                 "`transforms.arrange` must be an ArrangeDetector object.")
														
 
															+    def get_pruning_info(self):
														
 
															+        info = super().get_pruning_info()
														
 
															+        info['pruner_inputs'] = {
														
 
															+            k: v.tolist()
														
 
															+            for k, v in info['pruner_inputs'][0].items()
														
 
															+        }
														
 
															+        return info
														
 
															+
														
 
															 class PicoDet(BaseDetector):
														
 
															     def __init__(self,
														
@@ -920,7 +948,11 @@ class PicoDet(BaseDetector):
 
															             in_args['optimizer'] = optimizer
														
 
															         return in_args
														
 
															-    def build_data_loader(self, dataset, batch_size, mode='train'):
														
 
															+    def build_data_loader(self,
														
 
															+                          dataset,
														
 
															+                          batch_size,
														
 
															+                          mode='train',
														
 
															+                          collate_fn=None):
														
 
															         if dataset.num_samples < batch_size:
														
 
															             raise ValueError(
														
 
															                 'The volume of dataset({}) must be larger than batch size({}).'
														
@@ -932,13 +964,14 @@ class PicoDet(BaseDetector):
 
															                 batch_size=batch_size,
														
 
															                 shuffle=dataset.shuffle,
														
 
															                 drop_last=False,
														
 
															-                collate_fn=dataset.batch_transforms,
														
 
															+                collate_fn=dataset.collate_fn
														
 
															+                if collate_fn is None else collate_fn,
														
 
															                 num_workers=dataset.num_workers,
														
 
															                 return_list=True,
														
 
															                 use_shared_memory=False)
														
 
															         else:
														
 
															-            return super(BaseDetector, self).build_data_loader(dataset,
														
 
															-                                                               batch_size, mode)
														
 
															+            return super(BaseDetector, self).build_data_loader(
														
 
															+                dataset, batch_size, mode, collate_fn)
														
 
															 class YOLOv3(BaseDetector):
														
--- a/paddlers/tasks/restorer.py
+++ b/paddlers/tasks/restorer.py
@@ -28,7 +28,7 @@ import paddlers.models.ppgan.metrics as metrics
 
															 import paddlers.utils.logging as logging
														
 
															 from paddlers.models import res_losses
														
 
															 from paddlers.models.ppgan.modules.init import init_weights
														
 
															-from paddlers.transforms import Resize, decode_image
														
 
															+from paddlers.transforms import Resize, decode_image, construct_sample
														
 
															 from paddlers.transforms.functions import calc_hr_shape
														
 
															 from paddlers.utils.checkpoint import res_pretrain_weights_dict
														
 
															 from .base import BaseModel
														
@@ -58,7 +58,6 @@ class BaseRestorer(BaseModel):
 
															         if params.get('with_net', True):
														
 
															             params.pop('with_net', None)
														
 
															             self.net = self.build_net(**params)
														
 
															-        self.find_unused_parameters = True
														
 
															         if min_max is None:
														
 
															             self.min_max = self.MIN_MAX
														
@@ -116,14 +115,13 @@ class BaseRestorer(BaseModel):
 
															         return input_spec
														
 
															     def run(self, net, inputs, mode):
														
 
															+        inputs, batch_restore_list = inputs
														
 
															         outputs = OrderedDict()
														
 
															         if mode == 'test':
														
 
															-            tar_shape = inputs[1]
														
 
															             if self.status == 'Infer':
														
 
															                 net_out = net(inputs[0])
														
 
															-                res_map_list = self.postprocess(
														
 
															-                    net_out, tar_shape, transforms=inputs[2])
														
 
															+                res_map_list = self.postprocess(net_out, batch_restore_list)
														
 
															             else:
														
 
															                 if isinstance(net, GANAdapter):
														
 
															                     net_out = net.generator(inputs[0])
														
@@ -131,8 +129,7 @@ class BaseRestorer(BaseModel):
 
															                     net_out = net(inputs[0])
														
 
															                 if self.TEST_OUT_KEY is not None:
														
 
															                     net_out = net_out[self.TEST_OUT_KEY]
														
 
															-                pred = self.postprocess(
														
 
															-                    net_out, tar_shape, transforms=inputs[2])
														
 
															+                pred = self.postprocess(net_out, batch_restore_list)
														
 
															                 res_map_list = []
														
 
															                 for res_map in pred:
														
 
															                     res_map = self._tensor_to_images(res_map)
														
@@ -147,9 +144,7 @@ class BaseRestorer(BaseModel):
 
															             if self.TEST_OUT_KEY is not None:
														
 
															                 net_out = net_out[self.TEST_OUT_KEY]
														
 
															             tar = inputs[1]
														
 
															-            tar_shape = [tar.shape[-2:]]
														
 
															-            pred = self.postprocess(
														
 
															-                net_out, tar_shape, transforms=inputs[2])[0]  # NCHW
														
 
															+            pred = self.postprocess(net_out, batch_restore_list)[0]  # NCHW
														
 
															             pred = self._tensor_to_images(pred)
														
 
															             outputs['pred'] = pred
														
 
															             tar = self._tensor_to_images(tar)
														
@@ -424,7 +419,6 @@ class BaseRestorer(BaseModel):
 
															                     eval_dataset.num_samples, eval_dataset.num_samples))
														
 
															             with paddle.no_grad():
														
 
															                 for step, data in enumerate(self.eval_data_loader):
														
 
															-                    data.append(eval_dataset.transforms.transforms)
														
 
															                     outputs = self.run(self.net, data, 'eval')
														
 
															                     psnr.update(outputs['pred'], outputs['tar'])
														
 
															                     ssim.update(outputs['pred'], outputs['tar'])
														
@@ -472,10 +466,8 @@ class BaseRestorer(BaseModel):
 
															             images = [img_file]
														
 
															         else:
														
 
															             images = img_file
														
 
															-        batch_im, batch_tar_shape = self.preprocess(images, transforms,
														
 
															-                                                    self.model_type)
														
 
															+        data = self.preprocess(images, transforms, self.model_type)
														
 
															         self.net.eval()
														
 
															-        data = (batch_im, batch_tar_shape, transforms.transforms)
														
 
															         outputs = self.run(self.net, data, 'test')
														
 
															         res_map_list = outputs['res_map']
														
 
															         if isinstance(img_file, list):
														
@@ -487,79 +479,24 @@ class BaseRestorer(BaseModel):
 
															     def preprocess(self, images, transforms, to_tensor=True):
														
 
															         self._check_transforms(transforms, 'test')
														
 
															         batch_im = list()
														
 
															-        batch_tar_shape = list()
														
 
															+        batch_trans_info = list()
														
 
															         for im in images:
														
 
															             if isinstance(im, str):
														
 
															                 im = decode_image(im, read_raw=True)
														
 
															-            ori_shape = im.shape[:2]
														
 
															-            sample = {'image': im}
														
 
															-            im = transforms(sample)[0]
														
 
															+            sample = construct_sample(image=im)
														
 
															+            data = transforms(sample)
														
 
															+            im = data[0][0]
														
 
															+            trans_info = data[1]
														
 
															             batch_im.append(im)
														
 
															-            batch_tar_shape.append(self._get_target_shape(ori_shape))
														
 
															+            batch_trans_info.append(trans_info)
														
 
															         if to_tensor:
														
 
															             batch_im = paddle.to_tensor(batch_im)
														
 
															         else:
														
 
															             batch_im = np.asarray(batch_im)
														
 
															-        return batch_im, batch_tar_shape
														
 
															+        return (batch_im, ), batch_trans_info
														
 
															-    def _get_target_shape(self, ori_shape):
														
 
															-        if self.sr_factor is None:
														
 
															-            return ori_shape
														
 
															-        else:
														
 
															-            return calc_hr_shape(ori_shape, self.sr_factor)
														
 
															-
														
 
															-    @staticmethod
														
 
															-    def get_transforms_shape_info(batch_tar_shape, transforms):
														
 
															-        batch_restore_list = list()
														
 
															-        for tar_shape in batch_tar_shape:
														
 
															-            restore_list = list()
														
 
															-            h, w = tar_shape[0], tar_shape[1]
														
 
															-            for op in transforms:
														
 
															-                if op.__class__.__name__ == 'Resize':
														
 
															-                    restore_list.append(('resize', (h, w)))
														
 
															-                    h, w = op.target_size
														
 
															-                elif op.__class__.__name__ == 'ResizeByShort':
														
 
															-                    restore_list.append(('resize', (h, w)))
														
 
															-                    im_short_size = min(h, w)
														
 
															-                    im_long_size = max(h, w)
														
 
															-                    scale = float(op.short_size) / float(im_short_size)
														
 
															-                    if 0 < op.max_size < np.round(scale * im_long_size):
														
 
															-                        scale = float(op.max_size) / float(im_long_size)
														
 
															-                    h = int(round(h * scale))
														
 
															-                    w = int(round(w * scale))
														
 
															-                elif op.__class__.__name__ == 'ResizeByLong':
														
 
															-                    restore_list.append(('resize', (h, w)))
														
 
															-                    im_long_size = max(h, w)
														
 
															-                    scale = float(op.long_size) / float(im_long_size)
														
 
															-                    h = int(round(h * scale))
														
 
															-                    w = int(round(w * scale))
														
 
															-                elif op.__class__.__name__ == 'Pad':
														
 
															-                    if op.target_size:
														
 
															-                        target_h, target_w = op.target_size
														
 
															-                    else:
														
 
															-                        target_h = int(
														
 
															-                            (np.ceil(h / op.size_divisor) * op.size_divisor))
														
 
															-                        target_w = int(
														
 
															-                            (np.ceil(w / op.size_divisor) * op.size_divisor))
														
 
															-
														
 
															-                    if op.pad_mode == -1:
														
 
															-                        offsets = op.offsets
														
 
															-                    elif op.pad_mode == 0:
														
 
															-                        offsets = [0, 0]
														
 
															-                    elif op.pad_mode == 1:
														
 
															-                        offsets = [(target_h - h) // 2, (target_w - w) // 2]
														
 
															-                    else:
														
 
															-                        offsets = [target_h - h, target_w - w]
														
 
															-                    restore_list.append(('padding', (h, w), offsets))
														
 
															-                    h, w = target_h, target_w
														
 
															-
														
 
															-            batch_restore_list.append(restore_list)
														
 
															-        return batch_restore_list
														
 
															-
														
 
															-    def postprocess(self, batch_pred, batch_tar_shape, transforms):
														
 
															-        batch_restore_list = BaseRestorer.get_transforms_shape_info(
														
 
															-            batch_tar_shape, transforms)
														
 
															+    def postprocess(self, batch_pred, batch_restore_list):
														
 
															         if self.status == 'Infer':
														
 
															             return self._infer_postprocess(
														
 
															                 batch_res_map=batch_pred, batch_restore_list=batch_restore_list)
														
@@ -572,11 +509,15 @@ class BaseRestorer(BaseModel):
 
															             pred = paddle.unsqueeze(pred, axis=0)
														
 
															             for item in restore_list[::-1]:
														
 
															                 h, w = item[1][0], item[1][1]
														
 
															+                if self.sr_factor:
														
 
															+                    h, w = calc_hr_shape((h, w), self.sr_factor)
														
 
															                 if item[0] == 'resize':
														
 
															                     pred = F.interpolate(
														
 
															                         pred, (h, w), mode=mode, data_format='NCHW')
														
 
															                 elif item[0] == 'padding':
														
 
															                     x, y = item[2]
														
 
															+                    if self.sr_factor:
														
 
															+                        x, y = calc_hr_shape((x, y), self.sr_factor)
														
 
															                     pred = pred[:, :, y:y + h, x:x + w]
														
 
															                 else:
														
 
															                     pass
														
@@ -590,6 +531,8 @@ class BaseRestorer(BaseModel):
 
															                 res_map = paddle.unsqueeze(res_map, axis=0)
														
 
															             for item in restore_list[::-1]:
														
 
															                 h, w = item[1][0], item[1][1]
														
 
															+                if self.sr_factor:
														
 
															+                    h, w = calc_hr_shape((h, w), self.sr_factor)
														
 
															                 if item[0] == 'resize':
														
 
															                     if isinstance(res_map, np.ndarray):
														
 
															                         res_map = cv2.resize(
														
@@ -601,6 +544,8 @@ class BaseRestorer(BaseModel):
 
															                             data_format='NHWC')
														
 
															                 elif item[0] == 'padding':
														
 
															                     x, y = item[2]
														
 
															+                    if self.sr_factor:
														
 
															+                        x, y = calc_hr_shape((x, y), self.sr_factor)
														
 
															                     if isinstance(res_map, np.ndarray):
														
 
															                         res_map = res_map[y:y + h, x:x + w]
														
 
															                     else:
														
@@ -621,7 +566,11 @@ class BaseRestorer(BaseModel):
 
															             raise TypeError(
														
 
															                 "`transforms.arrange` must be an ArrangeRestorer object.")
														
 
															-    def build_data_loader(self, dataset, batch_size, mode='train'):
														
 
															+    def build_data_loader(self,
														
 
															+                          dataset,
														
 
															+                          batch_size,
														
 
															+                          mode='train',
														
 
															+                          collate_fn=None):
														
 
															         if dataset.num_samples < batch_size:
														
 
															             raise ValueError(
														
 
															                 'The volume of dataset({}) must be larger than batch size({}).'
														
@@ -633,7 +582,8 @@ class BaseRestorer(BaseModel):
 
															                 batch_size=batch_size,
														
 
															                 shuffle=dataset.shuffle,
														
 
															                 drop_last=False,
														
 
															-                collate_fn=dataset.batch_transforms,
														
 
															+                collate_fn=dataset.collate_fn
														
 
															+                if collate_fn is None else collate_fn,
														
 
															                 num_workers=dataset.num_workers,
														
 
															                 return_list=True,
														
 
															                 use_shared_memory=False)
														
@@ -758,7 +708,7 @@ class DRN(BaseRestorer):
 
															     def train_step(self, step, data, net):
														
 
															         outputs = self.run_gan(
														
 
															-            net, data, mode='train', gan_mode='forward_primary')
														
 
															+            net, data[0], mode='train', gan_mode='forward_primary')
														
 
															         outputs.update(
														
 
															             self.run_gan(
														
 
															                 net, (outputs['sr'], outputs['lr']),
														
@@ -800,6 +750,9 @@ class LESRCNN(BaseRestorer):
 
															 class ESRGAN(BaseRestorer):
														
 
															+
														
 
															+    find_unused_parameters = True
														
 
															+
														
 
															     def __init__(self,
														
 
															                  losses=None,
														
 
															                  sr_factor=4,
														
@@ -915,14 +868,14 @@ class ESRGAN(BaseRestorer):
 
															             optim_g, optim_d = self.optimizer
														
 
															             outputs = self.run_gan(
														
 
															-                net, data, mode='train', gan_mode='forward_g')
														
 
															+                net, data[0], mode='train', gan_mode='forward_g')
														
 
															             optim_g.clear_grad()
														
 
															             (outputs['loss_g_pps'] + outputs['loss_g_gan']).backward()
														
 
															             optim_g.step()
														
 
															             outputs.update(
														
 
															                 self.run_gan(
														
 
															-                    net, (outputs['g_pred'], data[1]),
														
 
															+                    net, (outputs['g_pred'], data[0][1]),
														
 
															                     mode='train',
														
 
															                     gan_mode='forward_d'))
														
 
															             optim_d.clear_grad()
														
--- a/paddlers/tasks/segmenter.py
+++ b/paddlers/tasks/segmenter.py
@@ -27,7 +27,7 @@ import paddlers.models.paddleseg as ppseg
 
															 import paddlers.rs_models.seg as cmseg
														
 
															 import paddlers.utils.logging as logging
														
 
															 from paddlers.models import seg_losses
														
 
															-from paddlers.transforms import Resize, decode_image
														
 
															+from paddlers.transforms import Resize, decode_image, construct_sample
														
 
															 from paddlers.utils import get_single_card_bs, DisablePrint
														
 
															 from paddlers.utils.checkpoint import seg_pretrain_weights_dict
														
 
															 from .base import BaseModel
														
@@ -64,7 +64,6 @@ class BaseSegmenter(BaseModel):
 
															         if params.get('with_net', True):
														
 
															             params.pop('with_net', None)
														
 
															             self.net = self.build_net(**params)
														
 
															-        self.find_unused_parameters = True
														
 
															     def build_net(self, **params):
														
 
															         # TODO: when using paddle.utils.unique_name.guard,
														
@@ -114,11 +113,11 @@ class BaseSegmenter(BaseModel):
 
															         return input_spec
														
 
															     def run(self, net, inputs, mode):
														
 
															+        inputs, batch_restore_list = inputs
														
 
															         net_out = net(inputs[0])
														
 
															         logit = net_out[0]
														
 
															         outputs = OrderedDict()
														
 
															         if mode == 'test':
														
 
															-            batch_restore_list = inputs[-1]
														
 
															             if self.status == 'Infer':
														
 
															                 label_map_list, score_map_list = self.postprocess(
														
 
															                     net_out, batch_restore_list)
														
@@ -139,7 +138,6 @@ class BaseSegmenter(BaseModel):
 
															             outputs['score_map'] = score_map_list
														
 
															         if mode == 'eval':
														
 
															-            batch_restore_list = inputs[-1]
														
 
															             if self.status == 'Infer':
														
 
															                 pred = paddle.unsqueeze(net_out[0], axis=1)  # NCHW
														
 
															             else:
														
@@ -526,10 +524,8 @@ class BaseSegmenter(BaseModel):
 
															             images = [img_file]
														
 
															         else:
														
 
															             images = img_file
														
 
															-        batch_im, batch_trans_info = self.preprocess(images, transforms,
														
 
															-                                                     self.model_type)
														
 
															+        data = self.preprocess(images, transforms, self.model_type)
														
 
															         self.net.eval()
														
 
															-        data = (batch_im, batch_trans_info)
														
 
															         outputs = self.run(self.net, data, 'test')
														
 
															         label_map_list = outputs['label_map']
														
 
															         score_map_list = outputs['score_map']
														
@@ -595,10 +591,10 @@ class BaseSegmenter(BaseModel):
 
															         for im in images:
														
 
															             if isinstance(im, str):
														
 
															                 im = decode_image(im, read_raw=True)
														
 
															-            sample = {'image': im}
														
 
															+            sample = construct_sample(image=im)
														
 
															             data = transforms(sample)
														
 
															-            im = data[0]
														
 
															-            trans_info = data[-1]
														
 
															+            im = data[0][0]
														
 
															+            trans_info = data[1]
														
 
															             batch_im.append(im)
														
 
															             batch_trans_info.append(trans_info)
														
 
															         if to_tensor:
														
@@ -606,7 +602,7 @@ class BaseSegmenter(BaseModel):
 
															         else:
														
 
															             batch_im = np.asarray(batch_im)
														
 
															-        return batch_im, batch_trans_info
														
 
															+        return (batch_im, ), batch_trans_info
														
 
															     def postprocess(self, batch_pred, batch_restore_list):
														
 
															         if isinstance(batch_pred, (tuple, list)) and self.status == 'Infer':
														
@@ -630,7 +626,7 @@ class BaseSegmenter(BaseModel):
 
															                     x, y = item[2]
														
 
															                     pred = pred[:, :, y:y + h, x:x + w]
														
 
															                 else:
														
 
															-                    pass
														
 
															+                    raise RuntimeError
														
 
															             results.append(pred)
														
 
															         return results
														
@@ -669,7 +665,7 @@ class BaseSegmenter(BaseModel):
 
															                         label_map = label_map[:, y:y + h, x:x + w, :]
														
 
															                         score_map = score_map[:, y:y + h, x:x + w, :]
														
 
															                 else:
														
 
															-                    pass
														
 
															+                    raise RuntimeError
														
 
															             label_map = label_map.squeeze()
														
 
															             score_map = score_map.squeeze()
														
 
															             if not isinstance(label_map, np.ndarray):
														
@@ -921,13 +917,13 @@ class C2FNet(BaseSegmenter):
 
															             **params)
														
 
															     def run(self, net, inputs, mode):
														
 
															+        inputs, batch_restore_list = inputs
														
 
															         with paddle.no_grad():
														
 
															             pre_coarse = self.coarse_model(inputs[0])
														
 
															             pre_coarse = pre_coarse[0]
														
 
															             heatmaps = pre_coarse
														
 
															         if mode == 'test':
														
 
															-            batch_restore_list = inputs[-1]
														
 
															             net_out = net(inputs[0], heatmaps)
														
 
															             logit = net_out[0]
														
 
															             outputs = OrderedDict()
														
@@ -952,7 +948,6 @@ class C2FNet(BaseSegmenter):
 
															             outputs['score_map'] = score_map_list
														
 
															         if mode == 'eval':
														
 
															-            batch_restore_list = inputs[-1]
														
 
															             net_out = net(inputs[0], heatmaps)
														
 
															             logit = net_out[0]
														
 
															             outputs = OrderedDict()
														
--- a/paddlers/transforms/batch_operators.py
+++ b/paddlers/transforms/batch_operators.py
@@ -27,7 +27,11 @@ from .box_utils import jaccard_overlap
 
															 from paddlers.utils import logging
														
 
															-class BatchCompose(Transform):
														
 
															+class BatchTransform(Transform):
														
 
															+    is_batch_transform = True
														
 
															+
														
 
															+
														
 
															+class BatchCompose(BatchTransform):
														
 
															     def __init__(self, batch_transforms=None, collate_batch=True):
														
 
															         super(BatchCompose, self).__init__()
														
 
															         self.batch_transforms = batch_transforms
														
@@ -40,14 +44,14 @@ class BatchCompose(Transform):
 
															                     samples = op(samples)
														
 
															                 except Exception as e:
														
 
															                     stack_info = traceback.format_exc()
														
 
															-                    logging.warning("fail to map batch transform [{}] "
														
 
															+                    logging.warning("Fail to map batch transform [{}] "
														
 
															                                     "with error: {} and stack:\n{}".format(
														
 
															                                         op, e, str(stack_info)))
														
 
															                     raise e
														
 
															         samples = _Permute()(samples)
														
 
															-        extra_key = ['h', 'w', 'flipped']
														
 
															+        extra_key = ['h', 'w', 'flipped', 'trans_info']
														
 
															         for k in extra_key:
														
 
															             for sample in samples:
														
 
															                 if k in sample:
														
@@ -70,7 +74,7 @@ class BatchCompose(Transform):
 
															         return batch_data
														
 
															-class BatchRandomResize(Transform):
														
 
															+class BatchRandomResize(BatchTransform):
														
 
															     """
														
 
															     Resize a batch of inputs to random sizes.
														
@@ -111,7 +115,7 @@ class BatchRandomResize(Transform):
 
															         return samples
														
 
															-class BatchRandomResizeByShort(Transform):
														
 
															+class BatchRandomResizeByShort(BatchTransform):
														
 
															     """
														
 
															     Resize a batch of inputs to random sizes while keeping the aspect ratio.
														
@@ -157,7 +161,7 @@ class BatchRandomResizeByShort(Transform):
 
															         return samples
														
 
															-class _BatchPad(Transform):
														
 
															+class _BatchPad(BatchTransform):
														
 
															     def __init__(self, pad_to_stride=0):
														
 
															         super(_BatchPad, self).__init__()
														
 
															         self.pad_to_stride = pad_to_stride
														
@@ -182,7 +186,7 @@ class _BatchPad(Transform):
 
															         return samples
														
 
															-class _Gt2YoloTarget(Transform):
														
 
															+class _Gt2YoloTarget(BatchTransform):
														
 
															     """
														
 
															     Generate YOLOv3 targets by groud truth data, this operator is only used in
														
 
															         fine grained YOLOv3 loss mode.
														
--- a/paddlers/transforms/operators.py
+++ b/paddlers/transforms/operators.py
@@ -18,6 +18,7 @@ import random
 
															 from numbers import Number
														
 
															 from functools import partial
														
 
															 from operator import methodcaller
														
 
															+from collections import OrderedDict
														
 
															 from collections.abc import Sequence
														
 
															 import numpy as np
														
@@ -32,6 +33,8 @@ import paddlers.transforms.indices as indices
 
															 import paddlers.transforms.satellites as satellites
														
 
															 __all__ = [
														
 
															+    "construct_sample",
														
 
															+    "construct_sample_from_dict",
														
 
															     "Compose",
														
 
															     "DecodeImg",
														
 
															     "Resize",
														
@@ -74,6 +77,19 @@ interp_dict = {
 
															 }
														
 
															+def construct_sample(**kwargs):
														
 
															+    sample = OrderedDict()
														
 
															+    for k, v in kwargs.items():
														
 
															+        sample[k] = v
														
 
															+    if 'trans_info' not in sample:
														
 
															+        sample['trans_info'] = []
														
 
															+    return sample
														
 
															+
														
 
															+
														
 
															+def construct_sample_from_dict(dict_like_obj):
														
 
															+    return construct_sample(**dict_like_obj)
														
 
															+
														
 
															+
														
 
															 class Compose(object):
														
 
															     """
														
 
															     Apply a series of data augmentation strategies to the input.
														
@@ -107,17 +123,17 @@ class Compose(object):
 
															         This is equivalent to sequentially calling compose_obj.apply_transforms() 
														
 
															             and compose_obj.arrange_outputs().
														
 
															         """
														
 
															-
														
 
															+        if 'trans_info' not in sample:
														
 
															+            sample['trans_info'] = []
														
 
															         sample = self.apply_transforms(sample)
														
 
															+        trans_info = sample['trans_info']
														
 
															         sample = self.arrange_outputs(sample)
														
 
															-        return sample
														
 
															+        return sample, trans_info
														
 
															     def apply_transforms(self, sample):
														
 
															         for op in self.transforms:
														
 
															-            # Skip batch transforms amd mixup
														
 
															-            if isinstance(op, (paddlers.transforms.BatchRandomResize,
														
 
															-                               paddlers.transforms.BatchRandomResizeByShort,
														
 
															-                               MixupImage)):
														
 
															+            # Skip batch transforms
														
 
															+            if getattr(op, 'is_batch_transform', False):
														
 
															                 continue
														
 
															             sample = op(sample)
														
 
															         return sample
														
@@ -373,11 +389,6 @@ class DecodeImg(Transform):
 
															             else:
														
 
															                 sample['target'] = self.apply_im(sample['target'])
														
 
															-        # the `trans_info` will save the process of image shape,
														
 
															-        # and will be used in evaluation and prediction.
														
 
															-        if 'trans_info' not in sample:
														
 
															-            sample['trans_info'] = []
														
 
															-
														
 
															         sample['im_shape'] = np.array(
														
 
															             sample['image'].shape[:2], dtype=np.float32)
														
 
															         sample['scale_factor'] = np.array([1., 1.], dtype=np.float32)
														
@@ -1474,6 +1485,8 @@ class Pad(Transform):
 
															 class MixupImage(Transform):
														
 
															+    is_batch_transform = True
														
 
															+
														
 
															     def __init__(self, alpha=1.5, beta=1.5, mixup_epoch=-1):
														
 
															         """
														
 
															         Mixup two images and their gt_bbbox/gt_score.
														
@@ -2073,13 +2086,12 @@ class ArrangeSegmenter(Arrange):
 
															             mask = sample['mask']
														
 
															             mask = mask.astype('int64')
														
 
															         image = F.permute(sample['image'], False)
														
 
															-        trans_info = sample['trans_info']
														
 
															         if self.mode == 'train':
														
 
															             return image, mask
														
 
															         if self.mode == 'eval':
														
 
															-            return image, mask, trans_info
														
 
															+            return image, mask
														
 
															         if self.mode == 'test':
														
 
															-            return image, trans_info,
														
 
															+            return image,
														
 
															 class ArrangeChangeDetector(Arrange):
														
@@ -2089,7 +2101,6 @@ class ArrangeChangeDetector(Arrange):
 
															             mask = mask.astype('int64')
														
 
															         image_t1 = F.permute(sample['image'], False)
														
 
															         image_t2 = F.permute(sample['image2'], False)
														
 
															-        trans_info = sample['trans_info']
														
 
															         if self.mode == 'train':
														
 
															             masks = [mask]
														
 
															             if 'aux_masks' in sample:
														
@@ -2099,9 +2110,9 @@ class ArrangeChangeDetector(Arrange):
 
															                 image_t1,
														
 
															                 image_t2, ) + tuple(masks)
														
 
															         if self.mode == 'eval':
														
 
															-            return image_t1, image_t2, mask, trans_info
														
 
															+            return image_t1, image_t2, mask
														
 
															         if self.mode == 'test':
														
 
															-            return image_t1, image_t2, trans_info
														
 
															+            return image_t1, image_t2
														
 
															 class ArrangeClassifier(Arrange):
														
@@ -2110,7 +2121,7 @@ class ArrangeClassifier(Arrange):
 
															         if self.mode in ['train', 'eval']:
														
 
															             return image, sample['label']
														
 
															         else:
														
 
															-            return image
														
 
															+            return image,
														
 
															 class ArrangeDetector(Arrange):
														
--- a/paddlers/utils/download.py
+++ b/paddlers/utils/download.py
@@ -22,7 +22,6 @@ import hashlib
 
															 import tarfile
														
 
															 import zipfile
														
 
															-import filelock
														
 
															 import paddle
														
 
															 from . import logging
														
--- a/paddlers/utils/postprocs/__init__.py
+++ b/paddlers/utils/postprocs/__init__.py
@@ -23,5 +23,5 @@ try:
 
															     from .crf import conditional_random_field

														
 
															 except ImportError:

														
 
															     print(

														
 
															-        "Can not use `conditional_random_field`. Please install pydensecrf first!"

														
 
															+        "Can not use `conditional_random_field`. Please install pydensecrf first."

														
 
															     )

														
--- a/requirements.txt
+++ b/requirements.txt
@@ -15,12 +15,14 @@ opencv-contrib-python >= 4.3.0
 
															 openpyxl
														
 
															 # paddlepaddle >= 2.2.0
														
 
															 # paddlepaddle-gpu >= 2.2.0
														
 
															-paddleslim >= 2.2.1,< 2.3.5
														
 
															+paddleslim >= 2.2.1, < 2.3.5
														
 
															 pandas
														
 
															+protobuf >= 3.1.0, <= 3.20.0
														
 
															 pycocotools
														
 
															 # pydensecrf
														
 
															-scikit-learn == 0.23.2
														
 
															+scikit-learn
														
 
															 scikit-image >= 0.14.0
														
 
															 scipy
														
 
															 shapely
														
 
															+spyndex
														
 
															 visualdl >= 2.1.1
														
--- a/setup.py
+++ b/setup.py
@@ -13,34 +13,38 @@
 
															 # limitations under the License.
														
 
															 import setuptools
														
 
															-import paddlers
														
 
															-DESCRIPTION = "Awesome Remote Sensing Toolkit based on PaddlePaddle"
														
 
															+if __name__ == '__main__':
														
 
															+    DESCRIPTION = "Awesome Remote Sensing Toolkit based on PaddlePaddle"
														
 
															-with open("README.md", "r", encoding='utf8') as fh:
														
 
															-    LONG_DESCRIPTION = fh.read()
														
 
															+    with open("README_EN.md", 'r', encoding='utf8') as fh:
														
 
															+        LONG_DESCRIPTION = fh.read()
														
 
															-with open("requirements.txt") as fin:
														
 
															-    REQUIRED_PACKAGES = fin.read()
														
 
															+    with open("requirements.txt", 'r') as fin:
														
 
															+        REQUIRED_PACKAGES = fin.read()
														
 
															-setuptools.setup(
														
 
															-    name="paddlers",
														
 
															-    version=paddlers.__version__.replace('-', ''),
														
 
															-    author='PaddleRS Authors',
														
 
															-    author_email="",
														
 
															-    description=DESCRIPTION,
														
 
															-    long_description=LONG_DESCRIPTION,
														
 
															-    long_description_content_type="text/plain",
														
 
															-    url="https://github.com/PaddlePaddle/PaddleRS",
														
 
															-    packages=setuptools.find_packages(include=['paddlers', 'paddlers.*']),
														
 
															-    python_requires='>=3.7',
														
 
															-    setup_requires=['cython', 'numpy'],
														
 
															-    install_requires=REQUIRED_PACKAGES,
														
 
															-    classifiers=[
														
 
															-        "Programming Language :: Python :: 3.7",
														
 
															-        "Programming Language :: Python :: 3.8",
														
 
															-        "Programming Language :: Python :: 3.9",
														
 
															-        "License :: OSI Approved :: Apache Software License",
														
 
															-        "Operating System :: OS Independent",
														
 
															-    ],
														
 
															-    license='Apache 2.0', )
														
 
															+    with open("paddlers/.version", 'r') as fv:
														
 
															+        VERSION = fv.read().rstrip()
														
 
															+
														
 
															+    setuptools.setup(
														
 
															+        name="paddlers",
														
 
															+        version=VERSION.replace('-', ''),
														
 
															+        author='PaddleRS Authors',
														
 
															+        author_email="",
														
 
															+        description=DESCRIPTION,
														
 
															+        long_description=LONG_DESCRIPTION,
														
 
															+        long_description_content_type="text/plain",
														
 
															+        url="https://github.com/PaddlePaddle/PaddleRS",
														
 
															+        packages=setuptools.find_packages(include=['paddlers', 'paddlers.*']) +
														
 
															+        setuptools.find_namespace_packages(include=['paddlers', 'paddlers.*']),
														
 
															+        python_requires='>=3.7',
														
 
															+        setup_requires=['cython', 'numpy'],
														
 
															+        install_requires=REQUIRED_PACKAGES,
														
 
															+        classifiers=[
														
 
															+            "Programming Language :: Python :: 3.7",
														
 
															+            "Programming Language :: Python :: 3.8",
														
 
															+            "Programming Language :: Python :: 3.9",
														
 
															+            "License :: OSI Approved :: Apache Software License",
														
 
															+            "Operating System :: OS Independent",
														
 
															+        ],
														
 
															+        license='Apache 2.0', )
														
--- a/test_tipc/common_func.sh
+++ b/test_tipc/common_func.sh
@@ -1,35 +1,35 @@
 
															 #!/bin/bash
														
 
															 function func_parser_key() {
														
 
															-    strs=$1
														
 
															-    IFS=":"
														
 
															-    array=(${strs})
														
 
															-    tmp=${array[0]}
														
 
															+    local strs=$1
														
 
															+    local IFS=':'
														
 
															+    local array=(${strs})
														
 
															+    local tmp=${array[0]}
														
 
															     echo ${tmp}
														
 
															 }
														
 
															 function func_parser_value() {
														
 
															-    strs=$1
														
 
															-    IFS=":"
														
 
															-    array=(${strs})
														
 
															-    tmp=${array[1]}
														
 
															+    local strs=$1
														
 
															+    local IFS=':'
														
 
															+    local array=(${strs})
														
 
															+    local tmp=${array[1]}
														
 
															     echo ${tmp}
														
 
															 }
														
 
															 function func_parser_value_lite() {
														
 
															-    strs=$1
														
 
															-    IFS=$2
														
 
															-    array=(${strs})
														
 
															-    tmp=${array[1]}
														
 
															+    local strs=$1
														
 
															+    local IFS=$2
														
 
															+    local array=(${strs})
														
 
															+    local tmp=${array[1]}
														
 
															     echo ${tmp}
														
 
															 }
														
 
															 function func_set_params() {
														
 
															-    key=$1
														
 
															-    value=$2
														
 
															-    if [ ${key}x = "null"x ];then
														
 
															+    local key=$1
														
 
															+    local value=$2
														
 
															+    if [ ${key}x = 'null'x ];then
														
 
															         echo " "
														
 
															-    elif [[ ${value} = "null" ]] || [[ ${value} = " " ]] || [ ${#value} -le 0 ];then
														
 
															+    elif [[ ${value} = 'null' ]] || [[ ${value} = ' ' ]] || [ ${#value} -le 0 ];then
														
 
															         echo " "
														
 
															     else 
														
 
															         echo "${key}=${value}"
														
@@ -37,21 +37,20 @@ function func_set_params() {
 
															 }
														
 
															 function func_parser_params() {
														
 
															-    strs=$1
														
 
															-    IFS=":"
														
 
															-    array=(${strs})
														
 
															-    key=${array[0]}
														
 
															-    tmp=${array[1]}
														
 
															-    IFS="|"
														
 
															-    res=""
														
 
															+    local strs=$1
														
 
															+    local IFS=':'
														
 
															+    local array=(${strs})
														
 
															+    local key=${array[0]}
														
 
															+    local tmp=${array[1]}
														
 
															+    local IFS='|'
														
 
															+    local res=''
														
 
															     for _params in ${tmp[*]}; do
														
 
															-        IFS="="
														
 
															-        array=(${_params})
														
 
															-        mode=${array[0]}
														
 
															-        value=${array[1]}
														
 
															+        local IFS='='
														
 
															+        local array=(${_params})
														
 
															+        local mode=${array[0]}
														
 
															+        local value=${array[1]}
														
 
															         if [[ ${mode} = ${MODE} ]]; then
														
 
															-            IFS="|"
														
 
															-            #echo $(func_set_params "${mode}" "${value}")
														
 
															+            local IFS='|'
														
 
															             echo $value
														
 
															             break
														
 
															         fi
														
@@ -112,14 +111,14 @@ function add_suffix() {
 
															 function parse_first_value() {
														
 
															     local key_values=$1
														
 
															-    local IFS=":"
														
 
															+    local IFS=':'
														
 
															     local arr=(${key_values})
														
 
															     echo ${arr[1]}
														
 
															 }
														
 
															 function parse_second_value() {
														
 
															     local key_values=$1
														
 
															-    local IFS=":"
														
 
															+    local IFS=':'
														
 
															     local arr=(${key_values})
														
 
															     echo ${arr[2]}
														
 
															 }
														
--- a/test_tipc/configs/seg/_base_/rsseg.yaml
+++ b/test_tipc/configs/seg/_base_/rsseg.yaml
@@ -51,6 +51,8 @@ transforms:
 
															           args:
														
 
															             mean: [0.5, 0.5, 0.5]
														
 
															             std: [0.5, 0.5, 0.5]
														
 
															+        - !Node
														
 
															+          type: ReloadMask
														
 
															         - !Node
														
 
															           type: ArrangeSegmenter
														
 
															           args: ['eval']
														
--- a/test_tipc/configs/seg/factseg/train_infer_python.txt
+++ b/test_tipc/configs/seg/factseg/train_infer_python.txt
@@ -1,7 +1,7 @@
 
															 ===========================train_params===========================
														
 
															 model_name:seg:factseg
														
 
															 python:python
														
 
															-gpu_list:0
														
 
															+gpu_list:0|0,1
														
 
															 use_gpu:null|null
														
 
															 --precision:null
														
 
															 --num_epochs:lite_train_lite_infer=3|lite_train_whole_infer=3|whole_train_whole_infer=20
														
--- a/test_tipc/infer.py
+++ b/test_tipc/infer.py
@@ -143,45 +143,32 @@ class TIPCPredictor(object):
 
															         return config
														
 
															     def preprocess(self, images, transforms):
														
 
															-        preprocessed_samples = self._model.preprocess(
														
 
															+        preprocessed_samples, batch_trans_info = self._model.preprocess(
														
 
															             images, transforms, to_tensor=False)
														
 
															         if self._model.model_type == 'classifier':
														
 
															-            preprocessed_samples = {'image': preprocessed_samples[0]}
														
 
															+            preprocessed_samples = {'image': preprocessed_samples}
														
 
															         elif self._model.model_type == 'segmenter':
														
 
															-            preprocessed_samples = {
														
 
															-                'image': preprocessed_samples[0],
														
 
															-                'ori_shape': preprocessed_samples[1]
														
 
															-            }
														
 
															+            preprocessed_samples = {'image': preprocessed_samples[0]}
														
 
															         elif self._model.model_type == 'detector':
														
 
															             pass
														
 
															         elif self._model.model_type == 'change_detector':
														
 
															             preprocessed_samples = {
														
 
															                 'image': preprocessed_samples[0],
														
 
															-                'image2': preprocessed_samples[1],
														
 
															-                'ori_shape': preprocessed_samples[2]
														
 
															+                'image2': preprocessed_samples[1]
														
 
															             }
														
 
															         elif self._model.model_type == 'restorer':
														
 
															-            preprocessed_samples = {
														
 
															-                'image': preprocessed_samples[0],
														
 
															-                'tar_shape': preprocessed_samples[1]
														
 
															-            }
														
 
															+            preprocessed_samples = {'image': preprocessed_samples[0]}
														
 
															         else:
														
 
															             logging.error(
														
 
															-                "Invalid model type {}".format(self._model.model_type),
														
 
															-                exit=True)
														
 
															-        return preprocessed_samples
														
 
															-
														
 
															-    def postprocess(self,
														
 
															-                    net_outputs,
														
 
															-                    topk=1,
														
 
															-                    ori_shape=None,
														
 
															-                    tar_shape=None,
														
 
															-                    transforms=None):
														
 
															+                "Invalid model type {}".format(self.model_type), exit=True)
														
 
															+        return preprocessed_samples, batch_trans_info
														
 
															+
														
 
															+    def postprocess(self, net_outputs, batch_restore_list, topk=1):
														
 
															         if self._model.model_type == 'classifier':
														
 
															             true_topk = min(self._model.num_classes, topk)
														
 
															             if self._model.postprocess is None:
														
 
															                 self._model.build_postprocess_from_labels(topk)
														
 
															-            # XXX: Convert ndarray to tensor as self._model.postprocess requires
														
 
															+            # XXX: Convert ndarray to tensor as `self._model.postprocess` requires
														
 
															             assert len(net_outputs) == 1
														
 
															             net_outputs = paddle.to_tensor(net_outputs[0])
														
 
															             outputs = self._model.postprocess(net_outputs)
														
@@ -195,9 +182,7 @@ class TIPCPredictor(object):
 
															             } for l, s, n in zip(class_ids, scores, label_names)]
														
 
															         elif self._model.model_type in ('segmenter', 'change_detector'):
														
 
															             label_map, score_map = self._model.postprocess(
														
 
															-                net_outputs,
														
 
															-                batch_origin_shape=ori_shape,
														
 
															-                transforms=transforms.transforms)
														
 
															+                net_outputs, batch_restore_list=batch_restore_list)
														
 
															             preds = [{
														
 
															                 'label_map': l,
														
 
															                 'score_map': s
														
@@ -210,14 +195,11 @@ class TIPCPredictor(object):
 
															             preds = self._model.postprocess(net_outputs)
														
 
															         elif self._model.model_type == 'restorer':
														
 
															             res_maps = self._model.postprocess(
														
 
															-                net_outputs[0],
														
 
															-                batch_tar_shape=tar_shape,
														
 
															-                transforms=transforms.transforms)
														
 
															+                net_outputs[0], batch_restore_list=batch_restore_list)
														
 
															             preds = [{'res_map': res_map} for res_map in res_maps]
														
 
															         else:
														
 
															             logging.error(
														
 
															-                "Invalid model type {}.".format(self._model.model_type),
														
 
															-                exit=True)
														
 
															+                "Invalid model type {}.".format(self.model_type), exit=True)
														
 
															         return preds
														
@@ -225,7 +207,8 @@ class TIPCPredictor(object):
 
															         if self.benchmark and time_it:
														
 
															             self.autolog.times.start()
														
 
															-        preprocessed_input = self.preprocess(images, transforms)
														
 
															+        preprocessed_input, batch_trans_info = self.preprocess(images,
														
 
															+                                                               transforms)
														
 
															         input_names = self.predictor.get_input_names()
														
 
															         for name in input_names:
														
@@ -247,11 +230,7 @@ class TIPCPredictor(object):
 
															             self.autolog.times.stamp()
														
 
															         res = self.postprocess(
														
 
															-            net_outputs,
														
 
															-            topk,
														
 
															-            ori_shape=preprocessed_input.get('ori_shape', None),
														
 
															-            tar_shape=preprocessed_input.get('tar_shape', None),
														
 
															-            transforms=transforms)
														
 
															+            net_outputs, batch_restore_list=batch_trans_info, topk=topk)
														
 
															         if self.benchmark and time_it:
														
 
															             self.autolog.times.end(stamp=True)
														
--- a/tests/data/data_utils.py
+++ b/tests/data/data_utils.py
@@ -20,6 +20,8 @@ from functools import partial, wraps
 
															 import numpy as np
														
 
															+from paddlers.transforms import construct_sample
														
 
															+
														
 
															 __all__ = ['build_input_from_file']
														
@@ -78,19 +80,17 @@ class ConstrSample(object):
 
															 class ConstrSegSample(ConstrSample):
														
 
															     def __call__(self, im_path, mask_path):
														
 
															-        return {
														
 
															-            'image': self.get_full_path(im_path),
														
 
															-            'mask': self.get_full_path(mask_path)
														
 
															-        }
														
 
															+        return construct_sample(
														
 
															+            image=self.get_full_path(im_path),
														
 
															+            mask=self.get_full_path(mask_path))
														
 
															 class ConstrCdSample(ConstrSample):
														
 
															     def __call__(self, im1_path, im2_path, mask_path, *aux_mask_paths):
														
 
															-        sample = {
														
 
															-            'image_t1': self.get_full_path(im1_path),
														
 
															-            'image_t2': self.get_full_path(im2_path),
														
 
															-            'mask': self.get_full_path(mask_path)
														
 
															-        }
														
 
															+        sample = construct_sample(
														
 
															+            image_t1=self.get_full_path(im1_path),
														
 
															+            image_t2=self.get_full_path(im2_path),
														
 
															+            mask=self.get_full_path(mask_path))
														
 
															         if len(aux_mask_paths) > 0:
														
 
															             sample['aux_masks'] = [
														
 
															                 self.get_full_path(p) for p in aux_mask_paths
														
@@ -100,7 +100,8 @@ class ConstrCdSample(ConstrSample):
 
															 class ConstrClasSample(ConstrSample):
														
 
															     def __call__(self, im_path, label):
														
 
															-        return {'image': self.get_full_path(im_path), 'label': int(label)}
														
 
															+        return construct_sample(
														
 
															+            image=self.get_full_path(im_path), label=int(label))
														
 
															 class ConstrDetSample(ConstrSample):
														
@@ -234,7 +235,7 @@ class ConstrDetSample(ConstrSample):
 
															         }
														
 
															         self.ct += 1
														
 
															-        return {'image': im_path, ** im_info, ** label_info}
														
 
															+        return construct_sample(image=im_path, **im_info, **label_info)
														
 
															     @silent
														
 
															     def _parse_coco_files(self, im_dir, ann_path):
														
@@ -303,7 +304,7 @@ class ConstrDetSample(ConstrSample):
 
															                 'difficult': np.array(difficults),
														
 
															             }
														
 
															-            samples.append({ ** im_info, ** label_info})
														
 
															+            samples.append(construct_sample(**im_info, **label_info))
														
 
															         return samples
														
@@ -314,10 +315,9 @@ class ConstrResSample(ConstrSample):
 
															         self.sr_factor = sr_factor
														
 
															     def __call__(self, src_path, tar_path):
														
 
															-        sample = {
														
 
															-            'image': self.get_full_path(src_path),
														
 
															-            'target': self.get_full_path(tar_path)
														
 
															-        }
														
 
															+        sample = construct_sample(
														
 
															+            image=self.get_full_path(src_path),
														
 
															+            target=self.get_full_path(tar_path))
														
 
															         if self.sr_factor is not None:
														
 
															             sample['sr_factor'] = self.sr_factor
														
 
															         return sample
														
--- a/tests/postpros/test_postpros.py
+++ b/tests/postpros/test_postpros.py
@@ -16,8 +16,8 @@ import copy
 
															 from PIL import Image

														
 
															 import numpy as np

														
 
															-

														
 
															 import paddle

														
 
															+

														
 
															 import paddlers.utils.postprocs as P

														
 
															 from testing_utils import CpuCommonTest

														
--- a/tutorials/train/change_detection/data/.gitignore
+++ b/tutorials/train/change_detection/data/.gitignore
@@ -1,3 +1,4 @@
 
															+*.path
														
 
															 *.zip
														
 
															 *.tar.gz
														
 
															 airchange/
														
--- a/tutorials/train/classification/data/.gitignore
+++ b/tutorials/train/classification/data/.gitignore
@@ -1,3 +1,4 @@
 
															+*.path
														
 
															 *.zip
														
 
															 *.tar.gz
														
 
															 ucmerced/
														
--- a/tutorials/train/image_restoration/data/.gitignore
+++ b/tutorials/train/image_restoration/data/.gitignore
@@ -1,3 +1,4 @@
 
															+*.path
														
 
															 *.zip
														
 
															 *.tar.gz
														
 
															 rssr/
														
--- a/tutorials/train/object_detection/data/.gitignore
+++ b/tutorials/train/object_detection/data/.gitignore
@@ -1,3 +1,4 @@
 
															+*.path
														
 
															 *.zip
														
 
															 *.tar.gz
														
 
															 sarship/
														
--- a/tutorials/train/semantic_segmentation/data/.gitignore
+++ b/tutorials/train/semantic_segmentation/data/.gitignore
@@ -1,3 +1,4 @@
 
															+*.path
														
 
															 *.zip
														
 
															 *.tar.gz
														
 
															 rsseg/