1 年之前 · b5c716c8c8
--- a/paddlers/tasks/change_detector.py
+++ b/paddlers/tasks/change_detector.py
@@ -29,7 +29,7 @@ import paddlers.rs_models.cd as cmcd
 
															 import paddlers.utils.logging as logging
														
 
															 from paddlers.models import seg_losses
														
 
															 from paddlers.transforms import Resize, decode_image, construct_sample
														
 
															-from paddlers.utils import get_single_card_bs
														
 
															+from paddlers.utils import to_data_parallel
														
 
															 from paddlers.utils.checkpoint import cd_pretrain_weights_dict
														
 
															 from .base import BaseModel
														
 
															 from .utils import seg_metrics as metrics
														
@@ -447,25 +447,22 @@ class BaseChangeDetector(BaseModel):
 
															         """
														
 
															         self._check_transforms(eval_dataset.transforms)
														
 
															+        net = self.net
														
 
															+        net.eval()
														
 
															-        self.net.eval()
														
 
															+        # XXX: Hard-coding
														
 
															         nranks = paddle.distributed.get_world_size()
														
 
															-        local_rank = paddle.distributed.get_rank()
														
 
															         if nranks > 1:
														
 
															             # Initialize parallel environment if not done.
														
 
															-            if not (paddle.distributed.parallel.parallel_helper.
														
 
															-                    _is_parallel_ctx_initialized()):
														
 
															+            if not paddle.distributed.parallel.parallel_helper._is_parallel_ctx_initialized(
														
 
															+            ):
														
 
															                 paddle.distributed.init_parallel_env()
														
 
															+                net = to_data_parallel(
														
 
															+                    net, find_unused_parameters=self.find_unused_parameters)
														
 
															+            else:
														
 
															+                net = to_data_parallel(
														
 
															+                    net, find_unused_parameters=self.find_unused_parameters)
														
 
															-        batch_size_each_card = get_single_card_bs(batch_size)
														
 
															-        if batch_size_each_card > 1:
														
 
															-            batch_size_each_card = 1
														
 
															-            batch_size = batch_size_each_card * paddlers.env_info['num']
														
 
															-            logging.warning(
														
 
															-                "ChangeDetector only supports batch_size=1 for each gpu/cpu card " \
														
 
															-                "during evaluation, so batch_size " \
														
 
															-                "is forcibly set to {}.".format(batch_size)
														
 
															-            )
														
 
															         self.eval_data_loader = self.build_data_loader(
														
 
															             eval_dataset, batch_size=batch_size, mode='eval')
														
@@ -485,9 +482,9 @@ class BaseChangeDetector(BaseModel):
 
															                             enable=True,
														
 
															                             custom_white_list=self.custom_white_list,
														
 
															                             custom_black_list=self.custom_black_list):
														
 
															-                        outputs = self.run(self.net, data, 'eval')
														
 
															+                        outputs = self.run(net, data, 'eval')
														
 
															                 else:
														
 
															-                    outputs = self.run(self.net, data, 'eval')
														
 
															+                    outputs = self.run(net, data, 'eval')
														
 
															                 pred_area = outputs['pred_area']
														
 
															                 label_area = outputs['label_area']
														
 
															                 intersect_area = outputs['intersect_area']
														
@@ -694,6 +691,8 @@ class BaseChangeDetector(BaseModel):
 
															                 else:
														
 
															                     raise RuntimeError
														
 
															             results.append(pred)
														
 
															+        if len(results) > 1:
														
 
															+            results = [paddle.concat(results, axis=0)]
														
 
															         return results
														
 
															     def _infer_postprocess(self, batch_label_map, batch_score_map,
														
--- a/paddlers/tasks/classifier.py
+++ b/paddlers/tasks/classifier.py
@@ -25,6 +25,7 @@ import paddlers.models.ppcls as ppcls
 
															 import paddlers.rs_models.clas as cmcls
														
 
															 import paddlers.utils.logging as logging
														
 
															 from paddlers.models.ppcls.metric import build_metrics
														
 
															+from paddlers.utils import to_data_parallel
														
 
															 from paddlers.models import clas_losses
														
 
															 from paddlers.models.ppcls.data.postprocess import build_postprocess
														
 
															 from paddlers.utils.checkpoint import cls_pretrain_weights_dict
														
@@ -402,54 +403,67 @@ class BaseClassifier(BaseModel):
 
															         """
														
 
															         self._check_transforms(eval_dataset.transforms)
														
 
															+        net = self.net
														
 
															+        net.eval()
														
 
															-        self.net.eval()
														
 
															+        # XXX: Hard-coding
														
 
															         nranks = paddle.distributed.get_world_size()
														
 
															-        local_rank = paddle.distributed.get_rank()
														
 
															         if nranks > 1:
														
 
															             # Initialize parallel environment if not done.
														
 
															             if not paddle.distributed.parallel.parallel_helper._is_parallel_ctx_initialized(
														
 
															             ):
														
 
															                 paddle.distributed.init_parallel_env()
														
 
															+                net = to_data_parallel(
														
 
															+                    net, find_unused_parameters=self.find_unused_parameters)
														
 
															+            else:
														
 
															+                net = to_data_parallel(
														
 
															+                    net, find_unused_parameters=self.find_unused_parameters)
														
 
															+
														
 
															+        self.eval_data_loader = self.build_data_loader(
														
 
															+            eval_dataset, batch_size=batch_size, mode='eval')
														
 
															+        logging.info("Start to evaluate (total_samples={}, total_steps={})...".
														
 
															+                     format(eval_dataset.num_samples, eval_dataset.num_samples))
														
 
															+
														
 
															+        top1s = []
														
 
															+        top5s = []
														
 
															+        with paddle.no_grad():
														
 
															+            for step, data in enumerate(self.eval_data_loader):
														
 
															+                if self.precision == 'fp16':
														
 
															+                    with paddle.amp.auto_cast(
														
 
															+                            level=self.amp_level,
														
 
															+                            enable=True,
														
 
															+                            custom_white_list=self.custom_white_list,
														
 
															+                            custom_black_list=self.custom_black_list):
														
 
															+                        outputs = self.run(net, data, 'eval')
														
 
															+                else:
														
 
															+                    outputs = self.run(net, data, 'eval')
														
 
															+                if nranks > 1:
														
 
															+                    t1 = outputs["top1"]
														
 
															+                    t5 = outputs["top5"]
														
 
															+                    t1s = []
														
 
															+                    t5s = []
														
 
															+                    paddle.distributed.all_gather(t1s, t1)
														
 
															+                    paddle.distributed.all_gather(t5s, t5)
														
 
															+                    for rank_id in range(nranks):
														
 
															+                        top1 = t1s[rank_id]
														
 
															+                        top5 = t5s[rank_id]
														
 
															+                        for i in range(data['image'].shape[0]):
														
 
															+                            top1s.append(top1)
														
 
															+                            top5s.append(top5)
														
 
															+                else:
														
 
															+                    for i in range(data['image'].shape[0]):
														
 
															+                        top1s.append(outputs["top1"])
														
 
															+                        top5s.append(outputs["top5"])
														
 
															+
														
 
															+        top1 = np.mean(top1s)
														
 
															+        top5 = np.mean(top5s)
														
 
															+        eval_metrics = OrderedDict(zip(['top1', 'top5'], [top1, top5]))
														
 
															+
														
 
															+        if return_details:
														
 
															+            # TODO: Add details
														
 
															+            return eval_metrics, None
														
 
															-        if batch_size > 1:
														
 
															-            logging.warning(
														
 
															-                "Classifier only supports single card evaluation with batch_size=1 "
														
 
															-                "during evaluation, so batch_size is forcibly set to 1.")
														
 
															-            batch_size = 1
														
 
															-
														
 
															-        if nranks < 2 or local_rank == 0:
														
 
															-            self.eval_data_loader = self.build_data_loader(
														
 
															-                eval_dataset, batch_size=batch_size, mode='eval')
														
 
															-            logging.info(
														
 
															-                "Start to evaluate (total_samples={}, total_steps={})...".
														
 
															-                format(eval_dataset.num_samples, eval_dataset.num_samples))
														
 
															-
														
 
															-            top1s = []
														
 
															-            top5s = []
														
 
															-            with paddle.no_grad():
														
 
															-                for step, data in enumerate(self.eval_data_loader):
														
 
															-                    if self.precision == 'fp16':
														
 
															-                        with paddle.amp.auto_cast(
														
 
															-                                level=self.amp_level,
														
 
															-                                enable=True,
														
 
															-                                custom_white_list=self.custom_white_list,
														
 
															-                                custom_black_list=self.custom_black_list):
														
 
															-                            outputs = self.run(self.net, data, 'eval')
														
 
															-                    else:
														
 
															-                        outputs = self.run(self.net, data, 'eval')
														
 
															-                    top1s.append(outputs["top1"])
														
 
															-                    top5s.append(outputs["top5"])
														
 
															-
														
 
															-            top1 = np.mean(top1s)
														
 
															-            top5 = np.mean(top5s)
														
 
															-            eval_metrics = OrderedDict(zip(['top1', 'top5'], [top1, top5]))
														
 
															-
														
 
															-            if return_details:
														
 
															-                # TODO: Add details
														
 
															-                return eval_metrics, None
														
 
															-
														
 
															-            return eval_metrics
														
 
															+        return eval_metrics
														
 
															     @paddle.no_grad()
														
 
															     def predict(self, img_file, transforms=None):
														
--- a/paddlers/tasks/object_detector.py
+++ b/paddlers/tasks/object_detector.py
@@ -31,6 +31,7 @@ from paddlers.transforms.operators import _NormalizeBox, _PadBox, _BboxXYXY2XYWH
 
															 from paddlers.transforms.batch_operators import BatchCompose, _BatchPad, _Gt2YoloTarget, BatchPadRGT, BatchNormalizeImage
														
 
															 from paddlers.models.ppdet.optimizer import ModelEMA
														
 
															 import paddlers.utils.logging as logging
														
 
															+from paddlers.utils import to_data_parallel
														
 
															 from paddlers.utils.checkpoint import det_pretrain_weights_dict
														
 
															 from .base import BaseModel
														
 
															 from .utils.det_metrics import VOCMetric, COCOMetric, RBoxMetric
														
@@ -629,71 +630,223 @@ class BaseDetector(BaseModel):
 
															                                       self._default_collate_fn)
														
 
															         self._check_transforms(eval_dataset.transforms)
														
 
															+        net = self.net
														
 
															+        net.eval()
														
 
															-        self.net.eval()
														
 
															+        # XXX: Hard-coding
														
 
															         nranks = paddle.distributed.get_world_size()
														
 
															-        local_rank = paddle.distributed.get_rank()
														
 
															         if nranks > 1:
														
 
															             # Initialize parallel environment if not done.
														
 
															             if not paddle.distributed.parallel.parallel_helper._is_parallel_ctx_initialized(
														
 
															             ):
														
 
															                 paddle.distributed.init_parallel_env()
														
 
															-
														
 
															-        if batch_size > 1:
														
 
															-            logging.warning(
														
 
															-                "Detector only supports single card evaluation with batch_size=1 "
														
 
															-                "during evaluation, so batch_size is forcibly set to 1.")
														
 
															-            batch_size = 1
														
 
															-
														
 
															-        if nranks < 2 or local_rank == 0:
														
 
															-            self.eval_data_loader = self.build_data_loader(
														
 
															-                eval_dataset,
														
 
															-                batch_size=batch_size,
														
 
															-                mode='eval',
														
 
															-                collate_fn=eval_dataset.collate_fn)
														
 
															-            is_bbox_normalized = False
														
 
															-            if hasattr(eval_dataset, 'batch_transforms'):
														
 
															-                is_bbox_normalized = any(
														
 
															-                    isinstance(t, _NormalizeBox)
														
 
															-                    for t in eval_dataset.batch_transforms.batch_transforms)
														
 
															-            if self.metric == 'voc':
														
 
															-                eval_metric = VOCMetric(
														
 
															-                    labels=eval_dataset.labels,
														
 
															-                    coco_gt=copy.deepcopy(eval_dataset.coco_gt),
														
 
															-                    is_bbox_normalized=is_bbox_normalized,
														
 
															-                    classwise=False)
														
 
															-            elif self.metric == 'coco':
														
 
															-                eval_metric = COCOMetric(
														
 
															-                    coco_gt=copy.deepcopy(eval_dataset.coco_gt),
														
 
															-                    classwise=False)
														
 
															+                net = to_data_parallel(
														
 
															+                    net, find_unused_parameters=self.find_unused_parameters)
														
 
															             else:
														
 
															-                assert hasattr(eval_dataset, 'get_anno_path')
														
 
															-                eval_metric = RBoxMetric(
														
 
															-                    anno_file=eval_dataset.get_anno_path(), classwise=False)
														
 
															-            scores = collections.OrderedDict()
														
 
															-            logging.info(
														
 
															-                "Start to evaluate (total_samples={}, total_steps={})...".
														
 
															-                format(eval_dataset.num_samples, eval_dataset.num_samples))
														
 
															-            with paddle.no_grad():
														
 
															-                for step, data in enumerate(self.eval_data_loader):
														
 
															-                    if self.precision == 'fp16':
														
 
															-                        with paddle.amp.auto_cast(
														
 
															-                                level=self.amp_level,
														
 
															-                                enable=True,
														
 
															-                                custom_white_list=self.custom_white_list,
														
 
															-                                custom_black_list=self.custom_black_list):
														
 
															-                            outputs = self.run(self.net, data, 'eval')
														
 
															-                    else:
														
 
															-                        outputs = self.run(self.net, data, 'eval')
														
 
															-                    eval_metric.update(data, outputs)
														
 
															-                eval_metric.accumulate()
														
 
															-                self.eval_details = eval_metric.details
														
 
															-                scores.update(eval_metric.get())
														
 
															-                eval_metric.reset()
														
 
															-
														
 
															-            if return_details:
														
 
															-                return scores, self.eval_details
														
 
															-            return scores
														
 
															+                net = to_data_parallel(
														
 
															+                    net, find_unused_parameters=self.find_unused_parameters)
														
 
															+
														
 
															+        self.eval_data_loader = self.build_data_loader(
														
 
															+            eval_dataset,
														
 
															+            batch_size=batch_size,
														
 
															+            mode='eval',
														
 
															+            collate_fn=eval_dataset.collate_fn)
														
 
															+        is_bbox_normalized = False
														
 
															+        if hasattr(eval_dataset, 'batch_transforms'):
														
 
															+            is_bbox_normalized = any(
														
 
															+                isinstance(t, _NormalizeBox)
														
 
															+                for t in eval_dataset.batch_transforms.batch_transforms)
														
 
															+        if self.metric == 'voc':
														
 
															+            eval_metric = VOCMetric(
														
 
															+                labels=eval_dataset.labels,
														
 
															+                coco_gt=copy.deepcopy(eval_dataset.coco_gt),
														
 
															+                is_bbox_normalized=is_bbox_normalized,
														
 
															+                classwise=False)
														
 
															+        elif self.metric == 'coco':
														
 
															+            eval_metric = COCOMetric(
														
 
															+                coco_gt=copy.deepcopy(eval_dataset.coco_gt), classwise=False)
														
 
															+        else:
														
 
															+            assert hasattr(eval_dataset, 'get_anno_path')
														
 
															+            eval_metric = RBoxMetric(
														
 
															+                anno_file=eval_dataset.get_anno_path(), classwise=False)
														
 
															+        scores = collections.OrderedDict()
														
 
															+        logging.info("Start to evaluate (total_samples={}, total_steps={})...".
														
 
															+                     format(eval_dataset.num_samples, eval_dataset.num_samples))
														
 
															+        with paddle.no_grad():
														
 
															+            for step, data in enumerate(self.eval_data_loader):
														
 
															+                if self.precision == 'fp16':
														
 
															+                    with paddle.amp.auto_cast(
														
 
															+                            level=self.amp_level,
														
 
															+                            enable=True,
														
 
															+                            custom_white_list=self.custom_white_list,
														
 
															+                            custom_black_list=self.custom_black_list):
														
 
															+                        outputs = self.run(net, data, 'eval')
														
 
															+                else:
														
 
															+                    outputs = self.run(net, data, 'eval')
														
 
															+
														
 
															+                sum_num = 0
														
 
															+                if nranks > 1:
														
 
															+                    for i in range(outputs['bbox_num'].shape[0]):
														
 
															+                        output_bbox_num = outputs['bbox_num'][i:i + 1].cuda()
														
 
															+
														
 
															+                        start_id = sum_num
														
 
															+                        sum_num += int(output_bbox_num)
														
 
															+                        end_id = sum_num
														
 
															+                        output_bbox = outputs['bbox'][start_id:end_id + 1].cuda(
														
 
															+                        )
														
 
															+
														
 
															+                        data_single_im_id = data['im_id'][i].unsqueeze(0)
														
 
															+                        data_single_image = data['image'][i].unsqueeze(0)
														
 
															+                        data_single_image_shape = data['image_shape'][
														
 
															+                            i].unsqueeze(0)
														
 
															+                        data_single_im_shape = data['im_shape'][i].unsqueeze(0)
														
 
															+                        data_single_scale_factor = data['scale_factor'][
														
 
															+                            i].unsqueeze(0)
														
 
															+                        data_single_permuted = data['permuted'][i]
														
 
															+                        data_single_gt_bbox = data['gt_bbox'][i]
														
 
															+                        data_single_gt_bbox_num = paddle.to_tensor(
														
 
															+                            data_single_gt_bbox.shape[0])
														
 
															+                        data_single_difficult = data['difficult'][i]
														
 
															+                        data_single_gt_class = data['gt_class'][i]
														
 
															+
														
 
															+                        output_bbox_num_list = []
														
 
															+                        paddle.distributed.all_gather(output_bbox_num_list,
														
 
															+                                                      output_bbox_num)
														
 
															+                        max_num = paddle.max(
														
 
															+                            paddle.concat(output_bbox_num_list))
														
 
															+                        if len(output_bbox) < max_num:
														
 
															+                            tp_box = output_bbox[0:1].clone()
														
 
															+                            pad_box = tp_box.tile(
														
 
															+                                (max_num - len(output_bbox), 1))
														
 
															+                            output_bbox_pad = paddle.concat(
														
 
															+                                [output_bbox, pad_box], axis=0)
														
 
															+                        else:
														
 
															+                            output_bbox_pad = output_bbox
														
 
															+                        output_bbox_list = []
														
 
															+                        paddle.distributed.all_gather(output_bbox_list,
														
 
															+                                                      output_bbox_pad)
														
 
															+                        data_single_im_id_list = []
														
 
															+                        paddle.distributed.all_gather(data_single_im_id_list,
														
 
															+                                                      data_single_im_id)
														
 
															+                        data_single_image_list = []
														
 
															+                        paddle.distributed.all_gather(data_single_image_list,
														
 
															+                                                      data_single_image)
														
 
															+                        data_single_image_shape_list = []
														
 
															+                        paddle.distributed.all_gather(
														
 
															+                            data_single_image_shape_list,
														
 
															+                            data_single_image_shape)
														
 
															+                        data_single_im_shape_list = []
														
 
															+                        paddle.distributed.all_gather(data_single_im_shape_list,
														
 
															+                                                      data_single_im_shape)
														
 
															+                        data_single_scale_factor_list = []
														
 
															+                        paddle.distributed.all_gather(
														
 
															+                            data_single_scale_factor_list,
														
 
															+                            data_single_scale_factor)
														
 
															+                        data_single_permuted_list = []
														
 
															+                        paddle.distributed.all_gather(data_single_permuted_list,
														
 
															+                                                      data_single_permuted)
														
 
															+                        data_single_gt_bbox_num_list = []
														
 
															+                        paddle.distributed.all_gather(
														
 
															+                            data_single_gt_bbox_num_list,
														
 
															+                            data_single_gt_bbox_num)
														
 
															+                        max_num = paddle.max(
														
 
															+                            paddle.concat(output_bbox_num_list))
														
 
															+                        if data_single_gt_bbox.shape[0] < max_num:
														
 
															+                            tp_box = data_single_gt_bbox[0:1].clone()
														
 
															+                            pad_box = tp_box.tile(
														
 
															+                                (max_num - data_single_gt_bbox.shape[0], 1))
														
 
															+                            data_single_gt_bbox_pad = paddle.concat(
														
 
															+                                [data_single_gt_bbox, pad_box], axis=0)
														
 
															+                            tp_diff = data_single_difficult[0:1].clone()
														
 
															+                            pad_diff = tp_diff.tile(
														
 
															+                                (max_num - data_single_gt_bbox.shape[0], 1))
														
 
															+                            data_single_difficult_pad = paddle.concat(
														
 
															+                                [data_single_difficult, pad_diff], axis=0)
														
 
															+                            tp_glass = data_single_gt_class[0:1].clone()
														
 
															+                            pad_glass = tp_glass.tile(
														
 
															+                                (max_num - data_single_gt_bbox.shape[0], 1))
														
 
															+                            data_single_gt_class_pad = paddle.concat(
														
 
															+                                [data_single_gt_class, pad_glass], axis=0)
														
 
															+                        else:
														
 
															+                            data_single_gt_bbox_pad = data_single_gt_bbox_pad
														
 
															+                        data_single_gt_bbox_list = []
														
 
															+                        paddle.distributed.all_gather(data_single_gt_bbox_list,
														
 
															+                                                      data_single_gt_bbox_pad)
														
 
															+                        data_single_difficult_list = []
														
 
															+                        paddle.distributed.all_gather(
														
 
															+                            data_single_difficult_list,
														
 
															+                            data_single_difficult_pad)
														
 
															+                        data_single_gt_class_list = []
														
 
															+                        paddle.distributed.all_gather(data_single_gt_class_list,
														
 
															+                                                      data_single_gt_class_pad)
														
 
															+
														
 
															+                        for rank_id in range(nranks):
														
 
															+                            output = {}
														
 
															+                            data_single = {}
														
 
															+                            output['bbox_num'] = output_bbox_num_list[rank_id]
														
 
															+                            output['bbox'] = output_bbox_list[
														
 
															+                                rank_id][:output_bbox_num_list[rank_id]]
														
 
															+
														
 
															+                            data_single['im_id'] = data_single_im_id_list[
														
 
															+                                rank_id]
														
 
															+                            data_single['image'] = data_single_image_list[
														
 
															+                                rank_id]
														
 
															+                            data_single[
														
 
															+                                'image_shape'] = data_single_image_shape_list[
														
 
															+                                    rank_id]
														
 
															+                            data_single['im_shape'] = data_single_im_shape_list[
														
 
															+                                rank_id]
														
 
															+                            data_single[
														
 
															+                                'scale_factor'] = data_single_scale_factor_list[
														
 
															+                                    rank_id]
														
 
															+                            data_single['permuted'] = data_single_permuted_list[
														
 
															+                                rank_id]
														
 
															+                            box_num = data_single_gt_bbox_num_list[rank_id]
														
 
															+                            data_single['gt_bbox'] = [
														
 
															+                                data_single_gt_bbox_list[rank_id][:box_num]
														
 
															+                            ]
														
 
															+                            data_single['difficult'] = [
														
 
															+                                data_single_difficult_list[rank_id][:box_num]
														
 
															+                            ]
														
 
															+                            data_single['gt_class'] = [
														
 
															+                                data_single_gt_class_list[rank_id][:box_num]
														
 
															+                            ]
														
 
															+
														
 
															+                            eval_metric.update(data_single, output)
														
 
															+                else:
														
 
															+                    for i in range(outputs['bbox_num'].shape[0]):
														
 
															+                        output = {}
														
 
															+                        output['bbox_num'] = outputs['bbox_num'][i:i + 1]
														
 
															+
														
 
															+                        start_id = sum_num
														
 
															+                        sum_num += int(output['bbox_num'])
														
 
															+                        end_id = sum_num
														
 
															+                        output['bbox'] = outputs['bbox'][start_id:end_id + 1]
														
 
															+
														
 
															+                        data_single = {}
														
 
															+                        data_single['im_id'] = data['im_id'][i].unsqueeze(0)
														
 
															+                        data_single['image'] = data['image'][i].unsqueeze(0)
														
 
															+                        data_single['image_shape'] = data['image_shape'][
														
 
															+                            i].unsqueeze(0)
														
 
															+                        data_single['im_shape'] = data['im_shape'][i].unsqueeze(
														
 
															+                            0)
														
 
															+                        data_single['scale_factor'] = data['scale_factor'][
														
 
															+                            i].unsqueeze(0)
														
 
															+                        data_single['permuted'] = data['permuted'][i]
														
 
															+                        data_single['gt_bbox'] = [data['gt_bbox'][i]]
														
 
															+                        data_single['difficult'] = [data['difficult'][i]]
														
 
															+                        data_single['gt_class'] = [data['gt_class'][i]]
														
 
															+
														
 
															+                        eval_metric.update(data_single, output)
														
 
															+
														
 
															+            eval_metric.accumulate()
														
 
															+            self.eval_details = eval_metric.details
														
 
															+            scores.update(eval_metric.get())
														
 
															+            eval_metric.reset()
														
 
															+
														
 
															+        if return_details:
														
 
															+            return scores, self.eval_details
														
 
															+        return scores
														
 
															     @paddle.no_grad()
														
 
															     def predict(self, img_file, transforms=None):
														
--- a/paddlers/tasks/restorer.py
+++ b/paddlers/tasks/restorer.py
@@ -30,6 +30,7 @@ from paddlers.models import res_losses
 
															 from paddlers.models.ppgan.modules.init import init_weights
														
 
															 from paddlers.transforms import Resize, decode_image, construct_sample
														
 
															 from paddlers.transforms.functions import calc_hr_shape
														
 
															+from paddlers.utils import to_data_parallel
														
 
															 from paddlers.utils.checkpoint import res_pretrain_weights_dict
														
 
															 from .base import BaseModel
														
 
															 from .utils.res_adapters import GANAdapter, OptimizerAdapter
														
@@ -414,58 +415,59 @@ class BaseRestorer(BaseModel):
 
															         """
														
 
															         self._check_transforms(eval_dataset.transforms)
														
 
															+        net = self.net
														
 
															+        net.eval()
														
 
															-        self.net.eval()
														
 
															+        # XXX: Hard-coding
														
 
															         nranks = paddle.distributed.get_world_size()
														
 
															-        local_rank = paddle.distributed.get_rank()
														
 
															         if nranks > 1:
														
 
															             # Initialize parallel environment if not done.
														
 
															             if not paddle.distributed.parallel.parallel_helper._is_parallel_ctx_initialized(
														
 
															             ):
														
 
															                 paddle.distributed.init_parallel_env()
														
 
															-
														
 
															-        # TODO: Distributed evaluation
														
 
															-        if batch_size > 1:
														
 
															-            logging.warning(
														
 
															-                "Restorer only supports single card evaluation with batch_size=1 "
														
 
															-                "during evaluation, so batch_size is forcibly set to 1.")
														
 
															-            batch_size = 1
														
 
															-
														
 
															-        if nranks < 2 or local_rank == 0:
														
 
															-            self.eval_data_loader = self.build_data_loader(
														
 
															-                eval_dataset, batch_size=batch_size, mode='eval')
														
 
															-            # XXX: Hard-code crop_border and test_y_channel
														
 
															-            psnr = metrics.PSNR(crop_border=4, test_y_channel=True)
														
 
															-            ssim = metrics.SSIM(crop_border=4, test_y_channel=True)
														
 
															-            logging.info(
														
 
															-                "Start to evaluate (total_samples={}, total_steps={})...".
														
 
															-                format(eval_dataset.num_samples, eval_dataset.num_samples))
														
 
															-            with paddle.no_grad():
														
 
															-                for step, data in enumerate(self.eval_data_loader):
														
 
															-                    if self.precision == 'fp16':
														
 
															-                        with paddle.amp.auto_cast(
														
 
															-                                level=self.amp_level,
														
 
															-                                enable=True,
														
 
															-                                custom_white_list=self.custom_white_list,
														
 
															-                                custom_black_list=self.custom_black_list):
														
 
															-                            outputs = self.run(self.net, data, 'eval')
														
 
															-                    else:
														
 
															-                        outputs = self.run(self.net, data, 'eval')
														
 
															+                net = to_data_parallel(
														
 
															+                    net, find_unused_parameters=self.find_unused_parameters)
														
 
															+            else:
														
 
															+                net = to_data_parallel(
														
 
															+                    net, find_unused_parameters=self.find_unused_parameters)
														
 
															+
														
 
															+        self.eval_data_loader = self.build_data_loader(
														
 
															+            eval_dataset, batch_size=batch_size, mode='eval')
														
 
															+        # XXX: Hard-code crop_border and test_y_channel
														
 
															+        psnr = metrics.PSNR(crop_border=4, test_y_channel=True)
														
 
															+        ssim = metrics.SSIM(crop_border=4, test_y_channel=True)
														
 
															+        logging.info("Start to evaluate (total_samples={}, total_steps={})...".
														
 
															+                     format(eval_dataset.num_samples, eval_dataset.num_samples))
														
 
															+        with paddle.no_grad():
														
 
															+            for step, data in enumerate(self.eval_data_loader):
														
 
															+                if self.precision == 'fp16':
														
 
															+                    with paddle.amp.auto_cast(
														
 
															+                            level=self.amp_level,
														
 
															+                            enable=True,
														
 
															+                            custom_white_list=self.custom_white_list,
														
 
															+                            custom_black_list=self.custom_black_list):
														
 
															+                        outputs = self.run(net, data, 'eval')
														
 
															+                else:
														
 
															+                    outputs = self.run(net, data, 'eval')
														
 
															+                if len(outputs['pred'].shape) > 3:
														
 
															+                    for i in range(batch_size):
														
 
															+                        psnr.update(outputs['pred'][i], outputs['tar'][i])
														
 
															+                        ssim.update(outputs['pred'][i], outputs['tar'][i])
														
 
															+                else:
														
 
															                     psnr.update(outputs['pred'], outputs['tar'])
														
 
															                     ssim.update(outputs['pred'], outputs['tar'])
														
 
															+        # DO NOT use psnr.accumulate() here, otherwise the program hangs in multi-card training.
														
 
															+        assert len(psnr.results) > 0
														
 
															+        assert len(ssim.results) > 0
														
 
															+        eval_metrics = OrderedDict(
														
 
															+            zip(['psnr', 'ssim'],
														
 
															+                [np.mean(psnr.results), np.mean(ssim.results)]))
														
 
															-            # DO NOT use psnr.accumulate() here, otherwise the program hangs in multi-card training.
														
 
															-            assert len(psnr.results) > 0
														
 
															-            assert len(ssim.results) > 0
														
 
															-            eval_metrics = OrderedDict(
														
 
															-                zip(['psnr', 'ssim'],
														
 
															-                    [np.mean(psnr.results), np.mean(ssim.results)]))
														
 
															-
														
 
															-            if return_details:
														
 
															-                # TODO: Add details
														
 
															-                return eval_metrics, None
														
 
															+        if return_details:
														
 
															+            # TODO: Add details
														
 
															+            return eval_metrics, None
														
 
															-            return eval_metrics
														
 
															+        return eval_metrics
														
 
															     @paddle.no_grad()
														
 
															     def predict(self, img_file, transforms=None):
														
@@ -553,6 +555,8 @@ class BaseRestorer(BaseModel):
 
															                 else:
														
 
															                     pass
														
 
															             results.append(pred)
														
 
															+        if len(results) > 1:
														
 
															+            results = [paddle.concat(results, axis=0)]
														
 
															         return results
														
 
															     def _infer_postprocess(self, batch_res_map, batch_restore_list):
														
--- a/paddlers/tasks/segmenter.py
+++ b/paddlers/tasks/segmenter.py
@@ -28,7 +28,7 @@ import paddlers.rs_models.seg as cmseg
 
															 import paddlers.utils.logging as logging
														
 
															 from paddlers.models import seg_losses
														
 
															 from paddlers.transforms import Resize, decode_image, construct_sample
														
 
															-from paddlers.utils import get_single_card_bs, DisablePrint
														
 
															+from paddlers.utils import DisablePrint, to_data_parallel
														
 
															 from paddlers.utils.checkpoint import seg_pretrain_weights_dict
														
 
															 from .base import BaseModel
														
 
															 from .utils import seg_metrics as metrics
														
@@ -429,23 +429,22 @@ class BaseSegmenter(BaseModel):
 
															         """
														
 
															         self._check_transforms(eval_dataset.transforms)
														
 
															-        self.net.eval()
														
 
															+        net = self.net
														
 
															+        net.eval()
														
 
															+
														
 
															+        # XXX: Hard-coding
														
 
															         nranks = paddle.distributed.get_world_size()
														
 
															-        local_rank = paddle.distributed.get_rank()
														
 
															         if nranks > 1:
														
 
															             # Initialize parallel environment if not done.
														
 
															             if not paddle.distributed.parallel.parallel_helper._is_parallel_ctx_initialized(
														
 
															             ):
														
 
															                 paddle.distributed.init_parallel_env()
														
 
															+                net = to_data_parallel(
														
 
															+                    net, find_unused_parameters=self.find_unused_parameters)
														
 
															+            else:
														
 
															+                net = to_data_parallel(
														
 
															+                    net, find_unused_parameters=self.find_unused_parameters)
														
 
															-        batch_size_each_card = get_single_card_bs(batch_size)
														
 
															-        if batch_size_each_card > 1:
														
 
															-            batch_size_each_card = 1
														
 
															-            batch_size = batch_size_each_card * paddlers.env_info['num']
														
 
															-            logging.warning(
														
 
															-                "Segmenter only supports batch_size=1 for each gpu/cpu card " \
														
 
															-                "during evaluation, so batch_size " \
														
 
															-                "is forcibly set to {}.".format(batch_size))
														
 
															         self.eval_data_loader = self.build_data_loader(
														
 
															             eval_dataset, batch_size=batch_size, mode='eval')
														
@@ -465,9 +464,9 @@ class BaseSegmenter(BaseModel):
 
															                             enable=True,
														
 
															                             custom_white_list=self.custom_white_list,
														
 
															                             custom_black_list=self.custom_black_list):
														
 
															-                        outputs = self.run(self.net, data, 'eval')
														
 
															+                        outputs = self.run(net, data, 'eval')
														
 
															                 else:
														
 
															-                    outputs = self.run(self.net, data, 'eval')
														
 
															+                    outputs = self.run(net, data, 'eval')
														
 
															                 pred_area = outputs['pred_area']
														
 
															                 label_area = outputs['label_area']
														
 
															                 intersect_area = outputs['intersect_area']
														
@@ -658,6 +657,8 @@ class BaseSegmenter(BaseModel):
 
															                 else:
														
 
															                     raise RuntimeError
														
 
															             results.append(pred)
														
 
															+        if len(results) > 1:
														
 
															+            results = [paddle.concat(results, axis=0)]
														
 
															         return results
														
 
															     def _infer_postprocess(self, batch_label_map, batch_score_map,
														
--- a/paddlers/tasks/utils/slider_predict.py
+++ b/paddlers/tasks/utils/slider_predict.py
@@ -512,10 +512,21 @@ def slider_predict(predict_func,
 
															                 batch_out = predict_func(batch_data, transforms=transforms)
														
 
															                 for out, (xoff_, yoff_) in zip(batch_out, batch_offsets):
														
 
															-                    # Get processed result
														
 
															-                    pred = overlap_processor.process_pred(out, xoff_, yoff_)
														
 
															-                    # Write to file
														
 
															-                    band.WriteArray(pred, xoff_, yoff_)
														
 
															+                    if len(out['label_map'].shape) == 3:
														
 
															+                        for i in range(out['label_map'].shape[0]):
														
 
															+                            out_single = {}
														
 
															+                            out_single['label_map'] = out['label_map'][i]
														
 
															+                            out_single['score_map'] = out['score_map'][i]
														
 
															+                            # Get processed result
														
 
															+                            pred = overlap_processor.process_pred(out_single,
														
 
															+                                                                  xoff_, yoff_)
														
 
															+                            # Write to file
														
 
															+                            band.WriteArray(pred, xoff_, yoff_)
														
 
															+                    else:
														
 
															+                        # Get processed result
														
 
															+                        pred = overlap_processor.process_pred(out, xoff_, yoff_)
														
 
															+                        # Write to file
														
 
															+                        band.WriteArray(pred, xoff_, yoff_)
														
 
															                 batch_data.clear()
														
 
															                 batch_offsets.clear()